// 在生成式AI,、云計(jì)算等技術(shù)逐漸抹平大企業(yè)與中小企業(yè)之間的技術(shù),、成本差距后,各企業(yè)真正比拼的,,只剩下人才,、創(chuàng)意與執(zhí)行力。 目前,,隨著AI技術(shù)的快速迭代,,各種基于AIGC(人工智能內(nèi)容生成)技術(shù)的產(chǎn)品不斷涌向社會,而其中最普遍的,,則莫過于大量的AI繪圖模型,如Midjourney,、Dreambooth,、Novel AI和Stable Diffusion等。 同為開發(fā)繪畫AI的團(tuán)隊(duì),Midjourney是怎么取得今天的成就的呢,? 1 延伸人類想象力 他為Midjourney設(shè)立了一個(gè)非常不“銅臭”的宗旨:AI 不是現(xiàn)實(shí)世界的復(fù)刻,而是人類想象力的延伸。 而這樣充滿科幻色彩的宗旨,,和大衛(wèi)的背景,、經(jīng)歷有著很大的關(guān)系。 MidJourney的創(chuàng)始人大衛(wèi)·霍爾茨 作為一個(gè)數(shù)學(xué)專業(yè)的博士生,,大衛(wèi)曾在大學(xué)期間研究激光雷達(dá),、大氣科學(xué)和火星任務(wù),可謂是一個(gè)涉獵甚廣,,且充滿好奇心的“怪才”,。 經(jīng)過了廣泛的探索后,大衛(wèi)似乎找到了自己真正的興趣所在,,于是,,在2010年便創(chuàng)立了一家研發(fā)手部跟蹤技術(shù)為主的公司——Leap Motion。 然而,,由于與之相關(guān)的VR/AR技術(shù)一直不成熟,,Leap Motion也始終沒能做出有具體應(yīng)用場景的產(chǎn)品。 大衛(wèi)之前研發(fā)的手部追蹤產(chǎn)品 最終,,2019年,,大衛(wèi)把 Leap Motion 公司賣給了競爭對手 Ultrahaptics。隨后,,他成立了一個(gè)工作室來探索新的機(jī)會,, 恰巧在這時(shí),AI在生成藝術(shù)方面取得了突破,。 Transformer架構(gòu)的出現(xiàn),,徹底改寫了圖像合成的歷史。從此,,多模態(tài)深度學(xué)習(xí)整合了NLP和計(jì)算機(jī)視覺的技術(shù),,成為圖像合成的藝術(shù)方法。 于是,,借著生成式AI的東風(fēng),,大衛(wèi)創(chuàng)建了Midjourney。 公司團(tuán)隊(duì)成員僅11人,,其中1位創(chuàng)始人、8位研發(fā)人員,、1位法務(wù),、1位財(cái)務(wù)。 在公司的構(gòu)成中,,完全沒有產(chǎn)品經(jīng)理,、市場銷售人員,除了創(chuàng)始人,、兩個(gè)支持性崗位(法務(wù),、財(cái)務(wù)),,80%的人員都是研發(fā)人員。 而作為中堅(jiān)力量的研發(fā)成員,,一半(4位)都是尚未畢業(yè)的本科生,。 雖然這四位本科生都有一些實(shí)操甚至是創(chuàng)業(yè)經(jīng)歷,但是確實(shí)經(jīng)驗(yàn)有限,,而且也非畢業(yè)頂尖名校,。 剩下來的幾位研發(fā)人員,都有著比較豐富的職業(yè)經(jīng)歷,。 在聚攏人才后,,大衛(wèi)也進(jìn)一步明確了自己對于Midjourney的理念。 大衛(wèi)將公司Logos 設(shè)計(jì)成了一艘在波浪中航行的帆船,,意為水既危險(xiǎn),,又是文明的驅(qū)動力。 懂得如何與水一起生活和工作的人類,,將有能力在水中游泳,、做船、筑壩發(fā)電,,從而更好的生活,,因此,大衛(wèi)認(rèn)為AI是人類想象力的引擎,。 然而,,在當(dāng)時(shí)生成式AI的競爭格局上,有這類“雄心壯志”的團(tuán)隊(duì),,可不只Midjourney一家,。 例如Stable Diffusion的母公司 Stability.AI,在創(chuàng)立時(shí)也聲稱要將自己的使命定格為成為世界領(lǐng)先的開源AI公司,,并發(fā)揚(yáng)將AI共享于全世界的理念,。 然而,口號喊得震天響,,理念終歸是不能當(dāng)飯吃的啊,。 情懷滿滿的大衛(wèi),之后是怎么解決一系列公司融資,、盈利的問題的呢,? 2 開源VS閉源 從今天來看,Midjourney的盈利模式看上去十分簡單,,即通過付費(fèi)訂閱的商業(yè)模式,,按月向用戶收取費(fèi)用,其標(biāo)準(zhǔn)有3種套餐,分別是10/30/60美元/月,。 不過,,這樣的模式要想行得通,得解決兩大關(guān)鍵問題: 先來說說第一點(diǎn),實(shí)際上,,當(dāng)AI圖像生成技術(shù)開始方興未艾之時(shí),,很多使用者并不覺得這種技術(shù)是需要“付費(fèi)”的。 原因就在于,,當(dāng)時(shí)像Stable Diffusion這樣的行業(yè)龍頭,,為了吸引大量的開發(fā)者,最大程度的把模型用起來,,因此采取了開源的模式,。 和Dall·E、Midjourney不同,,Stable Diffusion是完全免費(fèi),、不限次數(shù)、任何人都可用的,。 雖然對硬件有著一定要求,,但也能在幾秒鐘內(nèi)生成高清圖像。 這樣的好處在于,,開源社區(qū)會齊心協(xié)力地完善模型文檔,,共同解決技術(shù)難題。這使得代碼的迭代速度非???,優(yōu)化效率遠(yuǎn)遠(yuǎn)高于閉源系統(tǒng)。 但缺點(diǎn)也很顯而易見,,那就是商業(yè)化不夠直接,,可能為別人“做了嫁衣”。 而相較之下,,Midjourney卻采用了不那么開放的“閉源系統(tǒng)”,。 如果說閉源系統(tǒng)真的有什么好處,那就是針對性更強(qiáng)了,。 因?yàn)槟P烷]源,,并通過龐大的用戶量積累了獨(dú)有的數(shù)據(jù)集,可以根據(jù)用戶需求不斷地針對性訓(xùn)練模型,,長期來看更有利于建立競爭壁壘。 在探索用戶需求這點(diǎn)上,大衛(wèi)采取了產(chǎn)品上線后邊測試邊改進(jìn)的辦法,。 例如Midjourney模型最開始很慢,,需要20分鐘才能出一張高質(zhì)量的圖片。后來團(tuán)隊(duì)推出了一個(gè)做15秒生產(chǎn)圖片,,但是質(zhì)量沒那么高的版本,, 在針對用戶需求進(jìn)行調(diào)整后,,無論是創(chuàng)意行業(yè)設(shè)計(jì)者,還是普通愛好者,,都能通過Midjourney滿足自身的繪畫需求,。 除了了解用戶需求外,在使用流程方面,,Midjourney也并不像Stable Diffusion需要本地部署,,操作十分便捷,對顯卡和硬件性能也幾乎沒有要求,。 雖為閉源,,但Midjourney在使用難易度上,卻更像一個(gè)“親民”的大眾產(chǎn)品,。 3 算力難題 但如此龐大的云計(jì)算量,,必然需要高昂的成本,這就回到了剛才的第二個(gè)問題: 在沒有融資的情況下,,在云上進(jìn)行大模型訓(xùn)練所需要的高昂,,該成本怎么解決? 實(shí)際上,,大衛(wèi)解決這個(gè)問題的方式很簡單,,也很不可思議,。 當(dāng)大衛(wèi)需要找到一個(gè)云供應(yīng)商提供10,000個(gè)GPU時(shí),他直接給云供應(yīng)商的負(fù)責(zé)人發(fā)了封電子郵件,,結(jié)果對方就直接給到了這些資源,,完全不需要風(fēng)險(xiǎn)投資。 看到這兒,,也許有人驚得下巴都掉了,,這種事在現(xiàn)實(shí)中真的可能嗎? 當(dāng)然,,供應(yīng)商并不是抽風(fēng)了,,而是看中了大衛(wèi)之前的成就和聲譽(yù),。 大衛(wèi)之前的創(chuàng)業(yè)已經(jīng)獲得了聲譽(yù),,大衛(wèi)打從創(chuàng)辦Leap Motion的時(shí)候起就有一個(gè)觀點(diǎn),,他覺得技術(shù)的最大限制不是規(guī)模、成本或速度,,而是人們?nèi)绾闻c之互動,。 Leap Motion的手勢互動是一個(gè)嘗試,到了Midjourney這里,,他開始使用更短的繪畫關(guān)鍵詞(prompt)來催動AI產(chǎn)出,。 這樣的理念,吸引了每一個(gè)了解大衛(wèi)的人,,也讓他得到了云供應(yīng)商的支持,。 然而,在獲得了供應(yīng)商的鼎力支持后,,大衛(wèi)也仍然要面對算力捉襟見肘的問題,。 從成本來說,Midjourney大約10%的云成本用于訓(xùn)練,,90%是用戶制作圖像的推理,。所以幾乎所有的成本都在制作圖像上。 為解決這一點(diǎn),,Midjourney在世界上八個(gè)不同的地區(qū),,設(shè)立了自己的服務(wù)器,比如韓國,、日本或荷蘭等,,在每個(gè)時(shí)區(qū)的夜間,當(dāng)?shù)厝硕荚谒X,,沒有人使用GPU,。Midjourney就可以充分利用這些算力,實(shí)現(xiàn)GPU負(fù)載平衡,。 實(shí)際上,,這種依靠云端服務(wù)器來降低成本,、加快模型訓(xùn)練的做法,與目前騰訊訓(xùn)練大模型的策略十分相似,。 在算力已經(jīng)愈發(fā)成為大模型訓(xùn)練瓶頸的今天,,如果在訓(xùn)練開發(fā)環(huán)節(jié),直接調(diào)用云端的大模型和AI算力資源,,完成后一鍵分發(fā)到用戶終端上,就可以大大降低成本,,減少工作量,。 因此,Midjourney “云上計(jì)算”的這一步棋,,著實(shí)是摸準(zhǔn)了時(shí)代的方向,。 互聯(lián)網(wǎng)的演進(jìn)之路,已經(jīng)說明,,無論To B還是To C行業(yè),,都在追求越來越集約精簡的終端硬件、越來越低門檻的交互入口,、越來越輕盈的軟件應(yīng)用,。 4 總結(jié) 因?yàn)樵谏墒紸I、云計(jì)算等技術(shù)逐漸抹平大企業(yè)與中小企業(yè)之間的技術(shù),、成本差距后,,各企業(yè)真正比拼的,只剩下人才,、創(chuàng)意與執(zhí)行力,。 而這也是為什么, Midjourney這類僅有寥寥十幾人的小團(tuán)隊(duì)能脫穎而出的原因,。因?yàn)檫@樣依靠少數(shù)尖端人才組建的團(tuán)隊(duì),,具有大企業(yè)所沒有的靈活性、創(chuàng)見和魄力,。 而這類小團(tuán)隊(duì)的創(chuàng)意,、靈感,,若要真正在市場、社會中扎下根,,就離不開對用戶多樣化,、個(gè)性化需求的追蹤。 這是因?yàn)?,AIGC技術(shù)的“泛用性”,,決定了其絕不是針對某一行業(yè)、人群,,或是某一類企業(yè)的技術(shù),。 只有在這多樣化的需求中,盡可能地滿足不同層級用戶的特定需求,,一款產(chǎn)品才能真正地具有長遠(yuǎn)的生命,。 既服務(wù)所有人,又不忽視每一個(gè)特殊的人,,這或許就是Midjourney成功的最大原因,。 一封邀請信 您好!誠邀您加入我們的AI精英俱樂部,,這是一個(gè)永久免費(fèi)但門檻較高的,、聚集AI精英與愛好者的專業(yè)組織。我們致力于推動AI技術(shù)在投資領(lǐng)域的應(yīng)用,,為成員們提供一個(gè)共享和交流的平臺,,促進(jìn)互相學(xué)習(xí)和合作,共同探索AI技術(shù)在投資中的無限可能性,。 作為成員,,您將有機(jī)會與世界各地的AI專業(yè)人士互動,分享您的知識和經(jīng)驗(yàn),,以及從他們那里學(xué)習(xí)到更多的技術(shù)和行業(yè)見解,。 我們要求加入俱樂部的成員滿足以下標(biāo)準(zhǔn): 一、樂于分享:我們希望能積極分享自己的知識和經(jīng)驗(yàn),,與俱樂部的其他成員共同成長和進(jìn)步,; 二、有AI技術(shù)背景:我們歡迎在AI領(lǐng)域具有豐富經(jīng)驗(yàn)和專業(yè)知識的成員,,包括但不限于機(jī)器學(xué)習(xí),、深度學(xué)習(xí)、自然語言處理,、計(jì)算機(jī)視覺等領(lǐng)域的從業(yè)者和研究者,; 三、愿意將AI技術(shù)應(yīng)用到投資領(lǐng)域:包括但不限于量化交易,、資產(chǎn)管理,、風(fēng)險(xiǎn)評估,、市場預(yù)測等,共同探索AI技術(shù)在投資領(lǐng)域的應(yīng)用前景,; 四,、擁有獨(dú)特資源:包括但不限于資金、人脈,、數(shù)據(jù)資源等,,這將有助于俱樂部的技術(shù)和項(xiàng)目合作。 如果您滿足以上標(biāo)準(zhǔn),,并且對AI技術(shù)在投資領(lǐng)域有濃厚興趣,,我們誠邀您加入。 請將個(gè)人的有特點(diǎn)的介紹及微信號發(fā)送到[email protected],,審核通過后,我們會邀請您加入,。 |
|