2022年OpenAI虧了30多億元,, 站在風(fēng)口上,誰的壓力會小呢,? 【科技明說 | 每日看點(diǎn)】站在風(fēng)口上,。OpenAI公司在2022年虧得十分“燦爛”,和往年同比幾乎翻了一倍,,虧損約達(dá)5.4億美元,,折合人民幣約31億元。 就算是這樣翻倍地虧損,,OpenAI也沒有商湯科技SenseTime表現(xiàn)強(qiáng)烈,,商湯科技財報顯示2022年虧損約61億元左右。 比燒錢速度,,更要比創(chuàng)新速度 如果非得再對比一下年營收,,商湯科技可謂贏得太漂亮了,OpenAI的2022年營收才多少錢,?商湯科技2022年營收高達(dá)38億元,,令OpenAI的老板們羨慕嫉妒恨了么?OpenAI雖然估值接近300億美元,,約超2000億元人民幣,,但2022年營收卻少得可憐,約3600萬美元,,約合人民幣2.5億元,,2023年預(yù)估能到2億美元,,也就是約合人民幣不到14億元。 然而,,虧了30多億元的OpenAI,,引領(lǐng)著全球ChatGPT的AI大潮;虧了61億元的商湯科技,,帶來了大家意想不到的“商量 SenseChat,、秒畫 SenseMirage、如影 SenseAvatar,、瓊宇 SenseSpace,、格物 SenseThings,以及日日新SenseNova,。 其名字確實非常亮眼,,達(dá)到行業(yè)國際水平的同時,有一種趕超OpenAI,,將ChatGPT踩在腳下磨擦的氣勢,。但能否引領(lǐng)全球AI趨勢卻是一個大問題,不過,,有著這樣豐富的大模型產(chǎn)品方向,我想商湯科技至少在中國應(yīng)是AI行業(yè)領(lǐng)先水平了吧,? 業(yè)內(nèi)傳說商湯科技擁有有2.7萬張AI專用GPU,。目前7000張GPU對外服務(wù)8家大型客戶,實現(xiàn)算力Infrastructure as a Service,。其自然語言大模型Sense Chat已經(jīng)可以實現(xiàn)基本的語言交互,、寫故事、法律專業(yè)領(lǐng)域的文本分析,、代碼編程,、醫(yī)療問診。當(dāng)然商湯科技不能算是一個公有云廠商,,但已經(jīng)在著手提供類似云服務(wù)的算力與GPT輸出了,。 我不禁想問一下:同樣是做大模型AI領(lǐng)域的科技公司,為啥差距這么大呢,? 我只能這么說,,大型人工智能(AI)語言模型是一項昂貴的業(yè)務(wù),但貴有貴的道理,,花了高價錢可以看到真正的技術(shù)引領(lǐng),,真金白銀換創(chuàng)新也是值得的。 然而更悲催的是,,業(yè)界傳言說OpenAI雖然牛氣沖天,,實際上是靠挖了一些谷歌,、蘋果等科技公司AI領(lǐng)域的高手過來做ChatGPT。挖人成本高,,所以虧損大,。這個邏輯我感覺不對,靠挖人可以做到世界第一,,我覺得是非常成功的了,。就算虧得一塌糊涂也是可以看到未來的,畢竟微軟也不斷在給OpenAI輸血,,據(jù)說累計投資OpenAI已經(jīng)高達(dá)130億美元了,,這個投資節(jié)奏可能不會變化,還會繼續(xù)高投入,,搶未來,。 即便OpenAI燒錢速度快,但其GPT迭代速度也是驚人的,,在GPT-4出來后不久,,就已經(jīng)開啟了開源戰(zhàn)略??梢韵胂笠幌?,未來的AI世界除了OpenAI,還會有誰呢,?有誰還可以如OpenAI這樣吸金,,這樣燒錢,這樣高速創(chuàng)新GPT呢,? 你覺得還會有誰,,請空了告訴我一下。謝謝,。 字節(jié)跳動悄然在GPT上“練舞” 不過我們再看看另外一個科技公司:字節(jié)跳動ByteDance有啥GPT“動作”,。 業(yè)內(nèi)也盛傳字節(jié)跳動在大模型上也在低調(diào)潛行,并且在2022年底專門組建了一個針對GPT模型研究的團(tuán)隊,,主要研究人員也是來自字節(jié)跳動的搜索業(yè)務(wù)部門,、AI Lab和AML(應(yīng)用機(jī)器學(xué)習(xí))等團(tuán)隊成員。在多模態(tài)場景下,,字節(jié)跳動在視頻,、圖片、語音等數(shù)據(jù)比較豐富,,訓(xùn)練起來還是非常有基礎(chǔ),。基于技術(shù)研究的成熟度,,字節(jié)跳動對外透露的消息稱,,前期主要針對在語言和圖像兩種模態(tài)發(fā)力,,后期針對視頻方面的研究也將是一個重要的目標(biāo)。 只是,,字節(jié)跳動還有一條重要的發(fā)展路線就是火山引擎,。2023年4月18日,火山引擎正式推出自研DPU等系列云產(chǎn)品,,并推出新版機(jī)器學(xué)習(xí)平臺:支持萬卡級大模型訓(xùn)練,、微秒級延遲網(wǎng)絡(luò),彈性計算可節(jié)省70%算力成本,。有著更豐富與更強(qiáng)大性能的自研DPU的GPU實例,,對于后期在GPT領(lǐng)域的自研與探索將帶來很好的基礎(chǔ)支持,當(dāng)然火山引擎云也是字節(jié)跳動對外輸出AI能力的重要途徑之一,。 業(yè)內(nèi)朋友評論說到,,要做大模型,必須“背靠大數(shù)”(也是大樹)才可以,。比如OpenAI背后的微軟,,可以百億美元地投入眼睛都不眨一下。字節(jié)跳動不僅有海量數(shù)據(jù)的“大數(shù)”,,也有龐大的技術(shù)團(tuán)隊“大樹”,。 沒有對比就沒有鑒別。就此來看看,,字節(jié)跳動的發(fā)展非常迅速,,在2022年,字節(jié)跳動躋身“年營收5000億元俱樂部”,,開始看齊三巨頭,京東,、阿里巴巴和騰訊,。 5000億元年營收,意味著什么呢,? 縱觀2022年全年,,年營收5000億元俱樂部的中國科技公司主要有,京東,、阿里巴巴,、騰訊和字節(jié)跳動。 京東集團(tuán)2022年全年凈收入10462億元人民幣(約1517億美元),,同比增長9.9%,。歸屬于普通股股東的凈利潤為104億元,2021年為134億元,,同比下降22%,。 阿里巴巴2022年自然年營收為8645.39億元,,因為財年與自然年出入比較大,這里僅作營收的自然年統(tǒng)計,。對于凈利潤而言,,業(yè)內(nèi)有數(shù)字在說息稅折舊及攤銷前利潤 (EBITDA)約為227億美元,但這個數(shù)字未得到正確途徑證實,。 騰訊控股2022年營收5545.5億元(約796億美元),,同比下滑1%;歸屬于普通股股東全年凈利潤1882.4億元,,同比下滑16%,, 字節(jié)跳動2022年收入超800億美元,折合人民幣超5000億元,。這比2021年的約600億美元增長了30%以上,。由此字節(jié)跳動也正式入圍“年營收5000億元俱樂部”。同時業(yè)內(nèi)有傳言說,,2022年字節(jié)跳動息稅折舊及攤銷前利潤 (EBITDA)約為250億美元(1718億元),,同比增長79%。 如果這個數(shù)據(jù)是真實的話,,對比阿里巴巴,、京東、騰訊而言,,在凈利潤表現(xiàn)上字節(jié)跳動穩(wěn)贏了,。 據(jù)業(yè)內(nèi)分析,字節(jié)跳動的收入增長貢獻(xiàn)最大的來源于在中國大陸的核心廣告業(yè)務(wù),,2022這部分業(yè)務(wù)帶來的收入與2021年同比增長了2.5倍,,達(dá)到100億美元左右。 除此之外,,BAT中的百度2022年實現(xiàn)營收1236.75億元,,歸屬百度的凈利潤(非美國通用會計準(zhǔn)則)206.8億元,同比增長10%,。假如只是從年營收來看,,百度距離京東、阿里巴巴,、騰訊和字節(jié)跳動的距離還不小,。 當(dāng)然,5000元年營收,,意味著進(jìn)入這個階段的科技企業(yè)擁有更為全面的市場競爭力與影響力,,大者恒大的效應(yīng)也將放大。 假如這個分析正確的話,那么小者會不會恒小呢,?還是說小者求大,? 對于大模型的研究投入,前衛(wèi)的OpenAI虧得嚇人,,火力全開的商湯科技虧得也厲害,。相對而言,字節(jié)跳動植根自己的數(shù)據(jù)基礎(chǔ)與研發(fā)隊伍,,一步一步地嘗試,,身體力行,從大模型軟件與DPU,、GPU云產(chǎn)品雙管齊下,,積極進(jìn)取不冒進(jìn)的這個思路值得一看。 公有云廠商的ChatGPT之變 大模型如此這般火熱,,也引發(fā)了業(yè)界正在熱議的另外一個話題:ChatGPT發(fā)展大放異彩,,公有云格局會不會大變? 首先得明確,,AI風(fēng)暴來襲,,云與ChatGPT到底啥關(guān)系? 在看到公有云廠商紛紛開始大模型發(fā)布,,開始GPT的融入之時,,我是在想AI風(fēng)暴來襲,在擔(dān)心AI帶給人類危險的同時,,更想知道公有云與ChatGPT到底關(guān)系如何,? 業(yè)內(nèi)有朋友說,公有云可能會吃掉ChatGPT,,要不然就是ChatGPT會吃掉公有云,。 也有業(yè)內(nèi)朋友指出,這最終云廠商賣的還是算力,,核心還是GPU,。 這么說還是商湯最牛了,業(yè)內(nèi)朋友傳說商湯科技至少手里握了上萬張英偉達(dá)的卡,。有卡的不一定牛逼,可能是最大的韭菜,。會賣韭菜也是能力,,就看商湯科技的AI創(chuàng)新能力到底如何了。還有賣給誰很重要,,像我這樣的人,,肯定不喜歡吃韭菜。但不少人還是喜歡韭菜盒子,,韭菜雞蛋餃子,。羅卜白菜各有所愛,,就看誰喜歡了吧? 但在算力上疊加GPT和模型,,價值還是可以挖,,只是我感覺很難。云廠商做通用GPT,,搭上行業(yè)模型,,還是有機(jī)會。只是比較難做,,因為做行業(yè)模型就必須另外找團(tuán)隊,,需要投資更多錢,現(xiàn)在云廠商盈利都難,,這個事情很矛盾,。 如果這個事情可以做通,再擴(kuò)展一下,,專門提供有行業(yè)屬性GPT+行業(yè)模型的行業(yè)云打包賣,。 現(xiàn)在,在ChatGPT與公有云結(jié)合上,,公有云廠商怎么接招,?拆招? 看看亞馬遜云科技AWS是這樣做的,,宣布Amazon EC2 Trn1n 和 Amazon EC2 Inf2實例正式可用:最具成本效益的生成式AI云基礎(chǔ)設(shè)施,,與此同時AWS亞馬遜云科技順應(yīng)潮流也推出了自己的大模型,Amazon Titan基礎(chǔ)模型目前包括了兩個全新的大語言模型,。 騰訊云給出的實測結(jié)果顯示,,新一代集群算力性能較前代提升3倍。而在2022年10月,,騰訊完成首個萬億參數(shù)的AI大模型——混元NLP大模型訓(xùn)練,。在同等數(shù)據(jù)集下,將訓(xùn)練時間由50天縮短到11天,。如果基于新一代集群,,訓(xùn)練時間將進(jìn)一步縮短至4天。目前針對新一代HCC高性能計算集群,,用戶需要通過騰訊云的官方通道申請參與內(nèi)測,,什么時候公開GA值得關(guān)注一下。 百度算是國內(nèi)發(fā)布大模型很早的科技公司了,,文言一心并沒有為百度帶來意想不到的收獲,,相反,更多的是邁向ChatGPT領(lǐng)域的教訓(xùn)與經(jīng)驗。當(dāng)然,,至少對百度的中文搜索引擎帶來更貼身用戶的搜索結(jié)果,,不過,很遺憾的是不少像我這樣的百度用戶卻對搜索結(jié)果中包含眾多軟性廣告感到十分麻煩,。 雖然華為的大模型并沒有像百度的文言一心那樣高調(diào)發(fā)布,,但華為大模型發(fā)布比百度還要早,2021年就公開了,,從時間上來看華為領(lǐng)先了許多,。盤古大模型由NLP大模型、CV大模型,、多模態(tài)大模型,、科學(xué)計算大模型等多個大模型構(gòu)成,這樣看來華為做事情還是講究專業(yè),,專業(yè)的事情做起來對旁觀者而言就顯得復(fù)雜,。 另外,在ChatGPT與公有云結(jié)合路線上,,業(yè)界大牛還是微軟莫屬,,微軟投巨資支持的OpenAI公司在2023年4月推出了GPT-4,開始真正成就了一個大型多模態(tài)模型,,能接受圖像和文本輸入,,再輸出正確的文本回復(fù)。實驗表明,,GPT-4 在各種專業(yè)測試和學(xué)術(shù)基準(zhǔn)上的表現(xiàn)與人類水平相當(dāng),。例如,它通過了模擬律師考試,,且分?jǐn)?shù)在應(yīng)試者的前10%左右,;相比之下,GPT-3.5的得分在倒數(shù)10%左右,。 在過去的兩年里,,OpenAI重建了整個深度學(xué)習(xí)堆棧,并與微軟Azure一起為ChatGPT工作負(fù)載從頭開始設(shè)計了一臺超級計算機(jī),。這臺超級計算機(jī)基于微軟的Azure云基礎(chǔ)設(shè)施,,使用了上萬顆Nvidia H100和A100Tensor Core GPU,同時采用了Quantum-2 InfiniBand高速網(wǎng)絡(luò)架構(gòu),。不僅如此,,微軟還將ChatGPT的能力全面加持在了全球著名的辦公軟件、搜索引擎bing等產(chǎn)品領(lǐng)域,,微軟已經(jīng)走上了全面ChatGPT化,。 不過就此分析,在GPT不斷融入公有云的進(jìn)程上,,公有云廠商的業(yè)務(wù)本質(zhì)依然不變,,還是賣資源。也有人對我問道,,ChatGPT不斷融入云上,,云服務(wù)會越來越便宜么?我認(rèn)為不會,,而是越來越實惠,。對于用戶來說,云帶來的只是實惠,,而不是便宜,。因為只有重度的公有云長期用戶就深有體會,公有云到底是便宜還是昂貴,。 正因為如此,,業(yè)內(nèi)有朋友一直認(rèn)為,ChatGPT與公有云沒有關(guān)系,,一是一二是二,,如果1+2可以結(jié)合的話,依然還是等于1+2而不是新的數(shù)字3,。 由此分析來看,,公有云想方設(shè)法將ChatGPT融入云服務(wù)之中,最終目的還是希望帶動云資源的銷售增長,,更進(jìn)一步讓云的用戶成其為云的深度使用者,。從這個角度來分析,公有云因ChatGPT而變化并非真正實現(xiàn)迭代的進(jìn)化,,加持AI能力并不能代表公有云主流業(yè)務(wù)的本質(zhì)改變,。 進(jìn)一步分析來看,對于用戶而言,,將會更容易深度綁定在公有云之上,,一旦業(yè)務(wù)發(fā)展變化需要下云落地之時,用戶需要付出的代價將會更高,。當(dāng)然,,對于自身業(yè)務(wù)必須架構(gòu)在公有云之上的用戶而言,這樣“云+GPT”的變化不存在這個方面的下云落地問題,,反而更有利于其業(yè)務(wù)加速創(chuàng)新,。 此外,對于開發(fā)者,,利用AI平臺的便利性確實可以帶來很多幫助,,節(jié)省開發(fā)流程的時間,。亞馬遜云科技推了CodeWHisperer,這么好的AI編程工具,,全開源全免費(fèi),,可謂程序員的最佳日常伴侶,人見人愛花見花開……如果1000人采用無所謂改變啥,,試想1000萬人使用了,,將會怎樣? 科學(xué)客觀認(rèn)知GPT發(fā)展之勢 值得一提的是,,最近埃森哲(Accenture)的研究指出,,在現(xiàn)實世界和數(shù)字世界越來越密不可分的今天,生成式人工智能等技術(shù)的迅速演進(jìn)正在創(chuàng)造更為廣闊的全新商業(yè)未來,。隨著ChatGPT的快速興起,,生成式人工智能展現(xiàn)了其顯著增強(qiáng)人類能力的本領(lǐng),成為了全球焦點(diǎn),。 據(jù)埃森哲測算,,在各行業(yè),有四成的工作時間可由基于語言的人工智能技術(shù)提供支持或得到增值,。全球的受訪企業(yè)高管幾乎一致(98%)認(rèn)為,,未來三至五年內(nèi),人工智能基礎(chǔ)模型會對企業(yè)組織戰(zhàn)略產(chǎn)生極為關(guān)鍵的影響,。 同時,,埃森哲《技術(shù)展望2023》揭示了四大趨勢,幫助企業(yè)開啟數(shù)實融合的新發(fā)展歷程,,即:通用智能,、數(shù)字身份、數(shù)據(jù)透明和前沿探索,。其中針對通用智能,,無論是擔(dān)任個人助手、創(chuàng)意搭檔或者專業(yè)顧問,,生成式人工智能將不斷提升人類能力,。幾乎所有受訪高管都認(rèn)為,這類工具可以激發(fā)出巨大的創(chuàng)造力和創(chuàng)新力(比例達(dá)98%),,開啟企業(yè)級智能的新時代(95%),。 由這個研究可以看到,ChatGPT雖然不能徹底革新公有云的主流業(yè)務(wù),,但改善改進(jìn)增加云服務(wù)的本身的價值還是很值得發(fā)展,。 在Gartner的一份報告《2023 Gartner Emerging Technologies and Trends Impact Radar》新興技術(shù)及趨勢影響雷達(dá)中提到26項最具影響力的新興技術(shù)和趨勢可以看到,邊緣AI,、基礎(chǔ)模型Foundation Models,、Model Compression的發(fā)展將會更為迅猛,,特別是模型壓縮(model compression)可以將大模型壓縮成小模型,壓縮后的小模型也能得到和大模型接近的性能,,這對于ChatGPT進(jìn)入垂直行業(yè)領(lǐng)域帶來更大可能,。 然后,我還在哈工大自然語言處理研究所(HIT-NLP)出品的《ChatGPT調(diào)研報告》,,是現(xiàn)在為止我看到的對ChatGPT比較全面分析了。其中分析指出,,從自然語言處理技術(shù)發(fā)展階段的角度看,,可以發(fā)現(xiàn)一個有趣的現(xiàn)象,即每一個技術(shù)階段的發(fā)展時間,,大概是上一個階段的一半,。小規(guī)模專家知識發(fā)展了40年,淺層機(jī)器學(xué)習(xí)是20年,,之后深度學(xué)習(xí)大概10年,,預(yù)訓(xùn)練語言模型發(fā)展的時間是5年,那么以ChatGPT為代表的技術(shù)能持續(xù)多久呢?如果大膽預(yù)測,,可能是2到3年,,也就是到2025年大概又要更新?lián)Q代了。 經(jīng)過近70年的發(fā)展,,自然語言處理技術(shù)先后經(jīng)歷了五次范式的變遷,,隨著ChatGPT的產(chǎn)生,人們也看到了實現(xiàn)通用人工智能(AGI)的曙光,。在這個過程中,,自然語言處理技術(shù)呈現(xiàn)了明顯的“同質(zhì)化”和“規(guī)模化”的發(fā)展趨勢,,使用參數(shù)量越來越大的模型,,從越來越多的文本數(shù)據(jù)中進(jìn)行學(xué)習(xí)。同時分析指出,,自然語言處理未來需要融入更多的多模態(tài)信息,。此外,還需要智能體能夠同物理世界以及人類社會進(jìn)行交互,,這樣才能真正理解現(xiàn)世界中的各種概念,,從而實現(xiàn)真正的通用人工智能。 對于哈工大自然語言處理研究所(HIT-NLP)出品的《ChatGPT調(diào)研報告》有興趣的朋友,,可以私信留言加阿明好友,,阿明可以看情況私下分享業(yè)內(nèi)學(xué)習(xí)參考。 不過,,現(xiàn)在在AI與大模型領(lǐng)域逐漸呈現(xiàn)出百花齊放的態(tài)勢,。來自新浪數(shù)科COO于冬琪的幾段觀點(diǎn)在朋友圈傳播,,他個人最喜歡這么幾個項目:如改善盲人讀屏效率和為盲人用戶讀出圖片上信息。幫助農(nóng)民找到地里的冬蟲夏草,,提高挖掘效率,。AI診斷皮膚問題。AI幫律師們快速整理法條,、給出建議,。 幫助刑警們基于目擊者描述,繪制出嫌疑人畫像,。幫助醫(yī)生們,,把語音自動錄入成病例。 他沒想到的是,,現(xiàn)在有很多團(tuán)隊有自研的技術(shù)和論文,。甚至于有人做出來了可部署在個人電腦上、基于本地數(shù)據(jù)的丐版大模型,。 綜合來看,,AI風(fēng)暴來襲,公有云與ChatGPT關(guān)系越來越親密,,也越來越復(fù)雜,。到底該如何去發(fā)展,不管是微軟還是亞馬遜還是阿里云還是其他公有云廠商,,都在摸著石頭過河,,就看誰更會探索,更會迅速了吧,。 未雨綢繆,,如何看AI威脅論? 再進(jìn)一步看看針對AI的法律監(jiān)管領(lǐng)域,。不少國家開始出臺法律法規(guī)監(jiān)管AI,,隨著GPT發(fā)展越來越快,相關(guān)監(jiān)管規(guī)定也將加速出臺,。 當(dāng)然,,從通用大模型走向行業(yè)大模型,行業(yè)數(shù)據(jù)安全監(jiān)管也是需要重視,。 對此,,我們又不得不再討論一下AI的人類威脅論。 至少當(dāng)前要思考對AI能力邊界做一些框架限定,,并有利于社會進(jìn)步與人類社會的發(fā)展,。據(jù)外媒消息說,馬斯克(Elon Musk),、蘋果聯(lián)合創(chuàng)始人沃茲尼亞克(Steve Wozniak)等1000多名科技研究人員和高管呼吁“暫?!監(jiān)penAI的GPT等先進(jìn)人工智能系統(tǒng)的訓(xùn)練6個月,,用來開發(fā)和實施一套協(xié)議,使這些強(qiáng)大的人工智能系統(tǒng)更加準(zhǔn)確,、透明和值得信賴,。 可能,這又是一次人類的覺醒,,幸好馬斯克們在AI道路上沒有完全癡迷不悟,! 然后,也有非營利活動組織Future of Life Institute發(fā)表了一封公開信,,在發(fā)表后幾小時,,已有來自學(xué)術(shù)界和科技行業(yè)的1100多人簽名。所有簽名的人都十分擔(dān)心,,AI系統(tǒng)的智能可以與人類相媲美,可能對社會和人類構(gòu)成嚴(yán)重威脅,。 全球存儲觀察的阿明對此表示,,“百年后,我們的子孫后代看到現(xiàn)在我們,,他們會怎樣想現(xiàn)在的AI瘋狂,?” 另有業(yè)內(nèi)人士分析指出,國內(nèi)現(xiàn)在還不用太擔(dān)心這個方面的問題,,因為像國內(nèi)頂級“ChatGPT”啥時候和GPT-4一樣聰明了再說吧,。 - END- 你 怎 么 看 ? 歡迎文末評論補(bǔ)充,! 【全球存儲觀察 | 全球云觀察 | 阿明觀察 |科技明說】專注科技公司分析,,用數(shù)據(jù)說話,帶你看懂科技,。本文和作者回復(fù)僅代表個人觀點(diǎn),,不構(gòu)成任何投資建議。 |