【原】同樣是做大模型的科技公司，為啥差距這么大呢,？

阿明觀察 2023-05-12 發(fā)布于四川

展開全文

2022年OpenAI虧了30多億元,，

站在風(fēng)口上，誰的壓力會小呢,？

【科技明說｜每日看點(diǎn)】站在風(fēng)口上,。OpenAI公司在2022年虧得十分“燦爛”，和往年同比幾乎翻了一倍,，虧損約達(dá)5.4億美元,，折合人民幣約31億元。

就算是這樣翻倍地虧損,，OpenAI也沒有商湯科技SenseTime表現(xiàn)強(qiáng)烈,，商湯科技財報顯示2022年虧損約61億元左右。

比燒錢速度,，更要比創(chuàng)新速度

如果非得再對比一下年營收,，商湯科技可謂贏得太漂亮了，OpenAI的2022年營收才多少錢,？商湯科技2022年營收高達(dá)38億元,，令OpenAI的老板們羨慕嫉妒恨了么？OpenAI雖然估值接近300億美元,，約超2000億元人民幣,，但2022年營收卻少得可憐，約3600萬美元,，約合人民幣2.5億元,，2023年預(yù)估能到2億美元,，也就是約合人民幣不到14億元。

然而,，虧了30多億元的OpenAI,，引領(lǐng)著全球ChatGPT的AI大潮；虧了61億元的商湯科技,，帶來了大家意想不到的“商量 SenseChat,、秒畫 SenseMirage、如影 SenseAvatar,、瓊宇 SenseSpace,、格物 SenseThings，以及日日新SenseNova,。

其名字確實非常亮眼,，達(dá)到行業(yè)國際水平的同時，有一種趕超OpenAI,，將ChatGPT踩在腳下磨擦的氣勢,。但能否引領(lǐng)全球AI趨勢卻是一個大問題，不過,，有著這樣豐富的大模型產(chǎn)品方向，我想商湯科技至少在中國應(yīng)是AI行業(yè)領(lǐng)先水平了吧,？

業(yè)內(nèi)傳說商湯科技擁有有2.7萬張AI專用GPU,。目前7000張GPU對外服務(wù)8家大型客戶，實現(xiàn)算力Infrastructure as a Service,。其自然語言大模型Sense Chat已經(jīng)可以實現(xiàn)基本的語言交互,、寫故事、法律專業(yè)領(lǐng)域的文本分析,、代碼編程,、醫(yī)療問診。當(dāng)然商湯科技不能算是一個公有云廠商,，但已經(jīng)在著手提供類似云服務(wù)的算力與GPT輸出了,。

我不禁想問一下：同樣是做大模型AI領(lǐng)域的科技公司，為啥差距這么大呢,？

我只能這么說,，大型人工智能(AI)語言模型是一項昂貴的業(yè)務(wù)，但貴有貴的道理,，花了高價錢可以看到真正的技術(shù)引領(lǐng),，真金白銀換創(chuàng)新也是值得的。

然而更悲催的是,，業(yè)界傳言說OpenAI雖然牛氣沖天,，實際上是靠挖了一些谷歌,、蘋果等科技公司AI領(lǐng)域的高手過來做ChatGPT。挖人成本高,，所以虧損大,。這個邏輯我感覺不對，靠挖人可以做到世界第一,，我覺得是非常成功的了,。就算虧得一塌糊涂也是可以看到未來的，畢竟微軟也不斷在給OpenAI輸血,，據(jù)說累計投資OpenAI已經(jīng)高達(dá)130億美元了,，這個投資節(jié)奏可能不會變化，還會繼續(xù)高投入,，搶未來,。

即便OpenAI燒錢速度快，但其GPT迭代速度也是驚人的,，在GPT-4出來后不久,，就已經(jīng)開啟了開源戰(zhàn)略?？梢韵胂笠幌?，未來的AI世界除了OpenAI，還會有誰呢,？有誰還可以如OpenAI這樣吸金,，這樣燒錢，這樣高速創(chuàng)新GPT呢,？

你覺得還會有誰,，請空了告訴我一下。謝謝,。

字節(jié)跳動悄然在GPT上“練舞”

不過我們再看看另外一個科技公司：字節(jié)跳動ByteDance有啥GPT“動作”,。

業(yè)內(nèi)也盛傳字節(jié)跳動在大模型上也在低調(diào)潛行，并且在2022年底專門組建了一個針對GPT模型研究的團(tuán)隊,，主要研究人員也是來自字節(jié)跳動的搜索業(yè)務(wù)部門,、AI Lab和AML(應(yīng)用機(jī)器學(xué)習(xí))等團(tuán)隊成員。在多模態(tài)場景下,，字節(jié)跳動在視頻,、圖片、語音等數(shù)據(jù)比較豐富,，訓(xùn)練起來還是非常有基礎(chǔ),。基于技術(shù)研究的成熟度,，字節(jié)跳動對外透露的消息稱,，前期主要針對在語言和圖像兩種模態(tài)發(fā)力,，后期針對視頻方面的研究也將是一個重要的目標(biāo)。

只是,，字節(jié)跳動還有一條重要的發(fā)展路線就是火山引擎,。2023年4月18日，火山引擎正式推出自研DPU等系列云產(chǎn)品,，并推出新版機(jī)器學(xué)習(xí)平臺：支持萬卡級大模型訓(xùn)練,、微秒級延遲網(wǎng)絡(luò)，彈性計算可節(jié)省70%算力成本,。有著更豐富與更強(qiáng)大性能的自研DPU的GPU實例,，對于后期在GPT領(lǐng)域的自研與探索將帶來很好的基礎(chǔ)支持，當(dāng)然火山引擎云也是字節(jié)跳動對外輸出AI能力的重要途徑之一,。

業(yè)內(nèi)朋友評論說到,，要做大模型，必須“背靠大數(shù)”（也是大樹）才可以,。比如OpenAI背后的微軟,，可以百億美元地投入眼睛都不眨一下。字節(jié)跳動不僅有海量數(shù)據(jù)的“大數(shù)”,，也有龐大的技術(shù)團(tuán)隊“大樹”,。

沒有對比就沒有鑒別。就此來看看,，字節(jié)跳動的發(fā)展非常迅速,，在2022年，字節(jié)跳動躋身“年營收5000億元俱樂部”,，開始看齊三巨頭，京東,、阿里巴巴和騰訊,。

5000億元年營收，意味著什么呢,？

縱觀2022年全年,，年營收5000億元俱樂部的中國科技公司主要有，京東,、阿里巴巴,、騰訊和字節(jié)跳動。

京東集團(tuán)2022年全年凈收入10462億元人民幣(約1517億美元),，同比增長9.9%,。歸屬于普通股股東的凈利潤為104億元，2021年為134億元,，同比下降22%,。

阿里巴巴2022年自然年營收為8645.39億元,，因為財年與自然年出入比較大，這里僅作營收的自然年統(tǒng)計,。對于凈利潤而言,，業(yè)內(nèi)有數(shù)字在說息稅折舊及攤銷前利潤 (EBITDA)約為227億美元，但這個數(shù)字未得到正確途徑證實,。

騰訊控股2022年營收5545.5億元(約796億美元),，同比下滑1%；歸屬于普通股股東全年凈利潤1882.4億元,，同比下滑16%,，

字節(jié)跳動2022年收入超800億美元，折合人民幣超5000億元,。這比2021年的約600億美元增長了30%以上,。由此字節(jié)跳動也正式入圍“年營收5000億元俱樂部”。同時業(yè)內(nèi)有傳言說,，2022年字節(jié)跳動息稅折舊及攤銷前利潤 (EBITDA)約為250億美元(1718億元),，同比增長79%。如果這個數(shù)據(jù)是真實的話,，對比阿里巴巴,、京東、騰訊而言,，在凈利潤表現(xiàn)上字節(jié)跳動穩(wěn)贏了,。

據(jù)業(yè)內(nèi)分析，字節(jié)跳動的收入增長貢獻(xiàn)最大的來源于在中國大陸的核心廣告業(yè)務(wù),，2022這部分業(yè)務(wù)帶來的收入與2021年同比增長了2.5倍,，達(dá)到100億美元左右。

除此之外,，BAT中的百度2022年實現(xiàn)營收1236.75億元,，歸屬百度的凈利潤（非美國通用會計準(zhǔn)則）206.8億元，同比增長10%,。假如只是從年營收來看,，百度距離京東、阿里巴巴,、騰訊和字節(jié)跳動的距離還不小,。

當(dāng)然，5000元年營收,，意味著進(jìn)入這個階段的科技企業(yè)擁有更為全面的市場競爭力與影響力,，大者恒大的效應(yīng)也將放大。

假如這個分析正確的話，那么小者會不會恒小呢,？還是說小者求大,？

對于大模型的研究投入，前衛(wèi)的OpenAI虧得嚇人,，火力全開的商湯科技虧得也厲害,。相對而言，字節(jié)跳動植根自己的數(shù)據(jù)基礎(chǔ)與研發(fā)隊伍,，一步一步地嘗試,，身體力行，從大模型軟件與DPU,、GPU云產(chǎn)品雙管齊下,，積極進(jìn)取不冒進(jìn)的這個思路值得一看。

公有云廠商的ChatGPT之變

大模型如此這般火熱,，也引發(fā)了業(yè)界正在熱議的另外一個話題：ChatGPT發(fā)展大放異彩,，公有云格局會不會大變？

首先得明確,，AI風(fēng)暴來襲,，云與ChatGPT到底啥關(guān)系？

在看到公有云廠商紛紛開始大模型發(fā)布,，開始GPT的融入之時,，我是在想AI風(fēng)暴來襲，在擔(dān)心AI帶給人類危險的同時,，更想知道公有云與ChatGPT到底關(guān)系如何,？

業(yè)內(nèi)有朋友說，公有云可能會吃掉ChatGPT,，要不然就是ChatGPT會吃掉公有云,。

也有業(yè)內(nèi)朋友指出，這最終云廠商賣的還是算力,，核心還是GPU,。

這么說還是商湯最牛了，業(yè)內(nèi)朋友傳說商湯科技至少手里握了上萬張英偉達(dá)的卡,。有卡的不一定牛逼，可能是最大的韭菜,。會賣韭菜也是能力,，就看商湯科技的AI創(chuàng)新能力到底如何了。還有賣給誰很重要,，像我這樣的人,，肯定不喜歡吃韭菜。但不少人還是喜歡韭菜盒子,，韭菜雞蛋餃子,。羅卜白菜各有所愛,，就看誰喜歡了吧？

但在算力上疊加GPT和模型,，價值還是可以挖,，只是我感覺很難。云廠商做通用GPT,，搭上行業(yè)模型,，還是有機(jī)會。只是比較難做,，因為做行業(yè)模型就必須另外找團(tuán)隊,，需要投資更多錢，現(xiàn)在云廠商盈利都難,，這個事情很矛盾,。

如果這個事情可以做通，再擴(kuò)展一下,，專門提供有行業(yè)屬性GPT+行業(yè)模型的行業(yè)云打包賣,。

現(xiàn)在，在ChatGPT與公有云結(jié)合上,，公有云廠商怎么接招,？拆招？

看看亞馬遜云科技AWS是這樣做的,，宣布Amazon EC2 Trn1n 和 Amazon EC2 Inf2實例正式可用：最具成本效益的生成式AI云基礎(chǔ)設(shè)施,，與此同時AWS亞馬遜云科技順應(yīng)潮流也推出了自己的大模型，Amazon Titan基礎(chǔ)模型目前包括了兩個全新的大語言模型,。

騰訊云給出的實測結(jié)果顯示,，新一代集群算力性能較前代提升3倍。而在2022年10月,，騰訊完成首個萬億參數(shù)的AI大模型——混元NLP大模型訓(xùn)練,。在同等數(shù)據(jù)集下，將訓(xùn)練時間由50天縮短到11天,。如果基于新一代集群,，訓(xùn)練時間將進(jìn)一步縮短至4天。目前針對新一代HCC高性能計算集群,，用戶需要通過騰訊云的官方通道申請參與內(nèi)測,，什么時候公開GA值得關(guān)注一下。

百度算是國內(nèi)發(fā)布大模型很早的科技公司了,，文言一心并沒有為百度帶來意想不到的收獲,，相反，更多的是邁向ChatGPT領(lǐng)域的教訓(xùn)與經(jīng)驗。當(dāng)然,，至少對百度的中文搜索引擎帶來更貼身用戶的搜索結(jié)果,，不過，很遺憾的是不少像我這樣的百度用戶卻對搜索結(jié)果中包含眾多軟性廣告感到十分麻煩,。

雖然華為的大模型并沒有像百度的文言一心那樣高調(diào)發(fā)布,，但華為大模型發(fā)布比百度還要早，2021年就公開了,，從時間上來看華為領(lǐng)先了許多,。盤古大模型由NLP大模型、CV大模型,、多模態(tài)大模型,、科學(xué)計算大模型等多個大模型構(gòu)成，這樣看來華為做事情還是講究專業(yè),，專業(yè)的事情做起來對旁觀者而言就顯得復(fù)雜,。

另外，在ChatGPT與公有云結(jié)合路線上,，業(yè)界大牛還是微軟莫屬,，微軟投巨資支持的OpenAI公司在2023年4月推出了GPT-4，開始真正成就了一個大型多模態(tài)模型,，能接受圖像和文本輸入,，再輸出正確的文本回復(fù)。實驗表明,，GPT-4 在各種專業(yè)測試和學(xué)術(shù)基準(zhǔn)上的表現(xiàn)與人類水平相當(dāng),。例如，它通過了模擬律師考試,，且分?jǐn)?shù)在應(yīng)試者的前10%左右,；相比之下，GPT-3.5的得分在倒數(shù)10%左右,。

在過去的兩年里,，OpenAI重建了整個深度學(xué)習(xí)堆棧，并與微軟Azure一起為ChatGPT工作負(fù)載從頭開始設(shè)計了一臺超級計算機(jī),。這臺超級計算機(jī)基于微軟的Azure云基礎(chǔ)設(shè)施,，使用了上萬顆Nvidia H100和A100Tensor Core GPU，同時采用了Quantum-2 InfiniBand高速網(wǎng)絡(luò)架構(gòu),。不僅如此,，微軟還將ChatGPT的能力全面加持在了全球著名的辦公軟件、搜索引擎bing等產(chǎn)品領(lǐng)域,，微軟已經(jīng)走上了全面ChatGPT化,。

不過就此分析，在GPT不斷融入公有云的進(jìn)程上,，公有云廠商的業(yè)務(wù)本質(zhì)依然不變,，還是賣資源。也有人對我問道,，ChatGPT不斷融入云上,，云服務(wù)會越來越便宜么？我認(rèn)為不會,，而是越來越實惠,。對于用戶來說，云帶來的只是實惠,，而不是便宜,。因為只有重度的公有云長期用戶就深有體會，公有云到底是便宜還是昂貴,。

正因為如此,，業(yè)內(nèi)有朋友一直認(rèn)為，ChatGPT與公有云沒有關(guān)系,，一是一二是二,，如果1+2可以結(jié)合的話，依然還是等于1+2而不是新的數(shù)字3,。

由此分析來看,，公有云想方設(shè)法將ChatGPT融入云服務(wù)之中，最終目的還是希望帶動云資源的銷售增長,，更進(jìn)一步讓云的用戶成其為云的深度使用者,。從這個角度來分析，公有云因ChatGPT而變化并非真正實現(xiàn)迭代的進(jìn)化,，加持AI能力并不能代表公有云主流業(yè)務(wù)的本質(zhì)改變,。

進(jìn)一步分析來看，對于用戶而言,，將會更容易深度綁定在公有云之上,，一旦業(yè)務(wù)發(fā)展變化需要下云落地之時，用戶需要付出的代價將會更高,。當(dāng)然,，對于自身業(yè)務(wù)必須架構(gòu)在公有云之上的用戶而言，這樣“云+GPT”的變化不存在這個方面的下云落地問題,，反而更有利于其業(yè)務(wù)加速創(chuàng)新,。

此外，對于開發(fā)者,，利用AI平臺的便利性確實可以帶來很多幫助,，節(jié)省開發(fā)流程的時間,。亞馬遜云科技推了CodeWHisperer，這么好的AI編程工具,，全開源全免費(fèi),，可謂程序員的最佳日常伴侶，人見人愛花見花開……如果1000人采用無所謂改變啥,，試想1000萬人使用了,，將會怎樣？

科學(xué)客觀認(rèn)知GPT發(fā)展之勢

值得一提的是,，最近埃森哲(Accenture)的研究指出,，在現(xiàn)實世界和數(shù)字世界越來越密不可分的今天，生成式人工智能等技術(shù)的迅速演進(jìn)正在創(chuàng)造更為廣闊的全新商業(yè)未來,。隨著ChatGPT的快速興起,，生成式人工智能展現(xiàn)了其顯著增強(qiáng)人類能力的本領(lǐng)，成為了全球焦點(diǎn),。

據(jù)埃森哲測算,，在各行業(yè)，有四成的工作時間可由基于語言的人工智能技術(shù)提供支持或得到增值,。全球的受訪企業(yè)高管幾乎一致(98%)認(rèn)為,，未來三至五年內(nèi)，人工智能基礎(chǔ)模型會對企業(yè)組織戰(zhàn)略產(chǎn)生極為關(guān)鍵的影響,。

同時,，埃森哲《技術(shù)展望2023》揭示了四大趨勢，幫助企業(yè)開啟數(shù)實融合的新發(fā)展歷程,，即：通用智能,、數(shù)字身份、數(shù)據(jù)透明和前沿探索,。其中針對通用智能,，無論是擔(dān)任個人助手、創(chuàng)意搭檔或者專業(yè)顧問,，生成式人工智能將不斷提升人類能力,。幾乎所有受訪高管都認(rèn)為，這類工具可以激發(fā)出巨大的創(chuàng)造力和創(chuàng)新力（比例達(dá)98%）,，開啟企業(yè)級智能的新時代（95%）,。

由這個研究可以看到，ChatGPT雖然不能徹底革新公有云的主流業(yè)務(wù),，但改善改進(jìn)增加云服務(wù)的本身的價值還是很值得發(fā)展,。

在Gartner的一份報告《2023 Gartner Emerging Technologies and Trends Impact Radar》新興技術(shù)及趨勢影響雷達(dá)中提到26項最具影響力的新興技術(shù)和趨勢可以看到，邊緣AI,、基礎(chǔ)模型Foundation Models,、Model Compression的發(fā)展將會更為迅猛,，特別是模型壓縮(model compression)可以將大模型壓縮成小模型，壓縮后的小模型也能得到和大模型接近的性能,，這對于ChatGPT進(jìn)入垂直行業(yè)領(lǐng)域帶來更大可能,。

然后，我還在哈工大自然語言處理研究所（HIT-NLP）出品的《ChatGPT調(diào)研報告》,，是現(xiàn)在為止我看到的對ChatGPT比較全面分析了。其中分析指出,，從自然語言處理技術(shù)發(fā)展階段的角度看,，可以發(fā)現(xiàn)一個有趣的現(xiàn)象，即每一個技術(shù)階段的發(fā)展時間,，大概是上一個階段的一半,。小規(guī)模專家知識發(fā)展了40年，淺層機(jī)器學(xué)習(xí)是20年,，之后深度學(xué)習(xí)大概10年,，預(yù)訓(xùn)練語言模型發(fā)展的時間是5年，那么以ChatGPT為代表的技術(shù)能持續(xù)多久呢?如果大膽預(yù)測,，可能是2到3年,，也就是到2025年大概又要更新?lián)Q代了。

經(jīng)過近70年的發(fā)展,，自然語言處理技術(shù)先后經(jīng)歷了五次范式的變遷,，隨著ChatGPT的產(chǎn)生，人們也看到了實現(xiàn)通用人工智能(AGI)的曙光,。在這個過程中,，自然語言處理技術(shù)呈現(xiàn)了明顯的“同質(zhì)化”和“規(guī)模化”的發(fā)展趨勢,，使用參數(shù)量越來越大的模型,，從越來越多的文本數(shù)據(jù)中進(jìn)行學(xué)習(xí)。同時分析指出,，自然語言處理未來需要融入更多的多模態(tài)信息,。此外，還需要智能體能夠同物理世界以及人類社會進(jìn)行交互,，這樣才能真正理解現(xiàn)世界中的各種概念,，從而實現(xiàn)真正的通用人工智能。

對于哈工大自然語言處理研究所（HIT-NLP）出品的《ChatGPT調(diào)研報告》有興趣的朋友,，可以私信留言加阿明好友,，阿明可以看情況私下分享業(yè)內(nèi)學(xué)習(xí)參考。

不過,，現(xiàn)在在AI與大模型領(lǐng)域逐漸呈現(xiàn)出百花齊放的態(tài)勢,。來自新浪數(shù)科COO于冬琪的幾段觀點(diǎn)在朋友圈傳播,，他個人最喜歡這么幾個項目：如改善盲人讀屏效率和為盲人用戶讀出圖片上信息。幫助農(nóng)民找到地里的冬蟲夏草,，提高挖掘效率,。AI診斷皮膚問題。AI幫律師們快速整理法條,、給出建議,。幫助刑警們基于目擊者描述，繪制出嫌疑人畫像,。幫助醫(yī)生們,，把語音自動錄入成病例。

他沒想到的是,，現(xiàn)在有很多團(tuán)隊有自研的技術(shù)和論文,。甚至于有人做出來了可部署在個人電腦上、基于本地數(shù)據(jù)的丐版大模型,。

綜合來看,，AI風(fēng)暴來襲，公有云與ChatGPT關(guān)系越來越親密,，也越來越復(fù)雜,。到底該如何去發(fā)展，不管是微軟還是亞馬遜還是阿里云還是其他公有云廠商,，都在摸著石頭過河,，就看誰更會探索，更會迅速了吧,。

未雨綢繆,，如何看AI威脅論？

再進(jìn)一步看看針對AI的法律監(jiān)管領(lǐng)域,。不少國家開始出臺法律法規(guī)監(jiān)管AI,，隨著GPT發(fā)展越來越快，相關(guān)監(jiān)管規(guī)定也將加速出臺,。

當(dāng)然,，從通用大模型走向行業(yè)大模型，行業(yè)數(shù)據(jù)安全監(jiān)管也是需要重視,。

對此,，我們又不得不再討論一下AI的人類威脅論。

至少當(dāng)前要思考對AI能力邊界做一些框架限定,，并有利于社會進(jìn)步與人類社會的發(fā)展,。據(jù)外媒消息說，馬斯克(Elon Musk),、蘋果聯(lián)合創(chuàng)始人沃茲尼亞克(Steve Wozniak)等1000多名科技研究人員和高管呼吁“暫?！監(jiān)penAI的GPT等先進(jìn)人工智能系統(tǒng)的訓(xùn)練6個月,，用來開發(fā)和實施一套協(xié)議，使這些強(qiáng)大的人工智能系統(tǒng)更加準(zhǔn)確,、透明和值得信賴,。

可能，這又是一次人類的覺醒,，幸好馬斯克們在AI道路上沒有完全癡迷不悟,！然后，也有非營利活動組織Future of Life Institute發(fā)表了一封公開信,，在發(fā)表后幾小時,，已有來自學(xué)術(shù)界和科技行業(yè)的1100多人簽名。所有簽名的人都十分擔(dān)心,，AI系統(tǒng)的智能可以與人類相媲美，可能對社會和人類構(gòu)成嚴(yán)重威脅,。

全球存儲觀察的阿明對此表示,，“百年后，我們的子孫后代看到現(xiàn)在我們,，他們會怎樣想現(xiàn)在的AI瘋狂,？”

另有業(yè)內(nèi)人士分析指出，國內(nèi)現(xiàn)在還不用太擔(dān)心這個方面的問題,，因為像國內(nèi)頂級“ChatGPT”啥時候和GPT-4一樣聰明了再說吧,。

- END-

你

怎

么

看

？

歡迎文末評論補(bǔ)充,！

【全球存儲觀察｜全球云觀察｜阿明觀察｜科技明說】專注科技公司分析,，用數(shù)據(jù)說話，帶你看懂科技,。本文和作者回復(fù)僅代表個人觀點(diǎn),，不構(gòu)成任何投資建議。