訓(xùn)練成本估計(jì)只有 Llama 3.1 405B 模型的 11 分之一,,后者的效果還不如它。 在多項(xiàng)測(cè)評(píng)上,,DeepSeek V3 達(dá)到了開(kāi)源 SOTA,,超越 Llama 3.1 405B,能和 GPT-4o,、Claude 3.5 Sonnet 等 TOP 模型正面掰掰手腕——而其價(jià)格比 Claude 3.5 Haiku 還便宜,,僅為 Claude 3.5 Sonnet 的 9%。 在 Chatbot Arena 大模型排行榜上排名第 7,,前十名里面,,只有它是開(kāi)源模型,而且是最少限制的 MIT 許可證,。 2024 年 5 月,DeepSeek 一躍成名,。起因是他們發(fā)布的一款名為 DeepSeek V2 的開(kāi)源模型,,提供了一種史無(wú)前例的性價(jià)比,開(kāi)啟了國(guó)產(chǎn)大模型的價(jià)格戰(zhàn),。 作為大廠外唯一一家儲(chǔ)備萬(wàn)張 A100 芯片的公司,,DeepSeek 的很多抉擇都與眾不同。放棄「既要又要」路線,,至今專注在研究和技術(shù),,未做 toC 應(yīng)用的公司,也是唯一一家未全面考慮商業(yè)化,,堅(jiān)定選擇開(kāi)源路線甚至都沒(méi)融過(guò)資的公司,。 DeepSeek 究竟是如何煉成的?36 氪旗下的「暗涌」團(tuán)隊(duì)分別在 2023 年 5 月,、2024 年 7 月采訪了甚少露面的 DeepSeek 創(chuàng)始人梁文鋒,。 這位技術(shù)理想主義者,提供了目前中國(guó)科技界特別稀缺的一種聲音:他是少有的把「是非觀」置于「利害觀」之前,,并提醒我們看到時(shí)代慣性,,把「原創(chuàng)式創(chuàng)新」提上日程的人。 文章轉(zhuǎn)載自「暗涌」,原文作者于麗麗,,原文編輯劉旌,,F(xiàn)ounder Park 轉(zhuǎn)載時(shí)做了結(jié)構(gòu)調(diào)整。 01價(jià)格戰(zhàn)第一槍是怎么打響的,?暗涌:DeepSeek V2 模型發(fā)布后,,迅速引發(fā)一場(chǎng)血雨腥風(fēng)的大模型價(jià)格戰(zhàn),有人說(shuō)你們是行業(yè)的一條鯰魚(yú),。 梁文鋒:我們不是有意成為一條鯰魚(yú),,只是不小心成了一條鯰魚(yú)。 暗涌:這個(gè)結(jié)果讓你們意外嗎,? 梁文鋒:非常意外,。沒(méi)想到價(jià)格讓大家這么敏感。我們只是按照自己的步調(diào)來(lái)做事,,然后核算成本定價(jià),。我們的原則是不貼錢(qián),也不賺取暴利,。這個(gè)價(jià)格也是在成本之上稍微有點(diǎn)利潤(rùn),。 暗涌:5 天后智譜 AI 就跟進(jìn)了,之后是字節(jié),、阿里,、百度、騰訊等大廠,。 梁文鋒:智譜 AI 降的是一個(gè)入門(mén)級(jí)產(chǎn)品,,和我們同級(jí)別的模型仍然收費(fèi)很貴。字節(jié)是真正第一個(gè)跟進(jìn)的,。旗艦?zāi)P徒档胶臀覀円粯拥膬r(jià)格,,然后觸發(fā)了其它大廠紛紛降價(jià)。因?yàn)榇髲S的模型成本比我們高很多,,所以我們沒(méi)想到會(huì)有人虧錢(qián)做這件事,,最后就變成了互聯(lián)網(wǎng)時(shí)代的燒錢(qián)補(bǔ)貼的邏輯。 暗涌:外部看來(lái),,降價(jià)很像在搶用戶,,互聯(lián)網(wǎng)時(shí)代的價(jià)格戰(zhàn)通常如此。 梁文鋒:搶用戶并不是我們的主要目的,。我們降價(jià)一方面是因?yàn)槲覀冊(cè)谔剿飨乱淮P偷慕Y(jié)構(gòu)中,,成本先降下來(lái)了,另一方面也覺(jué)得無(wú)論 API,,還是 AI,,都應(yīng)該是普惠的,、人人可以用得起的東西。 暗涌:在這之前,,大部分中國(guó)公司都會(huì)直接 copy 這一代的 Llama 結(jié)構(gòu)去做應(yīng)用,,為什么你們會(huì)從模型結(jié)構(gòu)切入? 梁文鋒:如果目標(biāo)是做應(yīng)用,,那沿用 Llama 結(jié)構(gòu),,短平快上產(chǎn)品也是合理選擇。但我們目的地是 AGI,,這意味著我們需要研究新的模型結(jié)構(gòu),,在有限資源下,實(shí)現(xiàn)更強(qiáng)的模型能力,。這是 scale up 到更大模型所需要做的基礎(chǔ)研究之一,。 除了模型結(jié)構(gòu),我們還做了大量其他的研究,,包括怎么構(gòu)造數(shù)據(jù),,如何讓模型更像人類等,這都體現(xiàn)在我們發(fā)布的模型里,。另外,,Llama 的結(jié)構(gòu),在訓(xùn)練效率和推理成本上,,和國(guó)外先進(jìn)水平估計(jì)也已有兩代差距,。 暗涌:這種代差主要來(lái)自哪里? 梁文鋒:首先訓(xùn)練效率有差距,。我們估計(jì),,國(guó)內(nèi)最好的水平和國(guó)外最好的相比,模型結(jié)構(gòu)和訓(xùn)練動(dòng)力學(xué)上可能有一倍的差距,,光這一點(diǎn)我們要消耗兩倍的算力才能達(dá)到同樣效果。另外數(shù)據(jù)效率上可能也有一倍差距,,也就是我們要消耗兩倍的訓(xùn)練數(shù)據(jù)和算力,,才能達(dá)到同樣的效果。合起來(lái)就要多消耗 4 倍算力,。我們要做的,,正是不停地去縮小這些差距。 暗涌:大部分中國(guó)公司都選擇既要模型又要應(yīng)用,,為什么 DeepSeek 目前選擇只做研究探索,? 梁文鋒:因?yàn)槲覀冇X(jué)得現(xiàn)在最重要的是參與到全球創(chuàng)新的浪潮里去。過(guò)去很多年,,中國(guó)公司習(xí)慣了別人做技術(shù)創(chuàng)新,,我們拿過(guò)來(lái)做應(yīng)用變現(xiàn),但這并非是一種理所當(dāng)然。這一波浪潮里,,我們的出發(fā)點(diǎn),,就不是趁機(jī)賺一筆,而是走到技術(shù)的前沿,,去推動(dòng)整個(gè)生態(tài)發(fā)展,。 暗涌:互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)時(shí)代留給大部分人的慣性認(rèn)知是,美國(guó)擅長(zhǎng)搞技術(shù)創(chuàng)新,,中國(guó)更擅長(zhǎng)做應(yīng)用,。 梁文鋒:我們認(rèn)為隨著經(jīng)濟(jì)發(fā)展,中國(guó)也要逐步成為貢獻(xiàn)者,,而不是一直搭便車(chē),。過(guò)去三十多年 IT 浪潮里,我們基本沒(méi)有參與到真正的技術(shù)創(chuàng)新里,。我們已經(jīng)習(xí)慣摩爾定律從天而降,,躺在家里 18 個(gè)月就會(huì)出來(lái)更好的硬件和軟件。Scaling Law 也在被如此對(duì)待,。 但其實(shí),,這是西方主導(dǎo)的技術(shù)社區(qū)一代代孜孜不倦創(chuàng)造出來(lái)的,只因?yàn)橹拔覀儧](méi)有參與這個(gè)過(guò)程,,以至于忽視了它的存在,。 02真正的差距是原創(chuàng)和模仿之差暗涌:為什么 DeepSeek V2 會(huì)讓硅谷的很多人驚訝? 梁文鋒:在美國(guó)每天發(fā)生的大量創(chuàng)新里,,這是非常普通的一個(gè),。他們之所以驚訝,是因?yàn)檫@是一個(gè)中國(guó)公司,,在以創(chuàng)新貢獻(xiàn)者的身份,,加入到他們游戲里去。畢竟大部分中國(guó)公司習(xí)慣 follow,,而不是創(chuàng)新,。 暗涌:但這種選擇放在中國(guó)語(yǔ)境里,也過(guò)于奢侈,。大模型是一個(gè)重投入游戲,,不是所有公司都有資本只去研究創(chuàng)新,而不是先考慮商業(yè)化,。 梁文鋒:創(chuàng)新的成本肯定不低,,過(guò)去那種拿來(lái)主義的慣性也和過(guò)去的國(guó)情有關(guān)。但現(xiàn)在,,你看無(wú)論中國(guó)的經(jīng)濟(jì)體量,,還是字節(jié),、騰訊這些大廠的利潤(rùn),放在全球都不低,。我們創(chuàng)新缺的肯定不是資本,,而是缺乏信心以及不知道怎么組織高密度的人才實(shí)現(xiàn)有效的創(chuàng)新。 暗涌:為什么中國(guó)公司——包括不缺錢(qián)的大廠,,這么容易把快速商業(yè)化當(dāng)?shù)谝灰x,? 梁文鋒:過(guò)去三十年,我們都只強(qiáng)調(diào)賺錢(qián),,對(duì)創(chuàng)新是忽視的,。創(chuàng)新不完全是商業(yè)驅(qū)動(dòng)的,還需要好奇心和創(chuàng)造欲,。我們只是被過(guò)去那種慣性束縛了,,但它也是階段性的。 暗涌:但你們究竟是一個(gè)商業(yè)組織,,而非一個(gè)公益科研機(jī)構(gòu),,選擇創(chuàng)新,又通過(guò)開(kāi)源分享出去,,那要在哪里形成護(hù)城河,?像2024 年 5 月這次 MLA 架構(gòu)的創(chuàng)新,也會(huì)很快被其他家 copy 吧,? 梁文鋒:在顛覆性的技術(shù)面前,,閉源形成的護(hù)城河是短暫的。即使OpenAI閉源,,也無(wú)法阻止被別人趕超,。所以我們把價(jià)值沉淀在團(tuán)隊(duì)上,我們的同事在這個(gè)過(guò)程中得到成長(zhǎng),,積累很多 know-how, 形成可以創(chuàng)新的組織和文化,,就是我們的護(hù)城河。 開(kāi)源,,發(fā)論文,,其實(shí)并沒(méi)有失去什么。對(duì)于技術(shù)人員來(lái)說(shuō),,被 follow 是很有成就感的事。其實(shí),,開(kāi)源更像一個(gè)文化行為,,而非商業(yè)行為。給予其實(shí)是一種額外的榮譽(yù),。一個(gè)公司這么做也會(huì)有文化的吸引力,。 暗涌:你怎么看類似朱嘯虎的這種市場(chǎng)信仰派觀點(diǎn),? 梁文鋒:朱嘯虎是自洽的,但他的打法更適合快速賺錢(qián)的公司,,而你看美國(guó)最賺錢(qián)的公司,,都是厚積薄發(fā)的高科技公司。 暗涌:但做大模型,,單純的技術(shù)領(lǐng)先也很難形成絕對(duì)優(yōu)勢(shì),,你們賭的那個(gè)更大的東西是什么? 梁文鋒:我們看到的是中國(guó)AI不可能永遠(yuǎn)處在跟隨的位置,。我們經(jīng)常說(shuō)中國(guó) AI 和美國(guó)有一兩年差距,,但真實(shí)的 gap 是原創(chuàng)和模仿之差。如果這個(gè)不改變,,中國(guó)永遠(yuǎn)只能是追隨者,,所以有些探索也是逃不掉的。 英偉達(dá)的領(lǐng)先,,不只是一個(gè)公司的努力,,而是整個(gè)西方技術(shù)社區(qū)和產(chǎn)業(yè)共同努力的結(jié)果。他們能看到下一代的技術(shù)趨勢(shì),,手里有路線圖,。中國(guó) AI 的發(fā)展,同樣需要這樣的生態(tài),。很多國(guó)產(chǎn)芯片發(fā)展不起來(lái),,也是因?yàn)槿狈ε涮椎募夹g(shù)社區(qū),只有第二手消息,,所以中國(guó)必然需要有人站到技術(shù)的前沿,。 03幻方做大模型是為了做研究,做探索暗涌:幻方?jīng)Q定下場(chǎng)做大模型,,一家量化基金為什么要做這樣一件事,? 梁文鋒:我們做大模型,其實(shí)跟量化和金融都沒(méi)有直接關(guān)系,。我們獨(dú)建了一個(gè)名為深度求索的新公司來(lái)做這件事,。幻方的主要班底里,,很多人是做人工智能的,。當(dāng)時(shí)我們嘗試了很多場(chǎng)景,最終切入了足夠復(fù)雜的金融,,而通用人工智能可能是下一個(gè)最難的事之一,,所以對(duì)我們來(lái)說(shuō),這是一個(gè)怎么做的問(wèn)題,,而不是為什么做的問(wèn)題,。 暗涌:你們要自訓(xùn)一個(gè)大模型,,還是某個(gè)垂直行業(yè)——比如金融相關(guān)的大模型? 梁文鋒:我們要做的是通用人工智能,,也就是 AGI,。語(yǔ)言大模型可能是通往 AGI 的必經(jīng)之路,并且初步具備了 AGI 的特征,,所以我們會(huì)從這里開(kāi)始,,后邊也會(huì)有視覺(jué)等。 暗涌:因?yàn)榇髲S的入局,,很多創(chuàng)業(yè)型公司都放棄了只做通用型大模型的大方向,。 梁文鋒:我們不會(huì)過(guò)早設(shè)計(jì)基于模型的一些應(yīng)用,會(huì)專注在大模型上,。 暗涌:很多人認(rèn)為,,創(chuàng)業(yè)公司在大廠形成共識(shí)后下場(chǎng),已經(jīng)不是一個(gè)好的時(shí)間點(diǎn),。 梁文鋒:現(xiàn)在看起來(lái),,無(wú)論大廠,還是創(chuàng)業(yè)公司,,都很難在短時(shí)間內(nèi)建立起碾壓對(duì)手的技術(shù)優(yōu)勢(shì),。因?yàn)橛?OpenAI 指路,又都基于公開(kāi)論文和代碼,,最晚明年,,大廠和創(chuàng)業(yè)公司都會(huì)把自己的大語(yǔ)言模型做出來(lái)。大廠和創(chuàng)業(yè)公司都各有機(jī)會(huì)?,F(xiàn)有垂類場(chǎng)景不掌握在初創(chuàng)公司手上,,這個(gè)階段對(duì)初創(chuàng)公司不太友好。但因?yàn)檫@種場(chǎng)景說(shuō)到底也是分散的,、碎片化的小需求,,所以它又是更適合靈活的創(chuàng)業(yè)型組織的。 從長(zhǎng)期看,,大模型應(yīng)用門(mén)檻會(huì)越來(lái)越低,,初創(chuàng)公司在未來(lái) 20 年任何時(shí)候下場(chǎng),也都有機(jī)會(huì),。我們的目標(biāo)也很明確,,就是不做垂類和應(yīng)用,而是做研究,,做探索,。 暗涌:為什么你的定義是「做研究、做探索」? 梁文鋒:一種好奇心驅(qū)動(dòng),。從遠(yuǎn)處說(shuō),我們想去驗(yàn)證一些猜想,。比如我們理解人類智能本質(zhì)可能就是語(yǔ)言,,人的思維可能就是一個(gè)語(yǔ)言的過(guò)程。你以為你在思考,,其實(shí)可能是你在腦子里編織語(yǔ)言,。這意味著,在語(yǔ)言大模型上可能誕生出類人的人工智能(AGI),。從近處說(shuō),,GPT4 還有很多待解之謎。我們?nèi)?fù)刻的同時(shí),,也會(huì)做研究揭秘,。 暗涌:但研究意味著要付出更大的成本。 梁文鋒:只做復(fù)刻的話,,可以在公開(kāi)論文或開(kāi)源代碼基礎(chǔ)上,,只需訓(xùn)練很少次數(shù),甚至只需 finetune(微調(diào))一下,,成本很低,。而做研究,要做各種實(shí)驗(yàn)和對(duì)比,,需要更多算力,,對(duì)人員要求也更高,所以成本更高,。 暗涌:那研究經(jīng)費(fèi)哪里來(lái),? 梁文鋒:幻方作為我們的出資人之一,有充足的研發(fā)預(yù)算,,另外每年有幾個(gè)億的捐款預(yù)算,,之前都是給公益機(jī)構(gòu),如果需要,,也可以做些調(diào)整,。 暗涌:但做基礎(chǔ)層大模型,沒(méi)有兩三億美元,,連牌桌都上不了,,我們?nèi)绾沃嗡某掷m(xù)投入? 梁文鋒:我們也在找不同出資方在談,。接觸下來(lái),,感覺(jué)很多 VC 對(duì)做研究有顧慮,他們有退出需求,,希望盡快做出產(chǎn)品商業(yè)化,,而按照我們優(yōu)先做研究的思路,,很難從 VC 那里獲得融資。但我們有算力和一個(gè)工程師團(tuán)隊(duì),,相當(dāng)于有了一半籌碼,。 暗涌:我們對(duì)商業(yè)模式做了哪些推演和設(shè)想? 梁文鋒:我們現(xiàn)在想的是,,后邊可以把我們的訓(xùn)練結(jié)果大部分公開(kāi)共享,,這樣可以跟商業(yè)化有所結(jié)合。我們希望更多人,,哪怕一個(gè)小 app 都可以低成本去用上大模型,,而不是技術(shù)只掌握在一部分人和公司手中,形成壟斷,。 暗涌:一些大廠后期也會(huì)有一些服務(wù)提供,,你們差異化的部分是什么? 梁文鋒:大廠的模型,,可能會(huì)和他們的平臺(tái)或生態(tài)捆綁,,而我們是完全自由的。 暗涌:無(wú)論如何,,一個(gè)商業(yè)公司去做一種無(wú)限投入的研究性探索,,都有些瘋狂。 梁文鋒:如果一定要找一個(gè)商業(yè)上的理由,,它可能是找不到的,,因?yàn)閯澆粊?lái)。從商業(yè)角度來(lái)講,,基礎(chǔ)研究就是投入回報(bào)比很低的,。OpenAI 早期投資人投錢(qián)時(shí),想的一定不是我要拿回多少回報(bào),,而是真的想做這個(gè)事,。我們現(xiàn)在比較確定的是,既然我們想做這個(gè)事,,又有這個(gè)能力,,這個(gè)時(shí)間點(diǎn)上,我們就是最合適人選之一,。 04萬(wàn)卡儲(chǔ)備其實(shí)是好奇心驅(qū)動(dòng)暗涌:GPU是這次 ChatGPT 創(chuàng)業(yè)潮的稀缺品,,你們?cè)?2021 年就可以有先見(jiàn)之明,儲(chǔ)備了 1 萬(wàn)枚,。為什么,? 梁文鋒:其實(shí)從最早的 1 張卡,到 2015 年的 100 張卡、2019 年的 1000 張卡,,再到一萬(wàn)張,,這個(gè)過(guò)程是逐步發(fā)生的。幾百?gòu)埧ㄖ?,我們托管?IDC,,規(guī)模再變大時(shí),托管就沒(méi)法滿足要求了,,就開(kāi)始自建機(jī)房。很多人會(huì)以為這里邊有一個(gè)不為人知的商業(yè)邏輯,,但其實(shí),,主要是好奇心驅(qū)動(dòng)。 暗涌:什么樣的好奇心,? 梁文鋒:對(duì) AI 能力邊界的好奇,。對(duì)很多行外人來(lái)說(shuō),ChatGPT 這波浪潮沖擊特別大,;但對(duì)行內(nèi)人來(lái)說(shuō),,2012 年 AlexNet 帶來(lái)的沖擊已經(jīng)引領(lǐng)一個(gè)新的時(shí)代。AlexNet 的錯(cuò)誤率遠(yuǎn)低于當(dāng)時(shí)其他模型,,復(fù)蘇了沉睡幾十年的神經(jīng)網(wǎng)絡(luò)研究,。雖然具體技術(shù)方向一直在變,但模型,、數(shù)據(jù)和算力這三者的組合是不變的,,特別是當(dāng) 2020 年 OpenAI 發(fā)布 GPT3 后,方向很清楚,,需要大量算力,;但即便 2021 年,我們投入建設(shè)螢火二號(hào)時(shí),,大部分人還是無(wú)法理解,。 暗涌:所以 2012 年起,你們就開(kāi)始關(guān)注到算力的儲(chǔ)備,? 梁文鋒:對(duì)研究員來(lái)說(shuō),,對(duì)算力的渴求是永無(wú)止境的。做了小規(guī)模實(shí)驗(yàn)后,,總想做更大規(guī)模的實(shí)驗(yàn),。那之后,我們也會(huì)有意識(shí)地去部署盡可能多的算力,。 暗涌:很多人以為搭這個(gè)計(jì)算機(jī)集群,,是量化私募業(yè)務(wù)會(huì)用到機(jī)器學(xué)習(xí)做價(jià)格預(yù)測(cè)? 梁文鋒:如果單純只做量化投資,很少的卡也能達(dá)到目的,。我們?cè)谕顿Y外做了大量研究,,更想搞清楚什么樣的范式可以完整地描述整個(gè)金融市場(chǎng),有沒(méi)有更簡(jiǎn)潔的表達(dá)方式,,不同范式能力邊界在哪,,這些范式是不是有更廣泛適用,等等,。 暗涌:但這個(gè)過(guò)程也是一個(gè)燒錢(qián)行為,。 梁文鋒:一件激動(dòng)人心的事,或許不能單純用錢(qián)衡量,。就像家里買(mǎi)鋼琴,,一來(lái)買(mǎi)得起,二來(lái)是因?yàn)橛幸蝗杭庇谠谏厦鎻椬鄻?lè)曲的人,。 暗涌:顯卡通常會(huì)以 20% 的速度在折損,。 梁文鋒:我們沒(méi)有精確計(jì)算過(guò),但應(yīng)該沒(méi)這么多,。英偉達(dá)的顯卡是硬通貨,,即使是很多年前的老卡,也還有很多人在用,。我們之前退役的老卡,,二手處理時(shí)還挺值錢(qián)的,沒(méi)虧太多,。 暗涌:搭一個(gè)計(jì)算機(jī)集群,,維護(hù)費(fèi)用,人工成本,,甚至電費(fèi)也都是不菲的支出,。 梁文鋒:電費(fèi)和維護(hù)費(fèi)用其實(shí)是很低的,這些支出每年只占硬件造價(jià)的 1% 左右,。人工成本不低,,但人工成本也是對(duì)未來(lái)的投資,是公司最大的資產(chǎn),。我們選的人也會(huì)相對(duì)樸實(shí)一點(diǎn),,有好奇心,來(lái)這里有機(jī)會(huì)去做研究,。 暗涌:2021 年,,幻方是亞太地區(qū)第一批拿到 A100顯卡的公司,為什么會(huì)比一些云廠商更早,? 梁文鋒:我們很早就對(duì)新卡做了預(yù)研,、測(cè)試和規(guī)劃,。至于一些云廠商,據(jù)我所知,,他們之前的需求都是分散的,,直到 2022 年自動(dòng)駕駛,有租用機(jī)器做訓(xùn)練的需求,,又有付費(fèi)能力,,一些云廠商才去把基礎(chǔ)設(shè)施建好。大廠很難單純?nèi)プ鲅芯?,做?xùn)練,,它更多會(huì)是業(yè)務(wù)需求驅(qū)動(dòng)。 暗涌:你會(huì)如何看大模型的競(jìng)爭(zhēng)格局? 梁文鋒:大廠肯定有優(yōu)勢(shì),,但如果不能很快應(yīng)用,,大廠也不一定能持續(xù)堅(jiān)持,因?yàn)樗枰吹浇Y(jié)果,。頭部的創(chuàng)業(yè)公司也有技術(shù)做得很扎實(shí)的,但和老的一波 AI 創(chuàng)業(yè)公司一樣,,都要面對(duì)商業(yè)化難題,。 暗涌:一些人會(huì)覺(jué)得一個(gè)量化基金卻強(qiáng)調(diào)自己做AI,是為其他業(yè)務(wù)吹泡泡,。 梁文鋒:但其實(shí)我們的量化基金已經(jīng)基本不怎么對(duì)外募集了,。 暗涌:你會(huì)如何去辨別哪些是AI信仰者,哪些是投機(jī)者,? 梁文鋒:信仰者會(huì)之前就在這里,,之后也在這里。他們更會(huì)去批量買(mǎi)卡,,或者跟云廠商簽長(zhǎng)協(xié)議,,而不是短期去租。 05V2 模型的研發(fā)都是本土人才暗涌:OpenAI前政策主管,、Anthropic 聯(lián)合創(chuàng)始人 Jack Clark 認(rèn)為 DeepSeek 雇傭了「一批高深莫測(cè)的奇才」,,做出 DeepSeek v2 的是怎樣一群人? 梁文鋒:并沒(méi)有什么高深莫測(cè)的奇才,,都是一些 Top 高校的應(yīng)屆畢業(yè)生,、沒(méi)畢業(yè)的博四、博五實(shí)習(xí)生,,還有一些畢業(yè)才幾年的年輕人,。 暗涌:很多大模型公司都執(zhí)著地去海外挖人,很多人覺(jué)得這個(gè)領(lǐng)域前 50 名的頂尖人才可能都不在中國(guó)的公司,,你們的人都來(lái)自哪里,? 梁文鋒:V2 模型沒(méi)有海外回來(lái)的人,,都是本土的。前 50 名頂尖人才可能不在中國(guó),,但也許我們能自己打造這樣的人,。 幻方提出的一種嶄新的MLA(一種新的多頭潛在注意力機(jī)制)架構(gòu),,把顯存占用降到了過(guò)去最常用的MHA架構(gòu)的5%-13% 梁文鋒:在總結(jié)出 Attention 架構(gòu)的一些主流變遷規(guī)律后,他突發(fā)奇想去設(shè)計(jì)一個(gè)替代方案,。不過(guò)從想法到落地,,中間是一個(gè)漫長(zhǎng)的過(guò)程。我們?yōu)榇私M了一個(gè) team,,花了幾個(gè)月時(shí)間才跑通,。 暗涌:這種發(fā)散性靈感的誕生和你們完全創(chuàng)新型組織的架構(gòu)很有關(guān)系?;梅綍r(shí)代,,你們就很少自上而下地指派目標(biāo)或任務(wù)。但 AGI 這種充滿不確定性的前沿探索,,是否多了管理動(dòng)作,? 梁文鋒:DeepSeek 也全是自下而上。而且我們一般不前置分工,,而是自然分工,。每個(gè)人有自己獨(dú)特的成長(zhǎng)經(jīng)歷,都是自帶想法的,,不需要 push 他,。探索過(guò)程中,他遇到問(wèn)題,,自己就會(huì)拉人討論,。不過(guò)當(dāng)一個(gè) idea 顯示出潛力,我們也會(huì)自上而下地去調(diào)配資源,。 暗涌:聽(tīng)說(shuō) DeepSeek 對(duì)于卡和人的調(diào)集非常靈活,。 梁文鋒:我們每個(gè)人對(duì)于卡和人的調(diào)動(dòng)是不設(shè)上限的。如果有想法,,每個(gè)人隨時(shí)可以調(diào)用訓(xùn)練集群的卡無(wú)需審批,。同時(shí)因?yàn)椴淮嬖趯蛹?jí)和跨部門(mén),也可以靈活調(diào)用所有人,,只要對(duì)方也有興趣,。 暗涌:一種松散的管理方式也取決于你們篩選到了一批強(qiáng)熱愛(ài)驅(qū)動(dòng)的人。聽(tīng)說(shuō)你們很擅長(zhǎng)從細(xì)節(jié)招人,,可以讓一些非傳統(tǒng)評(píng)價(jià)指標(biāo)里優(yōu)秀的人被選出來(lái),。 梁文鋒:我們選人的標(biāo)準(zhǔn)一直都是熱愛(ài)和好奇心,,所以很多人會(huì)有一些奇特的經(jīng)歷,很有意思,。很多人對(duì)做研究的渴望,,遠(yuǎn)超對(duì)錢(qián)的在意。 暗涌: Transformer 誕生在谷歌的AI Lab,,ChatGPT誕生在OpenAI, 你覺(jué)得大公司的 AILab 和一個(gè)創(chuàng)業(yè)公司對(duì)于創(chuàng)新產(chǎn)生的價(jià)值有什么不同,? 梁文鋒:不管是 Google 實(shí)驗(yàn)室,還是 OpenAI,,甚至中國(guó)大廠的 AI Lab,,都很有價(jià)值的。最后是 OpenAI 做出來(lái),,也有歷史的偶然性,。 06套路都是上一代的產(chǎn)物,未來(lái)不一定成立暗涌:創(chuàng)新很大程度也是一種偶然嗎,?我看你們辦公區(qū)中間那排會(huì)議室左右兩側(cè)都設(shè)置了可以隨意推開(kāi)的門(mén),。你們同事說(shuō),這就是給偶然留出空隙,。transfomer 誕生中就發(fā)生過(guò)那種偶然經(jīng)過(guò)的人聽(tīng)到后加入,,最終把它變成一個(gè)通用框架的故事。 梁文鋒:我覺(jué)得創(chuàng)新首先是一個(gè)信念問(wèn)題,。為什么硅谷那么有創(chuàng)新精神?首先是敢,。ChatGPT 出來(lái)時(shí),,整個(gè)國(guó)內(nèi)對(duì)做前沿創(chuàng)新都缺乏信心,從投資人到大廠,,都覺(jué)得差距太大了,,還是做應(yīng)用吧。但創(chuàng)新首先需要自信,。這種信心通常在年輕人身上更明顯,。 暗涌:但你們不參與融資,很少對(duì)外發(fā)聲,,社會(huì)聲量上肯定不如那些融資活躍的公司,,怎么確保 DeepSeek 就是做大模型的人的首選? 梁文鋒:因?yàn)槲覀冊(cè)谧鲎铍y的事,。對(duì)頂級(jí)人才吸引最大的,,肯定是去解決世界上最難的問(wèn)題。其實(shí),,頂尖人才在中國(guó)是被低估的,。因?yàn)檎麄€(gè)社會(huì)層面的硬核創(chuàng)新太少了,,使得他們沒(méi)有機(jī)會(huì)被識(shí)別出來(lái)。我們?cè)谧鲎铍y的事,,對(duì)他們就是有吸引力的,。 暗涌:前一段OpenAI的發(fā)布并沒(méi)有等來(lái) GPT5, 很多人覺(jué)得這是技術(shù)曲線明顯在放緩,也很多人開(kāi)始質(zhì)疑 Scaling Law,,你們?cè)趺纯矗?/span> 梁文鋒:我們偏樂(lè)觀,,整個(gè)行業(yè)看起來(lái)都符合預(yù)期。OpenAI 也不是神,,不可能一直沖在前面,。 暗涌:你覺(jué)得 AGI 還要多久實(shí)現(xiàn),發(fā)布 DeepSeek V2 前,,你們發(fā)布過(guò)代碼生成和數(shù)學(xué)的模型,,也從 dense 模型切換到了 MOE,所以你們的 AGI 路線圖有哪些坐標(biāo),? 梁文鋒:可能是 2 年,、5 年或者 10 年,總之會(huì)在我們有生之年實(shí)現(xiàn),。至于路線圖,,即使在我們公司內(nèi)部,也沒(méi)有統(tǒng)一意見(jiàn),。但我們確實(shí)押注了三個(gè)方向,。一是數(shù)學(xué)和代碼,二是多模態(tài),,三是自然語(yǔ)言本身,。數(shù)學(xué)和代碼是 AGI 天然的試驗(yàn)場(chǎng),有點(diǎn)像圍棋,,是一個(gè)封閉的,、可驗(yàn)證的系統(tǒng),有可能通過(guò)自我學(xué)習(xí)就能實(shí)現(xiàn)很高的智能,。另一方面,,可能多模態(tài)、參與到人類的真實(shí)世界里學(xué)習(xí),,對(duì) AGI 也是必要的,。我們對(duì)一切可能性都保持開(kāi)放。 暗涌:你覺(jué)得大模型終局是什么樣態(tài),? 梁文鋒:會(huì)有專門(mén)公司提供基礎(chǔ)模型和基礎(chǔ)服務(wù), 會(huì)有很長(zhǎng)鏈條的專業(yè)分工,。更多人在之上去滿足整個(gè)社會(huì)多樣化的需求。 暗涌:過(guò)去這一年,,中國(guó)的大模型創(chuàng)業(yè)還是有很多變化的,,比如去年開(kāi)頭還很活躍的王慧文中場(chǎng)退出了,,后來(lái)加入的公司也開(kāi)始呈現(xiàn)出差異化。 梁文鋒:王慧文自己承擔(dān)了所有的損失,,讓其他人全身而退,。他做了一個(gè)對(duì)自己最不利,但對(duì)大家都好的選擇,,所以他做人是很厚道的,,這點(diǎn)我很佩服。 暗涌:現(xiàn)在你的精力最多放在哪里,? 梁文鋒:主要的精力在研究下一代的大模型,。還有很多未解決的問(wèn)題。 暗涌:其他幾家大模型創(chuàng)業(yè)公司都是堅(jiān)持既要又要,,畢竟技術(shù)不會(huì)帶來(lái)永久領(lǐng)先,,抓住時(shí)間窗口把技術(shù)優(yōu)勢(shì)落到產(chǎn)品也很重要,DeepSeek 敢于專注在模型研究上是因?yàn)槟P湍芰€不夠嗎,? 梁文鋒:所有的套路都是上一代的產(chǎn)物,,未來(lái)不一定成立。拿互聯(lián)網(wǎng)的商業(yè)邏輯去討論未來(lái) AI 的盈利模式,,就像馬化騰創(chuàng)業(yè)時(shí),,你去討論通用電氣和可口可樂(lè)一樣。很可能是一種刻舟求劍,。 暗涌:過(guò)去幻方就有很強(qiáng)的技術(shù)和創(chuàng)新基因,,成長(zhǎng)也比較順利,這是你偏樂(lè)觀的原因嗎,? 梁文鋒:幻方某種程度上增強(qiáng)了我們對(duì)技術(shù)驅(qū)動(dòng)型創(chuàng)新的信心,,但也不都是坦途。我們經(jīng)歷了一個(gè)漫長(zhǎng)的積累過(guò)程,。外部看到的是幻方 2015 年后的部分,但其實(shí)我們做了 16 年,。 暗涌:回到關(guān)于原創(chuàng)式創(chuàng)新的話題?,F(xiàn)在經(jīng)濟(jì)開(kāi)始進(jìn)入下行,資本也進(jìn)入冷周期,,所以它對(duì)原創(chuàng)式創(chuàng)新是否會(huì)帶來(lái)更多抑制,? 梁文鋒:我倒覺(jué)得未必。中國(guó)產(chǎn)業(yè)結(jié)構(gòu)的調(diào)整,,會(huì)更依賴硬核技術(shù)的創(chuàng)新,。當(dāng)很多人發(fā)現(xiàn)過(guò)去賺快錢(qián)很可能來(lái)自時(shí)代運(yùn)氣,就會(huì)更愿意俯身去做真正的創(chuàng)新,。 暗涌:所以你對(duì)這件事也是樂(lè)觀的,? 梁文鋒:我是八十年代在廣東一個(gè)五線城市長(zhǎng)大的,。我的父親是小學(xué)老師,九十年代,,廣東賺錢(qián)機(jī)會(huì)很多,,當(dāng)時(shí)有不少家長(zhǎng)到我家里來(lái),基本就是家長(zhǎng)覺(jué)得讀書(shū)沒(méi)用,。但現(xiàn)在回去看,,觀念都變了。因?yàn)殄X(qián)不好賺了,,連開(kāi)出租車(chē)的機(jī)會(huì)可能都沒(méi)了,。一代人的時(shí)間就變了。 以后硬核創(chuàng)新會(huì)越來(lái)越多?,F(xiàn)在可能還不容易被理解,,是因?yàn)檎麄€(gè)社會(huì)群體需要被事實(shí)教育。當(dāng)這個(gè)社會(huì)讓硬核創(chuàng)新的人功成名就,,群體性想法就會(huì)改變,。我們只是還需要一堆事實(shí)和一個(gè)過(guò)程。 07更多的投入并不一定產(chǎn)生更多的創(chuàng)新暗涌:現(xiàn)在的 DeepSeek 有一種 OpenAI 早期的理想主義氣質(zhì),,也是開(kāi)源的,。后邊你們會(huì)選擇閉源嗎?OpenAI 和 Mistral 都有過(guò)從開(kāi)源到閉源的過(guò)程,。 梁文鋒:我們不會(huì)閉源,。我們認(rèn)為先有一個(gè)強(qiáng)大的技術(shù)生態(tài)更重要。 暗涌:你們有融資計(jì)劃嗎,?看有媒體報(bào)道,,幻方對(duì) DeepSeek 有獨(dú)立拆分上市的計(jì)劃,硅谷的AI創(chuàng)業(yè)公司,,最終也都難免要和大廠綁定,。 梁文鋒:短期內(nèi)沒(méi)有融資計(jì)劃,我們面臨的問(wèn)題從來(lái)不是錢(qián),,而是高端芯片被禁運(yùn),。 暗涌:很多人認(rèn)為,做 AGI 和做量化是完全不同的兩件事,,量化可以悶聲去做,,但 AGI 可能更需要高舉高打,需要結(jié)盟,,這樣可以讓你的投入變大,。 梁文鋒:更多的投入并不一定產(chǎn)生更多的創(chuàng)新。否則大廠可以把所有的創(chuàng)新包攬了。 暗涌:你們現(xiàn)在不做應(yīng)用,,是因?yàn)槟銈儧](méi)有運(yùn)營(yíng)的基因嗎,? 梁文鋒:我們認(rèn)為當(dāng)前階段是技術(shù)創(chuàng)新的爆發(fā)期,而不是應(yīng)用的爆發(fā)期,。長(zhǎng)遠(yuǎn)來(lái)說(shuō),,我們希望形成一種生態(tài),就是業(yè)界直接使用我們的技術(shù)和產(chǎn)出,,我們只負(fù)責(zé)基礎(chǔ)模型和前沿的創(chuàng)新,,然后其它公司在 DeepSeek 的基礎(chǔ)上構(gòu)建 toB、toC 的業(yè)務(wù),。如果能形成完整的產(chǎn)業(yè)上下游,,我們就沒(méi)必要自己做應(yīng)用。當(dāng)然,,如果需要,,我們做應(yīng)用也沒(méi)障礙,但研究和技術(shù)創(chuàng)新永遠(yuǎn)是我們第一優(yōu)先級(jí),。 暗涌:但選擇API的話,,為什么選擇 DeepSeek,而不是大廠,? 梁文鋒:未來(lái)的世界很可能是專業(yè)化分工的,,基礎(chǔ)大模型需要持續(xù)創(chuàng)新,大廠有它的能力邊界,,并不一定適合,。 暗涌:但技術(shù)真的可以拉開(kāi)差距嗎? 你也說(shuō)過(guò)并不存在絕對(duì)的技術(shù)秘密。 梁文鋒:技術(shù)沒(méi)有秘密,,但重置需要時(shí)間和成本,。英偉達(dá)的顯卡,理論上沒(méi)有任何技術(shù)秘密,,很容易復(fù)制,,但重新組織團(tuán)隊(duì)以及追趕下一代技術(shù)都需要時(shí)間,所以實(shí)際的護(hù)城河還是很寬,。 暗涌:你們降價(jià)后,,字節(jié)率先跟進(jìn),說(shuō)明他們還是感受到某種威脅,。你怎么看創(chuàng)業(yè)公司與大廠競(jìng)爭(zhēng)的新解法,? 梁文鋒:說(shuō)實(shí)話我們不太 care 這件事,,只是順便做了這件事,。提供云服務(wù)不是我們的主要目標(biāo)。我們的目標(biāo)還是去實(shí)現(xiàn) AGI,。 目前沒(méi)有看到什么新解法,,但大廠也沒(méi)有明顯占優(yōu),。大廠有現(xiàn)成的用戶,但它的現(xiàn)金流業(yè)務(wù)也是它的包袱,,也會(huì)讓它成為隨時(shí)被顛覆的對(duì)象,。 暗涌:你怎么看 DeepSeek 之外的 6 家大模型創(chuàng)業(yè)公司的終局? 梁文鋒:可能活下來(lái) 2 到 3 家?,F(xiàn)在都還處在燒錢(qián)階段,,所以那些自我定位清晰、更能精細(xì)化運(yùn)營(yíng)的,,更有機(jī)會(huì)活下來(lái),。其它公司可能會(huì)脫胎換骨。有價(jià)值的東西不會(huì)煙消云散,,但會(huì)換一種方式,。 暗涌:幻方時(shí)代,面對(duì)競(jìng)爭(zhēng)的姿態(tài)就被評(píng)價(jià)為「我行我素」,,很少在意橫向比較,。關(guān)于競(jìng)爭(zhēng),你思考的原點(diǎn)是什么,? 梁文鋒:我經(jīng)常思考的是,,一個(gè)東西能不能讓社會(huì)的運(yùn)行效率變高,以及你能否在它的產(chǎn)業(yè)分工鏈條上找到擅長(zhǎng)的位置,。只要終局是讓社會(huì)效率更高,,就是成立的。中間很多都是階段性的,,過(guò)度關(guān)注必然眼花繚亂,。 08創(chuàng)新都是自己產(chǎn)生的,不是刻意安排的,,更不是教出來(lái)的暗涌:深度求索團(tuán)隊(duì)的招聘進(jìn)展如何,? 梁文鋒:初始團(tuán)隊(duì)已經(jīng)集結(jié)到位,前期因?yàn)槿耸植粔?,?huì)從幻方臨時(shí)借調(diào)一部分人過(guò)去,。去年底 ChatGPT3.5 風(fēng)靡時(shí),我們就開(kāi)始動(dòng)手招聘了,,不過(guò)我們依然需要更多的人加入,。 暗涌:大模型創(chuàng)業(yè)的人才也是稀缺的,有投資人說(shuō)很多適合的人才可能只在 OpenAI,、FacebookAI Research 等巨頭的 AI lab 里,。你們會(huì)去海外挖這類人才嗎? 梁文鋒:如果追求短期目標(biāo),找現(xiàn)成有經(jīng)驗(yàn)的人是對(duì)的,。但如果看長(zhǎng)遠(yuǎn),,經(jīng)驗(yàn)就沒(méi)那么重要,基礎(chǔ)能力,、創(chuàng)造性,、熱愛(ài)等更重要。從這個(gè)角度看,,國(guó)內(nèi)合適的候選人就不少,。 暗涌:為什么經(jīng)驗(yàn)沒(méi)那么重要? 梁文鋒:不一定是做過(guò)這件事的人才能做這件事,?;梅秸腥擞袟l原則是,看能力,,而不是看經(jīng)驗(yàn),。我們的核心技術(shù)崗位,基本以應(yīng)屆和畢業(yè)一兩年的人為主,。 暗涌:在創(chuàng)新業(yè)務(wù)上,,你覺(jué)得經(jīng)驗(yàn)是阻礙嗎? 梁文鋒:做一件事,,有經(jīng)驗(yàn)的人會(huì)不假思索告訴你,,應(yīng)該這樣做,但沒(méi)有經(jīng)驗(yàn)的人,,會(huì)反復(fù)摸索,、很認(rèn)真去想應(yīng)該怎么做,然后找到一個(gè)符合當(dāng)前實(shí)際情況的解決辦法,。 暗涌:幻方從一個(gè)完全無(wú)金融基因的外行,,切入到這個(gè)行業(yè),幾年內(nèi)做到頭部,,這條招人法則是其中秘密之一嗎,? 梁文鋒:我們的核心團(tuán)隊(duì),連我自己,,一開(kāi)始都沒(méi)有量化經(jīng)驗(yàn),,這一點(diǎn)很特殊。不能說(shuō)是成功的秘密,,但這是幻方的文化之一,。我們不會(huì)故意回避有經(jīng)驗(yàn)的人,但更多是看能力,。 拿銷售這個(gè)崗位舉個(gè)例子,。我們的兩個(gè)主力銷售,,都是這個(gè)行業(yè)的素人。一個(gè)原來(lái)做德國(guó)機(jī)械品類外貿(mào)的,,一個(gè)是原來(lái)在券商做后臺(tái)寫(xiě)代碼。他們進(jìn)入這個(gè)行業(yè)時(shí),,沒(méi)有經(jīng)驗(yàn),,沒(méi)有資源,沒(méi)有積累,。 而現(xiàn)在我們可能是唯一一家能以直銷為主的大私募,。做直銷意味著不用給中間商分費(fèi)用,同樣規(guī)模和業(yè)績(jī)下,,利潤(rùn)率更高,,很多家會(huì)試圖模仿我們,但并沒(méi)有成功,。 暗涌:為什么很多家試圖模仿你們,,卻沒(méi)有成功? 梁文鋒:因?yàn)閮H憑這一點(diǎn)不足以讓創(chuàng)新發(fā)生,。它需要和公司的文化和管理相匹配,。事實(shí)上,第一年他們什么都做不出來(lái),,第二年才開(kāi)始有點(diǎn)成績(jī),。但我們的考核標(biāo)準(zhǔn)和一般公司不太一樣。我們沒(méi)有 KPI,,也沒(méi)有所謂的任務(wù),。 暗涌:那你們的考核標(biāo)準(zhǔn)是? 梁文鋒:我們不像一般公司,,看重客戶下單量,,我們的銷售賣(mài)多少和提成不是一開(kāi)始就算好的,而會(huì)更鼓勵(lì)銷售去發(fā)展自己的圈子,,認(rèn)識(shí)更多人,,產(chǎn)生更大影響力。因?yàn)槲覀冋J(rèn)為,,一個(gè)讓客戶信任的正直的銷售,,可能在短時(shí)間內(nèi)做不到讓客戶來(lái)下單,但可以讓你覺(jué)得他是個(gè)靠譜的人,。 暗涌:選來(lái)合適的人后,,用何種方式讓他進(jìn)入狀態(tài)? 梁文鋒:交給他重要的事,并且不干預(yù)他,。讓他自己想辦法,,自己發(fā)揮,。其實(shí),一家公司的基因是很難被模仿的,。比如說(shuō)招沒(méi)有經(jīng)驗(yàn)的人,,怎么判斷他的潛力,招進(jìn)來(lái)之后如何才能讓他成長(zhǎng),,這些都沒(méi)法直接模仿,。 暗涌:你覺(jué)得什么是打造一個(gè)創(chuàng)新型組織的必要條件? 梁文鋒:我們的總結(jié)是,,創(chuàng)新需要盡可能少的干預(yù)和管理,,讓每個(gè)人有自由發(fā)揮的空間和試錯(cuò)機(jī)會(huì)。創(chuàng)新往往都是自己產(chǎn)生的,,不是刻意安排的,,更不是教出來(lái)的。 暗涌:這是一種非常規(guī)的管理方式,,這種情況下你如何確保一個(gè)人做事是有效率的,,而且在你要的方向上? 梁文鋒:招人時(shí)確保價(jià)值觀一致,,然后通過(guò)企業(yè)文化來(lái)確保步調(diào)一致,。當(dāng)然,我們并沒(méi)有一個(gè)成文的企業(yè)文化,,因?yàn)樗谐晌臇|西,,又會(huì)阻礙創(chuàng)新。更多時(shí)候,,是管理者的以身示范,,遇到一件事,你如何做決策,,會(huì)成為一種準(zhǔn)則,。 暗涌:你覺(jué)得這波做大模型的競(jìng)爭(zhēng)中,創(chuàng)業(yè)公司更適合創(chuàng)新的組織架構(gòu)會(huì)是和大廠競(jìng)爭(zhēng)的破局點(diǎn)嗎,? 梁文鋒:按照教科書(shū)的方法論來(lái)推導(dǎo)創(chuàng)業(yè)公司,,在當(dāng)下,他們做的事,,都是活不下來(lái)的,。但市場(chǎng)是變化的。真正的決定力量往往不是一些現(xiàn)成的規(guī)則和條件,,而是一種適應(yīng)和調(diào)整變化的能力,。很多大公司的組織結(jié)構(gòu)已經(jīng)不能快速響應(yīng)和快速做事,而且他們很容易讓之前的經(jīng)驗(yàn)和慣性成為束縛,,而這波 AI 新浪潮之下,,一定會(huì)有一批新公司誕生,。 暗涌:做這樣一件事,最讓你們興奮的是什么,? 梁文鋒:去搞清我們的猜想是不是事實(shí),,如果是對(duì)的,就會(huì)很興奮了,。 暗涌:這次大模型招人,,什么是我們必卡的條件? 梁文鋒:熱愛(ài),,扎實(shí)的基礎(chǔ)能力。其他都沒(méi)那么重要,。 暗涌:這種人容易找到嗎,? 梁文鋒:他們的熱情通常會(huì)表現(xiàn)出來(lái),因?yàn)樗娴暮芟胱鲞@件事,,所以這些人往往同時(shí)也在找你,。 暗涌:大模型可能是一件無(wú)休止投入的事,付出的代價(jià)會(huì)讓你們顧慮嗎,? 梁文鋒:創(chuàng)新就是昂貴且低效的,,有時(shí)候伴隨著浪費(fèi)。所以經(jīng)濟(jì)發(fā)展到一定程度之后,,才能夠出現(xiàn)創(chuàng)新,。很窮的時(shí)候,或者不是創(chuàng)新驅(qū)動(dòng)的行業(yè),,成本和效率非常關(guān)鍵,。看 OpenAI 也是燒了很多錢(qián)才出來(lái),。 暗涌:會(huì)覺(jué)得你們?cè)谧鲆患墀偪竦氖聠幔?/span> 梁文鋒:不知道是不是瘋狂,,但這個(gè)世界存在很多無(wú)法用邏輯解釋的事,就像很多程序員,,也是開(kāi)源社區(qū)的瘋狂貢獻(xiàn)者,,一天很累了,還要去貢獻(xiàn)代碼,。 暗涌:這里邊會(huì)有一種精神獎(jiǎng)賞,。 梁文鋒:類似你徒步 50 公里,整個(gè)身體是癱掉的,,但精神很滿足,。 暗涌:你覺(jué)得好奇心驅(qū)動(dòng)的瘋狂可以一直持續(xù)下去嗎? 梁文鋒:不是所有人都能瘋狂一輩子,,但大部分人,,在他年輕的那些年,,可以完全沒(méi)有功利目的,投入地去做一件事,。 |
|
來(lái)自: e_shannon > 《量子AI哲學(xué)》