蘋果放棄探索了十年之久的電動汽車項(xiàng)目,、全面轉(zhuǎn)向AI,無疑是最近幾天科技圈的頭版頭條,。近日在蘋果公司舉行的年度股東大會上CEO蒂姆·庫克表示,,該公司在人工智能方面“投入了大量資金”,并將于今年晚些時候宣布一項(xiàng)重大公告,。此外他還談及,,“所有由蘋果芯片驅(qū)動的Mac都是非常強(qiáng)大的人工智能機(jī)器。事實(shí)上,,目前市面上用于人工智能的電腦,,沒有比Mac更好的,。” “生成式人工智能具有令人難以置信的突破潛力,,將為用戶在生產(chǎn)力、解決問題等方面帶來變革性的機(jī)會”,,這般表態(tài)與庫克一貫的謀定而后動的慣例儼然也形成了鮮明的對比,。其實(shí)也不怪他一反常態(tài),畢竟目前蘋果力推的“空間計(jì)算”概念也遇到了“既生瑜何生亮”的難題,,OpenAI所引領(lǐng)的AI狂潮幾乎將所有注意力給吸走了,。因此現(xiàn)在的情況,是在AI領(lǐng)域蘋果儼然已處于落后狀態(tài),。 且不提作為領(lǐng)軍者的OpenAI,,谷歌有Bard、Gemini,,Meta有開源大模型LLaMA 2,,微軟有Copilot,亞馬遜有Amazon Q,,而蘋果則只有一個在傳聞中的生成式AI模型“AppleGPT”,。其號稱擁有2000億參數(shù),在語言理解和生成方面具有高度復(fù)雜性和強(qiáng)大的解析力,,但AppleGPT畢竟還沒有落地,。所以如今的現(xiàn)實(shí),是從2022年的Stable Diffusion引爆生成式AI這一概念以來,,接近兩年時間蘋果在這個賽道幾乎是毫無建樹,。 一手好牌打的稀爛,,這似乎是如今蘋果在AI領(lǐng)域最恰當(dāng)?shù)男稳?。蘋果的統(tǒng)一內(nèi)存架構(gòu)則是該公司在AI賽道最強(qiáng)的一張牌,庫克說目前市面上用于人工智能的電腦沒有比Mac更好的,,其實(shí)并非吹牛,,AI PC這個概念的旗手原本應(yīng)是蘋果才對。眾所周知,,算力就是AI時代的“石油”,,英偉達(dá)在這兩年一飛沖天、達(dá)到市值接近2萬億美元?dú)v史頂點(diǎn),,無疑就是因?yàn)樗麄冋莆樟怂懔┙o,。 然而在算力之外,一個極少被提及的概念“內(nèi)存墻”,卻是另一個影響大模型性能的主要因素,。而參數(shù)量則是大模型性能的基礎(chǔ),,參數(shù)越大、性能才能越高,,以至于大模型相關(guān)廠商在參數(shù)規(guī)模上可以說是競相大放衛(wèi)星,??呻S著AI大模型參數(shù)量的不斷增長,,內(nèi)存不夠的問題也已經(jīng)逐漸凸顯,“CUDA out of memory”這樣的報錯提示已經(jīng)成為了如今AI從業(yè)者最不愿意看到的代碼,。 “CUDA out of memory”是指使用CUDA進(jìn)行計(jì)算時,GPU內(nèi)存不足所導(dǎo)致的錯誤,,這個問題往往出現(xiàn)在需要處理大量數(shù)據(jù)的時候,,這也是為什么在購買用于AI的GPU時,顯存同樣也是最為核心的指標(biāo)之一,。例如伯克利AI實(shí)驗(yàn)室的學(xué)者Amir Gholami就曾表示,,未來內(nèi)存墻將是比算力更大的瓶頸。 Amir Gholami的研究團(tuán)隊(duì)發(fā)現(xiàn),,Transformer架構(gòu)的大模型尺寸以每兩年410倍的速度瘋狂增長,,而GPU作為AI算力的基座,其內(nèi)存容量增長速度卻只有每兩年2倍,。因此也使得GPU內(nèi)存容量嚴(yán)重制約了可訓(xùn)練的模型規(guī)模和算力提升速度,,并成為了阻礙AI技術(shù)發(fā)展與落地的重要瓶頸。如今GPU顯存只有8GB的水平,,那么無論開發(fā)者如何進(jìn)行優(yōu)化,,想要容納一個千億參數(shù)的大模型顯然也是巧婦難為無米之炊。 為此,,英偉達(dá)給出的解決方案是構(gòu)建GPU集群來提供聚合的更大內(nèi)存。比如說目前AI大模型的“硬通貨”DGX H100系統(tǒng),,其核心是8個H100 GPU,,一共可以提供640GB的GPU內(nèi)存。然而這個方案的問題在于成本高昂,,售價更是高達(dá)30萬美元以上,,且無法逾越GPU間的“通信墻”,也就是數(shù)據(jù)交換時,、由于訪問帶寬和延遲的限制導(dǎo)致性能下降,。 作為英偉達(dá)在GPU領(lǐng)域的老對手,AMD的策略則是弱算力+大內(nèi)存。AMD此前在“Advancing AI”活動上推出于大模型訓(xùn)練和推理的MI300X GPU時,,蘇姿豐博士就特別強(qiáng)調(diào)到,,“MI300X的使命是緩解大模型分布式訓(xùn)推所面臨的內(nèi)存制約和互連制約”。 與英偉達(dá)的H100相比,,MI300X的高帶寬內(nèi)存密度最高可達(dá)H100的2.4倍,,高帶寬內(nèi)存帶寬最高可達(dá)H100的1.6倍。也就是說,,MI300X能運(yùn)行比H100更大的AI模型,。 這樣看來,,蘋果的統(tǒng)一內(nèi)存架構(gòu)與AI大模型豈不是天作之合,,Apple Silicon芯片甚至都不用重新設(shè)計(jì),直接就能作為推理卡使用,。當(dāng)其他廠商還在苦苦尋找如何將端側(cè)大模型部署在PC上,,以期讓AI PC名副其實(shí)時,蘋果卻對已經(jīng)打好地基的端側(cè)AIGC生態(tài)“不屑一顧”,。君不見過去兩年如火如荼的AI PC概念,,蘋果此前從來就沒有將Ma與其聯(lián)系到一起。 好在,,蘋果方面終于還是意識到了搭載自研芯片的Mac在AI運(yùn)算能力方面的優(yōu)勢,,只不過這一天到來似乎有點(diǎn)晚。從某種意義上來說,,蘋果更像是在亡羊補(bǔ)牢,。至于說為什么明明已經(jīng)擁有了現(xiàn)實(shí)基礎(chǔ),相關(guān)概念也得到了業(yè)界的追捧,,蘋果早前卻一直無動于衷,。當(dāng)然是因?yàn)榻裉斓奶O果與當(dāng)初推出Apple II、iPhone 4的蘋果,,不是一個企業(yè)了,。 誠然,,蘋果是以破壞式創(chuàng)新起家,、乃至走向輝煌,當(dāng)初iPhone 4給市場帶來了與以往截然不同的價值主張,,更是砸掉了功能機(jī)的飯碗,、開啟了智能手機(jī)時代。然而隨著蘋果吃到了智能手機(jī)時代最大的一塊蛋糕,、將市值推向2.8萬億美元,,大企業(yè)病也就隨之而來。 蘋果造車失敗、iPhone被詬病只有“參數(shù)升級”,、卻缺乏“技術(shù)創(chuàng)新”,,乃至在AI上的落后,或許皆因同一個原因,,即某位蘋果高層察覺了新興賽道的機(jī)遇,,也難以下定決心在前途未卜的情況下將個人在公司內(nèi)的未來推上賭桌。盡管財大氣粗的蘋果公司可以承受失敗帶來的沖擊,,但員工可能經(jīng)不起這樣的失敗,。 “泰坦”徹底隕落,,探索了十年的蘋果選擇放棄造車“電比油低”的漢唐榮耀版,,是比亞迪的正名之戰(zhàn) |
|