一系列接二連三的大事件,為英特爾,、英偉達(dá),、AMD 三大巨頭圍繞數(shù)字化時(shí)代的異構(gòu)計(jì)算 CPU GPU FPGA / DPU 的“競奪”提供了更多的想象空間,也成為了日后分野的新注解,。 英特爾在獨(dú)立 GPU 領(lǐng)域卷土重來,,在 IPU 領(lǐng)域亦不斷出新,,借助在硬件、軟件,、架構(gòu)和制程方面的革新以及 IDM2.0 戰(zhàn)略重兵壓陣,。 AMD 收購賽靈思落定之后,補(bǔ)齊了 FPGA 的短板,,前不久 AMD 又宣布以約 19 億美元收購云服務(wù)提供商 Pensando,,至此 AMD 正式進(jìn)入 DPU 領(lǐng)域,為其數(shù)據(jù)中心藍(lán)圖補(bǔ)上關(guān)鍵一環(huán),。英偉達(dá)雖收購 Arm 被迫“放手”,,但已有基于 Arm 的 CPU 作為重要“補(bǔ)給”,并通過收購補(bǔ)齊 DPU,,欲在異構(gòu)時(shí)代大展身手,。 三大巨頭的火拼已然深入腹地,英特爾,、英偉達(dá),、AMD 的爭奪已呈現(xiàn)出“全面戰(zhàn)役”的態(tài)勢。 GPU 領(lǐng)域競奪“重啟”在異構(gòu)計(jì)算領(lǐng)域,,GPU 可說是必須倚重的“彈藥”,。 作為異構(gòu)時(shí)代和新興應(yīng)用驅(qū)動下的最大受益者之一,隨著服務(wù)器,、汽車,、人工智能、邊緣計(jì)算等領(lǐng)域?qū)λ懔?AI 性能需求的不斷提升,,GPU 憑借自身在并行處理和通用計(jì)算的優(yōu)勢高歌猛進(jìn),,市場得以持續(xù)高速成長。 據(jù) Verified Market Research 的數(shù)據(jù),2020 年全球 GPU 市場價(jià)值為 254.1 億美元,2027 年有望達(dá)到 1853.1 億美元, 年平均增速高達(dá) 32.82%,。 目前 GPU 被廣泛地運(yùn)用于 PC,、游戲、數(shù)據(jù)中心,、高性能計(jì)算,、智能汽車等領(lǐng)域。值得注意的是,,游戲與 PC 是其傳統(tǒng)主戰(zhàn)場,,而數(shù)據(jù)中心、高性能計(jì)算和智能汽車將成為 GPU 增長的新引擎,,不同應(yīng)用對 GPU 的需求也各有側(cè)重,。 據(jù)了解,游戲主機(jī)的設(shè)計(jì)思路著重提升體驗(yàn),,側(cè)重開發(fā)人員對 CPU,、GPU 等硬件優(yōu)化和底層 API 等軟件優(yōu)化,。而 PC 的 GPU 需在性能、拓展性,、能效方面做到平衡,,主要有集成 GPU 和獨(dú)立 GPU 兩類,大部分集成 GPU 已與 CPU 集成為 SoC,,而獨(dú)立 GPU 多采用 PCIe 總線與 CPU 實(shí)時(shí)通信,。從高性能計(jì)算和服務(wù)器來看,對 GPU 具有大數(shù)據(jù)量的快速吞吐,、超強(qiáng)穩(wěn)定性、長時(shí)間運(yùn)行等嚴(yán)格要求,;汽車 GPU 需滿足諸如 AEC-Q100 等車規(guī)認(rèn)證,,并支持專用的圖形 API,并且未來的趨勢是汽車 CPU 將和 GPU 組成 SoC,,從分布式向中心化發(fā)展,。 在多年鏖戰(zhàn)之后,全球 GPU 呈現(xiàn)寡頭壟斷的格局,,英偉達(dá)是絕對的霸主,,AMD 緊隨其后,但在英特爾重返獨(dú)立 GPU 戰(zhàn)場之后,,原本的平衡將被打破,。 通過技術(shù)革新、場景拓展,、外延并購,,加上依托于 CUDA 軟件堆棧對 GPU 通用計(jì)算能力的不斷發(fā)掘,英偉達(dá)成為 GPU 領(lǐng)域的佼佼者,,引領(lǐng)全球 GPU 發(fā)展,。2022 財(cái)年,英偉達(dá)收入創(chuàng)紀(jì)錄,,達(dá)到 269.1 億美元,,同比增長 61%。 翻看英偉達(dá)的營收結(jié)構(gòu)可以發(fā)現(xiàn),,受益于對英偉達(dá) Ampere 架構(gòu)產(chǎn)品的強(qiáng)勁需求,,游戲成最大動力,數(shù)據(jù)中心市場增速最快,,創(chuàng) 106.1 億美元新高,;而汽車業(yè)務(wù)雖有下滑,但后續(xù)仍將持續(xù)收獲,。其下一步布局也是火力全開:已推出新一代桌面 GPU 和筆記本電腦 GPU,; 面向數(shù)據(jù)中心的下一代 GPU Hopper GH100 芯片或超過 1400 億個(gè)晶體管,,并將采用臺積電 5nm 節(jié)點(diǎn)的多芯片模塊 (MCM) 設(shè)計(jì)。且下一代自動駕駛芯片 Orin 計(jì)劃用于 2022 年量產(chǎn),,算力將達(dá)到 254TOPS,,目前已經(jīng)獲得蔚來、理想,、沃爾沃,、奔馳等多家整車廠項(xiàng)目。 經(jīng)過近些年的“突飛猛進(jìn)”,,AMD 在 CPU 和 GPU 市場均站穩(wěn)了市場第二的位置,。在 GPU 布局上,2022 年 AMD 通過新的頂級,、中端和入門級 GPU,,進(jìn)一步擴(kuò)展顯卡市場,同時(shí)配備新的 AMD Software 支持,。在數(shù)據(jù)中心領(lǐng)域,,AMD 也激進(jìn)不止,前不久發(fā)布了基于 GPU 架構(gòu)的 Instinct MI200 加速卡,,致力于 HPC 和 AI 加速,。其采用第二代 CDNA 架構(gòu)(專為優(yōu)化數(shù)據(jù)中心計(jì)算工作負(fù)載而設(shè)計(jì)),是首個(gè)多芯片,、首個(gè)支持 128GB HBM2E 顯存的 GPU,,也是首款 Exascale 級(百億億次級)GPU。同時(shí)還推出了新型面向數(shù)據(jù)中心 GPU—— 下一代 Radeon Pro V620,,旨在滿足云應(yīng)用,、3D 工作負(fù)載等對 GPU 加速日益增長的需求。 在 PC 等集成 GPU 領(lǐng)域占據(jù)領(lǐng)先優(yōu)勢的英特爾,,自前幾年宣布重回獨(dú)立 GPU 戰(zhàn)場之后,,招數(shù)凌厲,不斷精進(jìn),。2020 年底,,英特爾在其架構(gòu)日中首次推出 Xe GPU 架構(gòu),Xe 微架構(gòu)可滿足從集成 / 入門圖形需求到數(shù)據(jù)中心和高性能計(jì)算的需求,。同時(shí),,英特爾發(fā)布了其首款數(shù)據(jù)中心服務(wù)器 GPU,完成了“CPU GPU FPGA”混合 XPU 架構(gòu)的全面構(gòu)建,。 在 2021 年架構(gòu)日上,,英特爾即重磅推出兩款獨(dú)立 GPU。而在前不久舉辦的投資日上,英特爾發(fā)布兩款 GPU,,分別面向游戲領(lǐng)域和數(shù)據(jù)中心,。接著,英特爾宣稱,,代號為 ATS-M 的數(shù)據(jù)中心 GPU 將于第三季度發(fā)布,,其集成多個(gè) Xe 內(nèi)核、AV1 硬件編碼器,、GDDR6 內(nèi)存,、光線追蹤單元等,可提供每秒 150 萬億次運(yùn)算,。不止如此,,面向傳統(tǒng)陣地 PC 領(lǐng)域,英特爾也志在必得,,分別推出了面向筆記本電腦平臺的 Arc 銳炫系列顯卡和面向臺式機(jī)的首款 A3 系列顯卡 —— 銳炫 A380 GPU,。而且,不僅僅是 A380,,具有更高性能的英特爾銳炫 A5 系列和 A7 系列也將于今年夏季面市,。 在硝煙四起的 GPU 領(lǐng)域,,火力全開的英特爾或?qū)⑷轿幌?AMD 與英偉達(dá)發(fā)起挑戰(zhàn),。 異構(gòu)計(jì)算“短兵相接”直接來看,英特爾,、英偉達(dá)和 AMD 三大巨頭的異構(gòu)“拼圖”均已大致成形,。 在這三大巨頭中,顯然英特爾的異構(gòu)組合更具底蘊(yùn),。過去五年來,,確立“以數(shù)據(jù)為中心”轉(zhuǎn)型目標(biāo)的英特爾,持續(xù)通過并購等動作豐富自身在數(shù)據(jù)中心領(lǐng)域的布局,,包括收購優(yōu)質(zhì)的 FPGA,、eASIC、ASIC 公司,,再加上研發(fā)獨(dú)立 GPU,、IPU、神經(jīng)擬態(tài)芯片,、量子計(jì)算芯片,,以及研發(fā)統(tǒng)一編程軟件工具 oneAPI,為 CPU,、GPU,、FPGA 和其他加速器在內(nèi)的異構(gòu)計(jì)算提供統(tǒng)一簡化的應(yīng)用程序開發(fā)編程模型,實(shí)現(xiàn)了覆蓋多重架構(gòu)的產(chǎn)品組合。 加之最近 IDM2.0 策略的大舉擴(kuò)張,,以及宣稱開放 x86,、高調(diào)加入 RISC-V 陣營的一系列動作,讓英特爾在異構(gòu)化時(shí)代手握多張“王牌”,,更加游刃有余,。 而從 AMD 來看,其業(yè)務(wù)長期聚焦在 CPU 和 GPU 兩大核心領(lǐng)域,,F(xiàn)PGA 則是其最大短板,。但在 AMD 宣布以全股份交易方式完成了對賽靈思的收購之后,憑借賽靈思在 FPGA,、可編程 SoC 及 ACAP 領(lǐng)域的深厚積累,,為 AMD 提供了橫向云端及邊緣計(jì)算實(shí)力的走強(qiáng)補(bǔ)充了“營養(yǎng)”。AMD 與賽靈思的合并,,不僅將著力提升其整體的數(shù)據(jù)中心業(yè)務(wù)競爭力,,還將在數(shù)據(jù)中心異構(gòu)化時(shí)代獲得更多籌碼。 在 Pensando 被 AMD 收入囊中之后,,意味著 AMD 不僅正式切入到 DPU 領(lǐng)域,,也讓 AMD 的業(yè)務(wù)已完整涵蓋 CPU、GPU,、FPGA,、DPU,構(gòu)建了基本完備的算力“拼圖”,。 以 GPU 縱橫江湖的英偉達(dá),,為成全其“GPU CPU DPU”的路線,英偉達(dá)先是高調(diào)宣布收購 Arm,,后花費(fèi) 69 億美元收購以色列網(wǎng)絡(luò)設(shè)備商 Mellanox 補(bǔ)給 DPU,。盡管最終“毫無意外”地收購 Arm 折戟,但其已在大力投入 CPU 開發(fā),,并于 2021 年的 GTC 大會上正式推出面向數(shù)據(jù)中心 AI 和高性能計(jì)算應(yīng)用的自研 CPU—— 基于 Arm Neoverse 架構(gòu)的 Grace 芯片,。根據(jù)協(xié)議,英偉達(dá)取得了 ARM 將近 20 年的架構(gòu)授權(quán),,未來可通過 ARM 授權(quán) IP 來開發(fā) ARM 架構(gòu) CPU,。 對于英偉達(dá)來說,Grace CPU 的研發(fā)意義深遠(yuǎn),,因 GPU 需搭配 CPU 運(yùn)算,,此招將使其在 CPU 方面不再受限,CPU 的自立自強(qiáng)也將使其異構(gòu)融合更綱舉目張,。 面臨全面較量,,三大巨頭也有著不同的隱憂。 有行業(yè)人士分析,AMD 還需要時(shí)間消化和整合 GPU CPU DPU FPGA,,擴(kuò)展為云,、企業(yè)和邊緣客戶提供領(lǐng)先解決方案的能力;英偉達(dá)倚重的 GPU 未來在數(shù)據(jù)中心加速領(lǐng)域或面臨 ASIC 的蠶食,;而英特爾還是一個(gè)基因?qū)儆?CPU 的公司,,而在 GPU 上的投入需要配合 CPU 的成長,因此處理好 CPU 和 GPU 之間的發(fā)展沖突將是巨大挑戰(zhàn),。此外,,在 IDM2.0 的指揮棒下,投資重心不可避免向先進(jìn)制造傾斜,,如何平衡各大 XPU 的創(chuàng)新與整合投入資源也需要仔細(xì)掂量,。 需要指出的是,隨著 Chiplet UCIe 協(xié)議的確定,,設(shè)計(jì)規(guī)??稍黾訑?shù)倍,如 CPU,、GPU 和 DPU 均可平行擴(kuò)展 N 倍,;或?qū)崿F(xiàn)垂直整合,CPU GPU DPU 可合并成一個(gè)超異構(gòu)的單芯片,,或是兩兩合并,。 因而,不同系統(tǒng)如何并行不悖以及如何高效的自適應(yīng)交互,,將成為巨頭們面臨的全新挑戰(zhàn),。誰能在這方面先行一步,,誰將放大未來的贏面,。 影響格局的關(guān)鍵因素在重新披掛上陣之后,三大巨頭的對決也將火力全開,。 除了應(yīng)對“xPU ”的架構(gòu)創(chuàng)新,、生態(tài)構(gòu)建和執(zhí)行力的持續(xù)考驗(yàn)之外,真要實(shí)現(xiàn)超異構(gòu)計(jì)算,,不得不說,,制程和封裝才是將理念化為實(shí)際產(chǎn)品的關(guān)鍵。 先說工藝,,以及相關(guān)的產(chǎn)能因素,。 無論是 CPU、GPU 還是 DPU,、FPGA,,都是先進(jìn)工藝的先行者。要想與一眾高手對決,采用最先進(jìn)的工藝當(dāng)是王道,。 近期有消息顯示,,臺積電在其 3nm 工藝良率方面存在困難,如果 3nm 良率問題繼續(xù)存在,,許多客戶可能會延長 5nm 工藝節(jié)點(diǎn)的使用時(shí)間,,從而影響客戶諸如 AMD、英特爾,、英偉達(dá)的芯片出貨,。 這使得產(chǎn)能緊缺導(dǎo)致的供應(yīng)瓶頸成為他們面臨的阻力之一。正如英偉達(dá)發(fā)布財(cái)報(bào)時(shí)表示,,鑒于全球芯片和晶圓生產(chǎn)能力短缺,,未來供應(yīng)方面限制仍將是一個(gè)不利因素。據(jù)報(bào)道,,英偉達(dá)已在 2021 年第三季度預(yù)付臺積電約 16.4 億美元,,并將在 2022 年第一季度支付 17.9 億美元,整個(gè)長期訂單預(yù)付款將達(dá)到 69 億美元,,遠(yuǎn)高于他們之前支付的價(jià)格,。 相對于英偉達(dá)和 AMD,英特爾的優(yōu)勢是其正在大力發(fā)展的代工業(yè)務(wù),。雖然目前在代工方面英特爾技術(shù)尚未突破 5nm,,但如果按照其技術(shù)路線圖,2025 年將可看齊臺積電的代工水平,?;蛟S,屆時(shí)英特爾可全力支撐自己的先進(jìn)制程設(shè)計(jì),,在 x86,、Arm 和 RISC-V 的異構(gòu)整合層面更加游刃有余,并在產(chǎn)能保障上優(yōu)先供應(yīng),,其 IDM 2.0 戰(zhàn)略背后的深意或比想象得更加深遠(yuǎn),。 此外,異構(gòu)計(jì)算繞不過去的就是異構(gòu)集成和先進(jìn)封裝,。異構(gòu)集成與先進(jìn)封裝技術(shù)的進(jìn)步使在單個(gè)封裝內(nèi)構(gòu)建復(fù)雜系統(tǒng)成為了可能,,能夠快速達(dá)到異構(gòu)計(jì)算系統(tǒng)內(nèi)的芯片所需要的功耗、體積,、性能的要求,。 在先進(jìn)封裝層面,看起來作為傳統(tǒng) IDM 的英特爾似乎更具優(yōu)勢,,而 AMD 原本也是 IDM,,只是后來將芯片制造業(yè)務(wù)剝離出去了,,但該公司依然具備制程和封裝的基因。過去幾年,,AMD 因其率先推向市場的 chiplet 和互連技術(shù)而占得了先機(jī),,在此基礎(chǔ)上,該公司推出了新一代封裝技術(shù),,也就是 3D 堆疊 V-Cache,。在這方面,賽靈思也可為 AMD 提供幫助,,因?yàn)橘愳`思已為其自適應(yīng) FPGA 平臺構(gòu)建了一系列高性能封裝和互連技術(shù),。 對于英偉達(dá)而言,作為一家純粹的 Fabless,,在異構(gòu)整合的制程和封裝方面略遜于英特爾和 AMD,,不僅在高性能應(yīng)用領(lǐng)域,在制程和封裝方面對合作伙伴的依賴度更高一些,。 對比之下,,英特爾多路并進(jìn),在 Co-EMIB,、UCIe,、Foveros 等方面不斷推進(jìn)。特別是在 3D 封裝部分,,英特爾已推出 Foveros Direct,,實(shí)現(xiàn)了向直接銅對銅鍵合的轉(zhuǎn)變,通過 HBI 技術(shù)以實(shí)現(xiàn) 10 微米以下的凸點(diǎn)間距,,讓不同芯片之間可實(shí)現(xiàn) 10 倍以上的互聯(lián)密度提升,。而且前不久其為超算研發(fā)的頂級加速卡 Ponte Vecchio,集成晶體管數(shù)量突破 1000 億個(gè),,使用 5 種不同的制造工藝,,在內(nèi)部封裝了多達(dá) 47 個(gè)不同的單元 (Tile),成為采用 Foveros 的 3D 堆疊封裝技術(shù)和 Co-EMIB 連接技術(shù)的“集大成者”,。 據(jù)咨詢機(jī)構(gòu) Yole Developpement 數(shù)據(jù)顯示,,2021 年半導(dǎo)體廠商在先進(jìn)封裝領(lǐng)域的資本支出約為 119 億美元,。該機(jī)構(gòu)表示,,2021 年先進(jìn)封裝市場體量約為 27.4 億美元,同時(shí)預(yù)測該市場到 2027 年將實(shí)現(xiàn) 19% 的復(fù)合年化增長率,,屆時(shí)先進(jìn)封裝市場體量將達(dá)到每年 78.7 億美元,。 如此來看,未來的爭奪也將在架構(gòu)創(chuàng)新,、工藝,、封裝等全面展開,,在這些方面三大巨頭或需面面俱到。 |
|