在2019年6月初,,手機(jī)圈傳出了一個(gè)重磅的消息——AMD與三星聯(lián)合宣布達(dá)成多年戰(zhàn)略合作伙伴關(guān)系,三星將獲得AMD Radeon圖形API授權(quán)并專注于加強(qiáng)移動(dòng)設(shè)備(只限智能手機(jī)和平板電腦等AMD沒有參與競爭的細(xì)分市場)創(chuàng)新至關(guān)重要的高級(jí)圖形技術(shù)和解決方案,。官方透露的細(xì)節(jié)不多,,暫時(shí)只能確認(rèn)AMD會(huì)將“高度可擴(kuò)展的RDNA圖形架構(gòu)”對(duì)三星授權(quán)。簡單來說,RDNA(Radeon DNA)是AMD在顯卡領(lǐng)域推出的最新GPU架構(gòu),,它是史上最長壽GPU架構(gòu)“GCN”(2011年~2019年)的接班人,,其在CU計(jì)算單元、緩存,、流水線等方面都進(jìn)行了革新,,擁有更好的性能(滿足現(xiàn)代游戲的負(fù)載需求)、能效(充分優(yōu)化功耗和帶寬利用率),、功能(壯大相關(guān)生態(tài))和擴(kuò)展能力(通吃移動(dòng),、桌面和云端)。可以說,,RDNA是一個(gè)全方位重新設(shè)計(jì)的架構(gòu),,也開啟了AMD顯卡歷史上第五個(gè)重大架構(gòu)的新時(shí)代。那么,,三星未來的Exynos(獵戶座)移動(dòng)平臺(tái)會(huì)直接集成RDNA架構(gòu)的GPU嗎,?答案自然是否定的。AMD長期以來都缺乏ARM生態(tài)的經(jīng)驗(yàn)(AMD曾涉足過ARM服務(wù)器,,但很快就放棄了),,而手機(jī)SoC集成GPU最核心的要求就是低功耗和高能效,AMD現(xiàn)有的GPU技術(shù)顯然不符合移動(dòng)設(shè)備的基本訴求,。實(shí)際上,三星近些年一直在進(jìn)行CPU和GPU的自研(自主研發(fā))工作,,在CPU架構(gòu)領(lǐng)域已經(jīng)有了基于ARM指令集自研成功的“貓鼬”(Mongoose,,如Exynos M3/M4)核心,,并在通過Exynos 9810和Exynos 9820等移動(dòng)平臺(tái)打出了不小的聲望。在GPU領(lǐng)域,,有消息稱三星早在2012年就開展了自研“S-GPU”的項(xiàng)目,,此次三星與AMD方面合作,需要的只是在GPU中融入AMD Radeon的部分圖形 IP,,不可能照搬整個(gè)RDNA架構(gòu),。同時(shí),雙方合作還涉及到相關(guān)的專利授權(quán),,規(guī)避將來可能的法律糾紛,,畢竟聯(lián)發(fā)科就是一個(gè)很好的前車之鑒。2015年的MWC大展上,,有消息稱聯(lián)發(fā)科在移動(dòng)SoC圖形計(jì)算領(lǐng)域與AMD達(dá)成合作,,而這則消息最終也沒有被官方證實(shí)。2019年初,,AMD將聯(lián)發(fā)科告上了法庭,,稱聯(lián)發(fā)科的智能設(shè)備侵犯了其APU和GPU相關(guān)的多項(xiàng)專利。要知道,,聯(lián)發(fā)科旗下的SoC集成的都是ARM或Imagination旗下的GPU,。有了AMD圖形IP的注入,可以讓三星將更多的精力投入到對(duì)自研CPU核心“貓鼬”的打磨之中,,而AMD在PC領(lǐng)域的知名度,,也可幫助三星與高通、華為和聯(lián)發(fā)科展開差異化競爭——看到?jīng)],?我集成的可是AMD GPU,!與此同時(shí),當(dāng)三星Exynos CPU和集成AMD RDNA基因的GPU搭配后,,也許還會(huì)對(duì)一個(gè)產(chǎn)業(yè)造成沖擊,,它就是以任天堂Switch為代表的游戲掌機(jī)。三星+AMD能否取代英偉達(dá)Tegra X1和其后續(xù)芯片在掌機(jī)領(lǐng)域的獨(dú)占,?讓我們拭目以待吧,。高通驍龍移動(dòng)平臺(tái)集成的Adreno GPU,應(yīng)該是Android手機(jī)領(lǐng)域的最強(qiáng)音,,也是唯一可以和同期蘋果A系列芯片集成GPU抗衡的存在,。但你可曾知道,作為高通獨(dú)有的“自研”GPU,,Adreno原本也是AMD的“血脈”嗎,?Adreno的前身其實(shí)是誕生于2002年的ATI Imageon系列低功耗GPU,原本是被用于預(yù)裝PalmOS系統(tǒng)的Zodiac掌機(jī),。ATI被AMD收購后,,AMD又將相關(guān)的移動(dòng)設(shè)備資產(chǎn)在2008年打包甩給了高通,,于是后者就取得了AMD(ATI)的矢量繪圖與3D繪圖技術(shù)和相關(guān)知識(shí)產(chǎn)權(quán),并在此基礎(chǔ)上研發(fā)出了我們熟悉的Adreno GPU,。如果AMD當(dāng)年沒有賣掉原ATI Imageon,,英特爾當(dāng)年沒有出售XScale(擁有StrongARM與ARM架構(gòu)的完整授權(quán))及手持設(shè)備芯片業(yè)務(wù),這兩大X86芯片巨頭也許都會(huì)在移動(dòng)互聯(lián)網(wǎng)時(shí)代取得更大的成就,。在Android手機(jī)領(lǐng)域,,高通驍龍移動(dòng)平臺(tái)占據(jù)了大半江山,Adreno也是我們熟悉和最不熟悉的GPU,。說它熟悉,,是因?yàn)楦咄看伟l(fā)布新款驍龍移動(dòng)平臺(tái)時(shí),媒體總會(huì)強(qiáng)調(diào)它集成了Adreno xxx型號(hào)的GPU,,較上代提升了多少多少,,耳朵都磨出繭了;說它不熟悉,,是因?yàn)锳dreno GPU型號(hào)太多太亂,,以至于我們很難從名稱上去判斷同一代的Adreno GPU之間相對(duì)的性能等級(jí)。這一點(diǎn)在Adreno 5系GPU時(shí)期表現(xiàn)得尤為明顯(見下表),。比如,,Adreno 506(驍龍625)從型號(hào)數(shù)字上只比Adreno 505(驍龍430)+1,但前者的性能卻較后者提升了幾乎2倍,。Adreno 508(驍龍630)比Adreno 506+2,,但其性能卻只提升了30%,完全沒有規(guī)律可言,。為了搞明白上面的問題,,我們需要了解影響Adreno GPU性能的關(guān)鍵參數(shù)。拋開核心架構(gòu),、渲染方式和各種圖形接口不談,,Adreno GPU的性能發(fā)揮主要受制于制程工藝、ALU(計(jì)算單元,,又稱算數(shù)邏輯單元)的數(shù)量以及GPU頻率的高低,。我們可以將Adreno GPU集成的ALUs計(jì)算單元理解為PC顯卡中的“流處理器”,在架構(gòu)相同時(shí)數(shù)量越多性能越強(qiáng),。可惜,,高通官方從來沒有公開過Adreno GPU的ALUs數(shù)量,本文和網(wǎng)上相關(guān)的數(shù)據(jù)都是用戶自己檢測所得,,因此僅供大家參考,。對(duì)GPU而言,制程工藝越先進(jìn),在相同的發(fā)熱和功耗水平上就能以更高頻率運(yùn)行,,對(duì)性能同樣有著較大的增益效果,。Adreno 506相較Adreno 505有著巨大的性能提升,就是得益于更多的ALUs數(shù)量和工藝升級(jí)帶來的頻率提升,。同理,Adreno 512相較Adreno 508,、Adreno 530相較Adreno 512也都是受上述因素的影響,。如今,Adreno GPU已經(jīng)全面進(jìn)化到了Adreno 6系時(shí)代,,其最大的特色是支持完整的OpenCL 2.0FP,、OpenGL ES3.2、DX12和Vulkan1.1等圖形接口,。可惜,,關(guān)于它們具體的ALUs數(shù)量和頻率,筆者并沒能找到準(zhǔn)確的資料,,所以本文我們只通過3DMark和GFXBench這兩個(gè)專業(yè)測試軟件,,對(duì)Adreno 6系GPU的理論性能進(jìn)行一番對(duì)比(見下表)。我們以驍龍660集成的Adreno 512作為基準(zhǔn)(100%),,可以更加直觀地了解Adreno 6系GPU的差異,。其中,Adreno 610和Adreno 612雖然數(shù)字序列更高,,但綜合性能其實(shí)和Adreno 512相差無幾,。從Adreno 615到Adreno 618之間的性能依次略增,在其背后就是不同ALUs單元和GPU頻率組合帶來的差異,。作為高通2018年度的旗艦,,驍龍845(Adreno 630)之所以具備秒殺高通最新推出驍龍730(Adreno 618)的3D性能,是因?yàn)锳dreno 630集成了高達(dá)512個(gè)ALUs單元,,而驍龍730的ALUs應(yīng)該是不足256個(gè)(很抱歉沒找到具體的參數(shù)),。需要注意的是,從2018年下半年開始,,高通最新推出的驍龍SoC移動(dòng)平臺(tái)都強(qiáng)化了AI運(yùn)算能力,,它們會(huì)借助一部分GPU內(nèi)的ALUs單元,再結(jié)合Hexagon內(nèi)集成的HVX單元,,與CPU一起組成高通特有的驍龍AI Engine人工智能平臺(tái),。換句話說,在最新的驍龍移動(dòng)平臺(tái)中,,更多的ALUs單元并不能換來等同的性能提升,。以驍龍855為例,高通曾透露這顆芯片(較驍龍845)增加了50%的算數(shù)邏輯單元,也就是ALUs單元從512個(gè)提升到了768個(gè),,但從Adreno 640和Adreno 630之間的實(shí)際性能差異來看,,增加的50%的ALUs僅換來了20%左右的性能增益,顯然其中有不少被高通拿來用于AI運(yùn)算了,。據(jù)一些專業(yè)人士測試分析,,Adreno 630的512個(gè)ALUs中有一半(256)都用做了異構(gòu)AI運(yùn)算,用于彌補(bǔ)驍龍移動(dòng)平臺(tái)沒有獨(dú)立NPU單元的缺陷,。總之,,驍龍移動(dòng)平臺(tái)中“最能打”的無非就是驍龍845和驍龍855,驍龍7系和驍龍6系的GPU之間也存在不小的差距,。因此,,如果你希望購買一款能以滿幀運(yùn)行絕大多數(shù)游戲的手機(jī),認(rèn)準(zhǔn)驍龍8系還是很有必要的,。至于驍龍6系,,在驍龍710都降到千元價(jià)位之際,除非你不怎么玩游戲,,否則還是敬而遠(yuǎn)之吧,。在智能手機(jī)領(lǐng)域,目前能憑自己打造GPU的芯片設(shè)計(jì)廠商只有高通和蘋果,,高通的Adreno GPU源于AMD,,而蘋果設(shè)備的GPU則離不開Imagination Technologies公司的扶持。Imagination也是很早就進(jìn)軍GPU市場的公司之一,,只是為了避開英偉達(dá)和ATI的鋒芒,,該公司更加專注于對(duì)超低功耗移動(dòng)GPU的打磨,2001年推出的PowerVR MBX GPU曾被集成在英特爾,、飛思卡爾,、德州儀器和三星的SoC上,并成就了第一代iPhone,、諾基亞N95和戴爾Axim X50v(PDA掌上電腦)這些經(jīng)典設(shè)備,。Imagination的第五代PowerVR SGX系列應(yīng)該是知名度最高的GPU(如SGX530、SGX535),,蘋果A4,、三星Exynos和德儀OMAP3系列SoC都是它的客戶,索尼PSV掌機(jī)上集成的也是四核心的PowerVR SGX544MP4,。隨后,,PowerVR逐漸變成了蘋果“獨(dú)占”的GPU,其他品牌(如聯(lián)發(fā)科,、全志,、瑞芯微和晶晨等)即便偶有合作,,集成的PowerVR GPU也多是低端型號(hào),待遇與“金主”蘋果相差甚遠(yuǎn),。然而,,也正是因?yàn)樘^依賴蘋果,為Imagination的沒落埋下了伏筆,。Apple A10處理器應(yīng)該算是蘋果和Imagination的最后一次合作,,其集成的PowerVR GT7600 GPU甚至可以領(lǐng)先同期的Adreno 540(驍龍835),讓iPhone 7系列成為了當(dāng)年性能最強(qiáng)的智能手機(jī)(實(shí)際上每一代iPhone基本都是同期最強(qiáng)),。可惜,,從A11芯片開始,蘋果正式拋棄Imagination而改用自研GPU,,該芯片的GPU配置了6個(gè)著色器核心,每2個(gè)核心共享一個(gè)Texture單元,,類似的設(shè)計(jì)和PowerVR GPU很像,,所以有不少玩家都稱蘋果GPU是腳踏Imagination上位的——蘋果自研GPU的消息傳出后,Imagination很快就陷入了運(yùn)營危機(jī),,時(shí)至今日只有聯(lián)發(fā)科Helio P60(PowerVR GM9446),、P35和P22(PowerVR GE8320)等極少數(shù)SoC選擇與Imagination合作集成PowerVR GPU,和iOS生態(tài)圈的唯一霸主淪落到GPU領(lǐng)域的“其他”,,Imagination的境遇令人唏噓不已,。目前Imagination最新的GPU解決方案包括PowerVR 9XEP/9XMP/9XTP(定位依次升高),9XEP和9XMP采用了較舊的Rogue架構(gòu),,主要競爭對(duì)手是ARM旗下的Mali-G72,。而9XTP則由最新的Furian架構(gòu)打造,每ALU增加到40條流水線,,支持4K 120FPS,、HDR、Vulkan API,、安卓神經(jīng)計(jì)算API等先進(jìn)技術(shù),,理論上可以用來和ARM Mali-G76/G77抗衡。接下來就輪到ARM自己的“親兒子”,,Mali系列GPU了,。作為和Cortex A系列CPU架構(gòu)搭檔的它,也是Android手機(jī)圈市占率僅次于高通Adreno GPU的存在,,海思麒麟,、三星Exynos、聯(lián)發(fā)科Helio,,我們熟悉的絕大多數(shù)非高通系SoC都直接選擇了與Mali GPU聯(lián)姻,。和Adreno GPU相比,,Mali更加注重GPU的核心數(shù)量,,將較多的GPU核心封裝成一個(gè)更大規(guī)模的GPU矩陣,就是Mali GPU拉升性能的不二法門,。Mali-G76最多可以布置20個(gè)計(jì)算核心比如在Mali-G72時(shí)代,,麒麟970就集成了12個(gè)核心的Mali-G72MP12,三星Exynos 9810更厲害,,一股腦兒塞進(jìn)了18個(gè)核心(Mali-G72MP18),。但是,GPU核心越多,,發(fā)熱量和功耗也將隨之變大,此時(shí)SoC廠商的選擇通常是降低GPU頻率以及關(guān)掉部分核心來達(dá)到控制功耗的目的,。換句話說,,Mali-GPU的核心數(shù)量是存在一個(gè)臨界值的,,超過這個(gè)核心數(shù)量就必須降低GPU頻率,,最終導(dǎo)致增加GPU核心的數(shù)量和對(duì)應(yīng)的性能提升不成比例(1+1<2)。因此,,如何將有限的芯片面積分配給Cortex-A CPU和Mali GPU,,并合理控制Mali GPU的規(guī)模和頻率,發(fā)揮最佳的能效比,,這就ARM交給SoC廠商們的期末考試了,。總之,高通Adreno和ARM Mali是當(dāng)前Android手機(jī)領(lǐng)域的主力,,Adreno GPU的規(guī)格和性能取決于驍龍移動(dòng)平臺(tái)的型號(hào),,比較起來相對(duì)容易。ARM Mali GPU涉及Mali型號(hào)(如Mali-G52,、Mali-G72,、Mali-G76)、核心數(shù)量(后綴是MPx),,以及與它們搭配的CPU架構(gòu)和主頻,,無論是綜合、CPU還是GPU性能都需要我們耗費(fèi)更多精力對(duì)比,。當(dāng)三星帶來AMD授權(quán)IP的自研GPU,,Imagination得到更多SoC芯片廠商的支持,,想想就頭大了吧?因此,,如果你想了解最新移動(dòng)GPU的動(dòng)態(tài)和選購建議,,敬請(qǐng)期待CFan同期的最新報(bào)道吧。
|