美國得克薩斯州奧斯汀,AMD總部所在地,,EPYC(霄龍)到來了,。全新的品牌、全新的產(chǎn)品,、全新的架構(gòu),,趁著上半年Zen架構(gòu)消費級處理器Ryzen大熱,,AMD再次向企業(yè)級市場進軍,這是其皓龍(Opteron)系列CPU中斷之后的回歸,。在AMD官網(wǎng)上,,產(chǎn)品介紹仍停留在5年前Piledriver架構(gòu)的6300系列,然而對于近年蓬勃發(fā)展的x86高性能計算領(lǐng)域,,5年無異于另一個世代,。 當?shù)貢r間6月20日下午,AMD正式發(fā)布了EPYC,,這款產(chǎn)品采用了Zen架構(gòu),,此前已經(jīng)泄露很多,硬件規(guī)格可謂非常豪華:32核64線程,、8通道DDR4內(nèi)存,、128個PCI-E 3.0 lanes……在Ryzen光環(huán)下,EPYC可謂吊足了消費者的胃口,,那個能與英特爾一爭高下的CPU廠商AMD又回來了,。 2017年,AMD的各類產(chǎn)品可謂全面升級和四處開花,,先有消費級的CPU和GPU:Ryzen和Vega架構(gòu)Radeon顯示卡,,后有微軟在E3上推出基于AMD半定制芯片的Xbox One X游戲主機。如今EPYC發(fā)布,,稍后還有Ryzen Pro——面向商業(yè)應(yīng)用的處理器平臺和Radeon Instinct計算加速卡,。這些產(chǎn)品全部以新技術(shù)為支撐,圍繞著CPU和GPU這兩個AMD強勢產(chǎn)品展開,,當然,,年底的第8代APU仍將賺足眼球。 EPYC可謂AMD勵精圖治推出的產(chǎn)品,,當年Opteron曾經(jīng)占據(jù)1/3的市場份額,。但它和英特爾進軍移動處理器一樣,都不順利,,即使AMD看到了云計算的機會,,跟進推出ARM架構(gòu)的Opteron X,在面對整體業(yè)務(wù)收縮時,,企業(yè)級市場首先被放棄,。而就在這幾年,x86在高性能計算領(lǐng)域蓬勃發(fā)展,,如今已經(jīng)從小眾產(chǎn)品成為市場的絕對主流,,這個過程中AMD早已被邊緣化。在技術(shù)出身的Lisa Su領(lǐng)導下,,AMD重新走上了技術(shù)主導型的發(fā)展道路,,Zen架構(gòu)年初首秀以來,,已經(jīng)贏得相當不錯的消費者口碑,而回歸企業(yè)級市場,,也早在其計劃之內(nèi),。 和英特爾的技術(shù)策略一樣,EPYC和Ryzen有著相同的核心架構(gòu),,這有利于最大化微架構(gòu)設(shè)計優(yōu)勢,,經(jīng)過不同層面的加強和優(yōu)化,又能滿足不同定位市場的需求,。 今天AMD所推出的初代EPYC產(chǎn)品選用了7000作為產(chǎn)品編號,,不僅有延續(xù)Opteron 6000的顯性含義,也有壓競爭對手英特爾Xeon E5一頭的小心思,。不過,,Xeon E5的產(chǎn)品線跨度更大,編號首位數(shù)字代表系統(tǒng)最大處理器配置數(shù)量,,因此分別為1P,、2P和4P幾條產(chǎn)品線,而EPYC 7000主要對標2P平臺的E5-2600 v4,,目前最高規(guī)格產(chǎn)品為E5-2699A v4,,22核心44線程、代號Broadwell-EP,,去年4月間發(fā)布,。相比之下,Xeon E3系列已經(jīng)更新到Kaby Lake架構(gòu)(7代酷睿),,而E5-2600系列的更新則初步定于今年Q3,,代號Skylake-SP。不要被Skylake-SP的代號迷惑了,,它并非6代酷睿架構(gòu)的延伸,,而已經(jīng)采用了Kaby Lake的14nm++的制程工藝。之所以一年多沒有更新,,E5-2600 v5醞釀著大變革,,也將成為已經(jīng)發(fā)布的EPYC 7000能否在企業(yè)級市場立足的最大變量,它才是EPYC 7000真正的對手,,而E5-2600 v4并不對位,。 不過,無論如何,,Ryzen 7以8核技驚四座,已經(jīng)讓市場注意到AMD的聲音,,截止發(fā)稿時,,AMD發(fā)布會尚未開始,,其股價當天上漲8%,而英特爾則下跌1%,。 除了我們已經(jīng)熟知的Zen核心,,對于擁有眾多處理器核心的企業(yè)級產(chǎn)品,核心互聯(lián)技術(shù)則更為關(guān)鍵,,在CCX(集成4核心及共用L3 Cache)模塊上,,嶄露頭角的Infinity Fabric就是這位關(guān)鍵先生。按照AMD的定義,,Infinity Fabric包括數(shù)據(jù)和指令兩個可擴展的Fabric,,分別稱為SDF和SCF,從核心到CCX,、從CCX到DIE,、從DIE到Socket、從Socket到Socket/GPU等4級架構(gòu)全部采用Infinity Fabric連接,,而不同鏈路的速度有所差異,。 SCF和SDF的控制方式。 單顆CPU上4個CCX兩兩間直接連接,,單連接雙向帶寬為42GB/s,。 2P系統(tǒng)中,每顆CPU中的每個CCX將以16個PCI-E 3.0lanes作為互聯(lián)Infinity Fabric通道,,連接到另一顆CPU中對應(yīng)ID的CCX,、38GB/s的雙向帶寬,即各CPU各以64個lanes的性能帶來總計152GB/s的CPU間互聯(lián)帶寬,。 根據(jù)此前Ryzen發(fā)布時的信息,,DIE上兩個CCX采用43GB/s(配備DDR4-2666規(guī)格內(nèi)存)的Infinity Fabric互聯(lián),而CCX內(nèi)核心互聯(lián)速度為175GB/s——6條Infinity Fabric,。 如此4級級聯(lián)的設(shè)計,,明顯為成本和堆核進行優(yōu)化,雖然顯性的帶寬指標不見得太差,,但是各級延遲會非常嚴重,,兩個核心交換數(shù)據(jù)的最壞可能是經(jīng)過多達7級不同速度組合的傳輸,性能劣化到千倍于CCX內(nèi)數(shù)據(jù)交換,。AMD顯然注意到這樣的問題,,一方面沒有公布任何有關(guān)延遲的數(shù)據(jù),另一方面積極和微軟等OS廠商合作進行相關(guān)優(yōu)化,,從OS層級優(yōu)化數(shù)據(jù)傳輸路徑,,減少在如此大跨度的核心間調(diào)用數(shù)據(jù)。 無論如何,,在高并行性的企業(yè)級應(yīng)用中,,EPYC核心數(shù)量及執(zhí)行效率上的優(yōu)勢依舊誘人,,在發(fā)布前一天進行的技術(shù)溝通會上,AMD著重展示了新產(chǎn)品在負載及計算性能方面的優(yōu)勢,,以及能效比方面的變化,。另外,憑借靈活的Infinity Fabric互聯(lián)架構(gòu)設(shè)計,,EPYC 7000可以很靈活地搭配CPU和GPU組合,,Infinity Fabric既可以連接起兩顆CPU,也可以連接AMD最新推出的Radeon Instinct加速計算卡——另一款殺手產(chǎn)品,。 AMD一口氣推出3款Radeon Instinct異構(gòu)計算架構(gòu)產(chǎn)品,,分別采用了Fiji核心的M18、Polar核心的M16和Vega核心的M125,,甚至還有一款名叫Radeon Vega Frontier Edition旗艦產(chǎn)品即將發(fā)貨,。借用超級多的計算核心,Radeon Instinct可以實現(xiàn)強大的并行計算性能,,可以為云計算,、人工智能、深度學習等領(lǐng)域提供計算加速,,AMD為此還提供了ROCm 1.6開放軟件優(yōu)化平臺和MIOpen深度學習開發(fā)平臺,,方便用戶充分調(diào)用EPYC和Radeon Instinct的優(yōu)化特性。 在英特爾的Xeon+Xeon Phi/Nervana/FPGA,、NVIDIA的Tesla之外,,EPYC+Radeon Instinct成為通用人工智能平臺的第三選項。 價格和端口擴展能力是EPYC的主要競爭優(yōu)勢,,相比各有不同優(yōu)化和用戶需求的性能,,唯有價格和端口優(yōu)勢不可破。雖然AMD一口氣推出的產(chǎn)品多達12款,,但是選擇仍算不上豐富,,因此集中精力主攻單路和入門雙路市場是EPYC目前的定位,在此基礎(chǔ)上進一步突出性價比優(yōu)勢,,最后列出的價格相當有殺傷力,。
|
|