Nvidia 的新顯卡架構(gòu) Maxwell 性能相比開普勒提升了多少？

數(shù)據(jù)說不定 2018-03-07

展開全文

現(xiàn)在Nvidia的節(jié)奏基本上是一個結(jié)構(gòu)用兩年,。類似于intel的鐘擺計劃,。
我們先先談?wù)勯_普勒架構(gòu)之前的費(fèi)米架構(gòu)好了。
費(fèi)米的本質(zhì)是什么,，英偉達(dá)只要用他來搞通用計算的還有DX11（這個涉及當(dāng)年的環(huán)境問題）,。
費(fèi)米架構(gòu)提出了GPC和SM的結(jié)構(gòu)概念。每一個GPC則有4個SM,，sm里面有32個CUDA,，每個CUDA Core是一個統(tǒng)一的處理器核心，執(zhí)行頂點,，像素,，幾何和kernel函數(shù)，然后有16個儲存單元和8個特殊單元,。
上面一段話的意思是,GPC是一個很完整的GPU,而且細(xì)分的十分完整,。
所以你會看到高中低端是這么分配的低端一個，中端兩個,，高端四個,。
大家會不會想到CPU呢。,。單核,，雙核，四核,。,。大概就是思路。,。
然后又引入了一二級緩存這種東西,。。大家詳細(xì)了解自己去搜相關(guān)東西吧,。,。

而AMD當(dāng)時的思路跟Nvidia不一樣的是，堅持用simd,。至于為什么,？可能是AMD和ATI整合，也可能是ATI做過游戲機(jī)的芯片制造,，這個不好推斷）
大的核心里面有Shader單元,，每個Shader內(nèi)部有5個ALU單元,。
五個ALU處理完了之后一起上傳，而CUDA Core是直接上傳了,，這就是mimd,。
看到ZOL論壇有一個很好的比方。,。我就粗略說說意思（傳送門【NV 開普勒架構(gòu)解析篇】）
AMD就是一輛戰(zhàn)車,，然后一個馬拉著戰(zhàn)車（發(fā)射端和控制邏輯端），上面有五個家伙,。弓箭手啊,，戰(zhàn)士，扔斧子的,。
費(fèi)米就是騎兵,。。
戰(zhàn)車雖然相比較騎兵發(fā)揮不出一個人的優(yōu)勢,。但是養(yǎng)馬在古代很貴的好吧,，就算現(xiàn)在也很貴好吧。,。
戰(zhàn)車上有五個漢子,，相當(dāng)于馬加五個人，而騎兵是一個馬加一個人,。
性價比肯定是戰(zhàn)車好,。
但是數(shù)量到了一定程度。史實是大兵團(tuán)對戰(zhàn)時,，騎兵可以用經(jīng)典的魔獸戰(zhàn)術(shù)hit and run對付戰(zhàn)車,，先遭遇，一輪齊射,，射完馬上后撤，迂回一圈再過來齊射,，射完再后撤········（中世紀(jì)時曾經(jīng)很虎的東歐戰(zhàn)車軍就是這樣被蒙古騎兵團(tuán)滅的,，西征波蘭戰(zhàn)役的虐殺）。中世紀(jì)開始大家都發(fā)現(xiàn)了,，一旦戰(zhàn)爭規(guī)模玩大了,，只能用騎兵，再貴也得用,。
Nvidia依舊保持卡皇身份,，但是中低端的AMD高功耗比和性價比虐殺。
顯卡跟騎兵不一樣的是,。,。你弄了那么多馬（發(fā)射器和控制邏輯）,，那玩意是要發(fā)熱的。,。而且也是要占晶體管的,。
所以你就看到核彈這個詞的產(chǎn)生了。,。,。熱得要死，晶體管多的要命,。
詳細(xì)請看傳送門
寫的挺好的（對了要不要找別人授權(quán)啥的,。。我沒這意識啊,。,。）
總結(jié)一下就是AMD追求數(shù)量，而Nvidia追求效率,。,。
后來AMD發(fā)覺在這么玩下去不行，畢竟規(guī)模越來越大了,。,。也開始制造騎兵了，再貴也得用,。,。。就是tahtil架構(gòu),。

然后我們回到開普勒架構(gòu),。。
開普勒開始追求所謂的能耗,，如何追求能耗的呢,？降低控制邏輯單元和指令發(fā)射器的比例，,，用較少的邏輯單元去控制更多的CUDA核心,，增加吞吐量啊等等方面。

但是關(guān)鍵還是在調(diào)度的機(jī)制,。
減少了調(diào)度的模塊,，才能擁有非常多的cuda（也就是工作單位）

通過軟件把GPU用來分配工作的任務(wù)，來交給了CPU,。

還有關(guān)鍵的幾點是制程的改進(jìn),，用了臺積電的28mm，ddr5的顯卡內(nèi)存,，動態(tài)提速（類似睿頻的概念）等,。
nvidia 在全面優(yōu)化各方面,，梳理各方面的思緒。方方面面的優(yōu)化,，只為了追求效率和功耗比,。
最后說說 Maxwell 架構(gòu)

相比較開普勒架構(gòu)的

。,。,。能夠更好的檢測到每一個cuda的狀態(tài)（因為每一個sm單元控制的cuda單元減少），并且通過時鐘調(diào)節(jié)來控制每一個效率,。
,，增加了二級緩存。,。集成了NVENC,，能在視頻解碼的僅僅靠NVENC模塊，讓GPU休眠,。,。當(dāng)然還有很多

第一次寫這個，然后好多資料是日語,，英語的,。我這方面好渣，就先默默搜集,，以后在啃,。，借鑒了一些國內(nèi)有質(zhì)量新聞的東西,。,。比如說中關(guān)村的顧杰。,。寫的還是貨比較多的,。、,。

其實我感覺Nvidia每一代繼承了上一代并且在各方面進(jìn)行改進(jìn),。。
~
~~~~~~~~~~~~~~~~~~~~實際情況~~~~~~~~~~~
gtx750TI是maxwell架構(gòu) gtx660 650ti是開普勒架構(gòu) hd7850是Tahiti架構(gòu)

跑分

功耗

本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,，所有內(nèi)容均由用戶發(fā)布,，不代表本站觀點,。請注意甄別內(nèi)容中的聯(lián)系方式,、誘導(dǎo)購買等信息，謹(jǐn)防詐騙,。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,，請點擊一鍵舉報,。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自：數(shù)據(jù)說不定 > 《處理器》

舉報/認(rèn)領(lǐng)