現(xiàn)在Nvidia的節(jié)奏基本上是一個結(jié)構(gòu)用兩年,。類似于intel的鐘擺計劃,。 我們先先談?wù)勯_普勒架構(gòu)之前的費(fèi)米架構(gòu)好了。 費(fèi)米的本質(zhì)是什么,,英偉達(dá)只要用他來搞通用計算的還有DX11(這個涉及當(dāng)年的環(huán)境問題),。 費(fèi)米架構(gòu)提出了GPC和SM的結(jié)構(gòu)概念。每一個GPC則有4個SM,,sm里面有32個CUDA,,每個CUDA Core是一個統(tǒng)一的處理器核心,執(zhí)行頂點,,像素,,幾何和kernel函數(shù),然后有16個儲存單元和8個特殊單元,。 上面一段話的意思是,GPC是一個很完整的GPU,而且細(xì)分的十分完整,。 所以你會看到高中低端是這么分配的低端一個,中端兩個,,高端四個,。 大家會不會想到CPU呢。,。單核,,雙核,四核,。,。大概就是思路。,。 然后又引入了一二級緩存這種東西,。。大家詳細(xì)了解自己去搜相關(guān)東西吧,。,。
而AMD當(dāng)時的思路跟Nvidia不一樣的是,堅持用simd,。至于為什么,?可能是AMD和ATI整合,也可能是ATI做過游戲機(jī)的芯片制造,,這個不好推斷) 大的核心里面有Shader單元,,每個Shader內(nèi)部有5個ALU單元,。 五個ALU處理完了之后一起上傳,而CUDA Core是直接上傳了,,這就是mimd,。 看到ZOL論壇有一個很好的比方。,。我就粗略說說意思(傳送門【NV 開普勒 架構(gòu)解析篇】) AMD就是一輛戰(zhàn)車,,然后一個馬拉著戰(zhàn)車(發(fā)射端和控制邏輯端),上面有五個家伙,。弓箭手啊,,戰(zhàn)士,扔斧子的,。 費(fèi)米就是騎兵,。。 戰(zhàn)車雖然相比較騎兵發(fā)揮不出一個人的優(yōu)勢,。但是養(yǎng)馬在古代很貴的好吧,,就算現(xiàn)在也很貴好吧。,。 戰(zhàn)車上有五個漢子,,相當(dāng)于馬加五個人,而騎兵是一個馬加一個人,。 性價比肯定是戰(zhàn)車好,。 但是數(shù)量到了一定程度。史實是大兵團(tuán)對戰(zhàn)時,,騎兵可以用經(jīng)典的魔獸戰(zhàn)術(shù)hit and run對付戰(zhàn)車,,先遭遇,一輪齊射,,射完馬上后撤,迂回一圈再過來齊射,,射完再后撤········(中世紀(jì)時曾經(jīng)很虎的東歐戰(zhàn)車軍就是這樣被蒙古騎兵團(tuán)滅的,,西征波蘭戰(zhàn)役的虐殺)。中世紀(jì)開始大家都發(fā)現(xiàn)了,,一旦戰(zhàn)爭規(guī)模玩大了,,只能用騎兵,再貴也得用,。 Nvidia依舊保持卡皇身份,,但是中低端的AMD高功耗比和性價比虐殺。 顯卡跟騎兵不一樣的是,。,。你弄了那么多馬(發(fā)射器和控制邏輯),,那玩意是要發(fā)熱的。,。而且也是要占晶體管的,。 所以你就看到核彈這個詞的產(chǎn)生了。,。,。熱得要死,晶體管多的要命,。 詳細(xì)請看傳送門 寫的挺好的(對了 要不要找別人授權(quán)啥的,。。我沒這意識啊,。,。) 總結(jié)一下就是AMD追求數(shù)量,而Nvidia追求效率,。,。 后來AMD發(fā)覺在這么玩下去不行,畢竟規(guī)模越來越大了,。,。也開始制造騎兵了,再貴也得用,。,。。就是tahtil架構(gòu),。
然后我們回到開普勒架構(gòu),。。 開普勒開始追求所謂的能耗,,如何追求能耗的呢,?降低控制邏輯單元和指令發(fā)射器的比例,,,用較少的邏輯單元去控制更多的CUDA核心,,增加吞吐量啊等等方面。
但是關(guān)鍵還是在調(diào)度的機(jī)制,。 減少了調(diào)度的模塊,,才能擁有非常多的cuda(也就是工作單位) 通過軟件把GPU用來分配工作的任務(wù),來交給了CPU,。
還有關(guān)鍵的幾點是制程的改進(jìn),,用了臺積電的28mm,ddr5的顯卡內(nèi)存,,動態(tài)提速(類似睿頻的概念)等,。 nvidia 在全面優(yōu)化各方面,,梳理各方面的思緒。方方面面的優(yōu)化,,只為了追求效率和功耗比,。 最后說說 Maxwell 架構(gòu)
相比較開普勒架構(gòu)的
。,。,。能夠更好的檢測到每一個cuda的狀態(tài)(因為每一個sm單元控制的cuda單元減少),并且通過時鐘調(diào)節(jié)來控制每一個效率,。 ,,增加了二級緩存。,。集成了NVENC,,能在視頻解碼的僅僅靠NVENC模塊,讓GPU休眠,。,。當(dāng)然還有很多
第一次寫這個,然后好多資料是日語,,英語的,。我這方面好渣,就先默默搜集,,以后在啃,。,借鑒了一些國內(nèi)有質(zhì)量新聞的東西,。,。比如說中關(guān)村的顧杰。,。寫的還是貨比較多的,。、,。
其實我感覺Nvidia每一代繼承了上一代并且在各方面進(jìn)行改進(jìn),。。 ~ ~~~~~~~~~~~~~~~~~~~~實際情況~~~~~~~~~~~ gtx750TI是maxwell架構(gòu) gtx660 650ti是開普勒架構(gòu) hd7850是Tahiti架構(gòu) 跑分 功耗
|