久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

Nvidia 的新顯卡架構(gòu) Maxwell 性能相比開普勒提升了多少?

 數(shù)據(jù)說不定 2018-03-07

現(xiàn)在Nvidia的節(jié)奏基本上是一個結(jié)構(gòu)用兩年,。類似于intel的鐘擺計劃,。
我們先先談?wù)勯_普勒架構(gòu)之前的費(fèi)米架構(gòu)好了。
費(fèi)米的本質(zhì)是什么,,英偉達(dá)只要用他來搞通用計算的還有DX11(這個涉及當(dāng)年的環(huán)境問題),。
費(fèi)米架構(gòu)提出了GPC和SM的結(jié)構(gòu)概念。每一個GPC則有4個SM,,sm里面有32個CUDA,,每個CUDA Core是一個統(tǒng)一的處理器核心,執(zhí)行頂點,,像素,,幾何和kernel函數(shù),然后有16個儲存單元和8個特殊單元,。
上面一段話的意思是,GPC是一個很完整的GPU,而且細(xì)分的十分完整,。
所以你會看到高中低端是這么分配的低端一個,中端兩個,,高端四個,。
大家會不會想到CPU呢。,。單核,,雙核,四核,。,。大概就是思路。,。
然后又引入了一二級緩存這種東西,。。大家詳細(xì)了解自己去搜相關(guān)東西吧,。,。

而AMD當(dāng)時的思路跟Nvidia不一樣的是,堅持用simd,。至于為什么,?可能是AMD和ATI整合,也可能是ATI做過游戲機(jī)的芯片制造,,這個不好推斷)
大的核心里面有Shader單元,,每個Shader內(nèi)部有5個ALU單元,。
五個ALU處理完了之后一起上傳,而CUDA Core是直接上傳了,,這就是mimd,。
看到ZOL論壇有一個很好的比方。,。我就粗略說說意思(傳送門【NV 開普勒 架構(gòu)解析篇】
AMD就是一輛戰(zhàn)車,,然后一個馬拉著戰(zhàn)車(發(fā)射端和控制邏輯端),上面有五個家伙,。弓箭手啊,,戰(zhàn)士,扔斧子的,。
費(fèi)米就是騎兵,。。
戰(zhàn)車雖然相比較騎兵發(fā)揮不出一個人的優(yōu)勢,。但是養(yǎng)馬在古代很貴的好吧,,就算現(xiàn)在也很貴好吧。,。
戰(zhàn)車上有五個漢子,,相當(dāng)于馬加五個人,而騎兵是一個馬加一個人,。
性價比肯定是戰(zhàn)車好,。
但是數(shù)量到了一定程度。史實是大兵團(tuán)對戰(zhàn)時,,騎兵可以用經(jīng)典的魔獸戰(zhàn)術(shù)hit and run對付戰(zhàn)車,,先遭遇,一輪齊射,,射完馬上后撤,迂回一圈再過來齊射,,射完再后撤········(中世紀(jì)時曾經(jīng)很虎的東歐戰(zhàn)車軍就是這樣被蒙古騎兵團(tuán)滅的,,西征波蘭戰(zhàn)役的虐殺)。中世紀(jì)開始大家都發(fā)現(xiàn)了,,一旦戰(zhàn)爭規(guī)模玩大了,,只能用騎兵,再貴也得用,。
Nvidia依舊保持卡皇身份,,但是中低端的AMD高功耗比和性價比虐殺。
顯卡跟騎兵不一樣的是,。,。你弄了那么多馬(發(fā)射器和控制邏輯),,那玩意是要發(fā)熱的。,。而且也是要占晶體管的,。
所以你就看到核彈這個詞的產(chǎn)生了。,。,。熱得要死,晶體管多的要命,。
詳細(xì)請看傳送門
寫的挺好的(對了 要不要找別人授權(quán)啥的,。。我沒這意識啊,。,。)
總結(jié)一下就是AMD追求數(shù)量,而Nvidia追求效率,。,。
后來AMD發(fā)覺在這么玩下去不行,畢竟規(guī)模越來越大了,。,。也開始制造騎兵了,再貴也得用,。,。。就是tahtil架構(gòu),。

然后我們回到開普勒架構(gòu),。。
開普勒開始追求所謂的能耗,,如何追求能耗的呢,?降低控制邏輯單元和指令發(fā)射器的比例,,,用較少的邏輯單元去控制更多的CUDA核心,,增加吞吐量啊等等方面。


但是關(guān)鍵還是在調(diào)度的機(jī)制,。
減少了調(diào)度的模塊,,才能擁有非常多的cuda(也就是工作單位)
通過軟件把GPU用來分配工作的任務(wù),來交給了CPU,。

還有關(guān)鍵的幾點是制程的改進(jìn),,用了臺積電的28mm,ddr5的顯卡內(nèi)存,,動態(tài)提速(類似睿頻的概念)等,。
nvidia 在全面優(yōu)化各方面,,梳理各方面的思緒。方方面面的優(yōu)化,,只為了追求效率和功耗比,。
最后說說 Maxwell 架構(gòu)


相比較開普勒架構(gòu)的

。,。,。能夠更好的檢測到每一個cuda的狀態(tài)(因為每一個sm單元控制的cuda單元減少),并且通過時鐘調(diào)節(jié)來控制每一個效率,。
,,增加了二級緩存。,。集成了NVENC,,能在視頻解碼的僅僅靠NVENC模塊,讓GPU休眠,。,。當(dāng)然還有很多

第一次寫這個,然后好多資料是日語,,英語的,。我這方面好渣,就先默默搜集,,以后在啃,。,借鑒了一些國內(nèi)有質(zhì)量新聞的東西,。,。比如說中關(guān)村的顧杰。,。寫的還是貨比較多的,。、,。

其實我感覺Nvidia每一代繼承了上一代并且在各方面進(jìn)行改進(jìn),。。
~
~~~~~~~~~~~~~~~~~~~~實際情況~~~~~~~~~~~
gtx750TI是maxwell架構(gòu) gtx660 650ti是開普勒架構(gòu) hd7850是Tahiti架構(gòu)
跑分 
功耗

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,,所有內(nèi)容均由用戶發(fā)布,,不代表本站觀點,。請注意甄別內(nèi)容中的聯(lián)系方式,、誘導(dǎo)購買等信息,謹(jǐn)防詐騙,。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,,請點擊一鍵舉報,。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多