久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

得“芯”者的天下,,人工智能離得開芯片嗎,?是否會延續(xù)下一個熱點

 白云73 2017-12-10

得芯片者得天下。在全球范圍競爭日趨激化的AI研究領域,,中國的存在感正在加強,。根據(jù)國際知名專利檢索公司QUESTEL發(fā)布的《芯片行業(yè)專利分析及專利組合質(zhì)量評估》報告指出:中國近10年芯片專利增長驚人,已成為芯片專利申請第一大國,。中國企業(yè)在芯片專利數(shù)量上已逐步趕上國外老牌企業(yè),。

得“芯”者的天下,人工智能離得開芯片嗎,?是否會延續(xù)下一個熱點

“芯”夠強 才能走得遠

目前迅猛發(fā)展的人工智能,,上層的應用都依賴于底層核心能力,而這個核心能力就是人工智能處理器,。如果在芯片上不能突破,,人工智能應用就不可能真正成功,。可以說核心芯片是人工智能時代的戰(zhàn)略制高點,。

人工智能目前采用的深度學習算法,,有海量的數(shù)據(jù)運算需求,對傳統(tǒng)架構和系統(tǒng)提出了極大挑戰(zhàn),。

深度學習,,就是通過算法給機器設計一個神經(jīng)網(wǎng)絡。這個網(wǎng)絡的基本特點,,是模仿大腦神經(jīng)元之間傳遞,、處理信息的模式,從多個角度和層次來觀察,、學習,、判斷、決策,。近年來,,這種方法已應用于許多領域,比如人臉識別,、語音識別等,是人工智能領域的熱點研究方向之一,。

華為公司與中國科學院計算技術研究所“寒武紀”項目團隊共同開發(fā)的麒麟970人工智能手機芯片,,首次集成NPU,將通常由多個芯片完成的傳統(tǒng)計算,、圖形,、圖像以及數(shù)字(數(shù)位)信號處理功能集成在一塊芯片內(nèi),節(jié)省空間,、節(jié)約能耗,,同時極大提高了運算效率。

據(jù)預測,,類腦計算芯片市場將在2022年前達到千億美元規(guī)模,,其中消費終端將是最大市場,占據(jù)98.17%,,其他需求包括工業(yè)檢測,、航空、軍事與國防等領域,。

在新的計算時代,,核心芯片將決定基礎架構和未來生態(tài)。因此,,谷歌,、微軟,、超威等全球信息技術和通信制造巨頭都投入巨資,加速人工智能芯片的研發(fā),。

得“芯”者的天下,,人工智能離得開芯片嗎?是否會延續(xù)下一個熱點

GPU和CPU的設計區(qū)別

那么GPU的快速運算能力是如何獲得的,?這就要追溯到芯片最初的設計目標了,。中央處理器CPU需要很強的處理不同類型數(shù)據(jù)的計算能力以及處理分支與跳轉的邏輯判斷能力,這些都使得CPU的內(nèi)部結構異常復雜,;而圖形處理器GPU最初面對的是類型高度統(tǒng)一的,、相互無依賴的大規(guī)模數(shù)據(jù)和不需要被打斷的純凈的計算環(huán)境,所以GPU只需要進行高速運算而不需要邏輯判斷,。目標運算環(huán)境的區(qū)別決定了GPU與CPU不同的設計架構:

CPU基于低延時的設計

·大量緩存空間Cache,,方便快速提取數(shù)據(jù)。CPU將大量訪問過的數(shù)據(jù)存放在Cache中,,當需要再次訪問這些數(shù)據(jù)時,,就不用從數(shù)據(jù)量巨大的內(nèi)存中提取了,而是直接從緩存中提取,。

·強大的算術運算單元ALU,,可以在很短的時鐘周期內(nèi)完成算數(shù)計算。當今的CPU可以達到64bit雙精度,,執(zhí)行雙精度浮點源計算加法和乘法只需要1~3個時鐘周期,,時鐘周期頻率達到1.532~3gigahertz。

·復雜的邏輯控制單元,,當程序含有多個分支時,,它通過提供分支預測來降低延時。

·包括對比電路單元與轉發(fā)電路單元在內(nèi)的諸多優(yōu)化電路,,當一些指令依賴前面的指令結果時,,它決定這些指令在pipeline中的位置并且盡可能快的轉發(fā)一個指令的結果給后續(xù)指令。

GPU基于大吞吐量的設計

·壓縮緩存空間Cache,,從而最大化激發(fā)內(nèi)存吞吐量,,可以處理超長的流水線。緩存的目的不是保存之后需要訪問的數(shù)據(jù),,而是擔任數(shù)據(jù)轉發(fā)的角色,,為線程提高服務。如果有很多線程需要訪問同一個數(shù)據(jù),,緩存會合并這些訪問,,再去DRAM中訪問數(shù)據(jù),獲取的數(shù)據(jù)將通過緩存轉發(fā)給對應的線程。這種方法雖然減小了緩存,,但由于需要訪問內(nèi)存,,因而自然會帶來延時效應。

·高效的算數(shù)運算單元和簡化的邏輯控制單元,,把串行訪問拆分成多個簡單的并行訪問,,并同時運算。例如,,在CPU上約有20%的晶體管是用作計算的,,而GPU上有80%的晶體管用作計算。

編輯:小黑

    本站是提供個人知識管理的網(wǎng)絡存儲空間,,所有內(nèi)容均由用戶發(fā)布,,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式,、誘導購買等信息,,謹防詐騙。如發(fā)現(xiàn)有害或侵權內(nèi)容,,請點擊一鍵舉報,。
    轉藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多