當?shù)貢r間4月5日9點,北京時間4月6日凌晨,, GPU技術(shù)大會(GTC)在“硅谷之都”圣何塞拉開帷幕,。 作為全球最大的圖形處理器(GPU)企業(yè),英偉達(NVIDIA)聯(lián)合創(chuàng)始人兼CEO黃仁勛發(fā)表了長達2個小時的關(guān)于未來計算的演講,。 要知道,,作為上游GPU企業(yè),英偉達的每一步戰(zhàn)略布局都將在全產(chǎn)業(yè)鏈產(chǎn)生四兩撥千斤的巨大影響,。近年來,,英偉達一直面臨PC市場整體疲軟的困境,,而且與之相關(guān)的GPU游戲業(yè)務(wù)目前仍占公司總營收的八成。受PC市場拖累,,英偉達自2012年起股價一直低迷于每股15美元左右,。 但是,從去年開始它的股價卻發(fā)生奇跡般的反彈,!GTC大會當日收盤于每股35.75美元,,和2015年中期的20.90美元相比大漲了70%。 其實,,英偉達收入結(jié)構(gòu)并未發(fā)生實質(zhì)性逆轉(zhuǎn),,不過一向注重預(yù)期的華爾街只為未來買單。那么,,黃仁勛究竟向華爾街投資人講述了一個怎樣的全新故事,? 業(yè)界從他剛剛2個小時的GTC演講中就可一覽無遺。在黃仁勛發(fā)布的SDK,、VR,、深度學習芯片、深度學習系統(tǒng)以及深度學習汽車五大戰(zhàn)略方向中,,不難發(fā)現(xiàn)一半以上都與人工智能(AI)息息相關(guān),。 看來,這是黃仁勛在和人工智能玩對賭: 贏了,,英偉達順利轉(zhuǎn)型,,產(chǎn)品版圖開疆擴土,并繼續(xù)受到華爾街青睞,; 輸了,,英偉達數(shù)十億美元的研發(fā)投入將付之東流,企業(yè)恐怕也將因此陷入泥潭,。 去年,,微軟超級深度網(wǎng)絡(luò),伯克利大學brett機器人,,百度深度演講第二版,,智能駕駛引得眾專家紛紛創(chuàng)業(yè),一直到谷歌的AlphaGo戰(zhàn)勝圍棋九段李世石,,在人工智能熱炒發(fā)酵的同時也為GPU推開了一道機遇之門,。 黃仁勛就直言:“Deep Learning is a big deal.” 的確,由于GPU強大的并行計算能力,,它如今已經(jīng)成為人工智能中深度學習的熱門處理器。 GTC大會首日,,黃仁勛就發(fā)布了性能英偉達迄今性能最強的超大規(guī)模數(shù)據(jù)中心加速器 NVIDIA Tesla P100 GPU,。它采用了五項全新的突破性技術(shù): 全新 Pascal 架構(gòu),,相比前一代Maxwell架構(gòu),神經(jīng)網(wǎng)絡(luò)訓練方案性能提升 12 倍,。 NVLink高速GPU互聯(lián)技術(shù),,帶寬實現(xiàn) 5 倍加速。 全球最大FinFET 芯片,,16nm 工藝,,153 億個晶體管,獲得更快性能和更佳能效,。 Pascal 架構(gòu)將處理器和數(shù)據(jù)封裝,,顯存帶寬高達720GB/s,3倍于Maxwell架構(gòu),。 全新人工智能算法,,半精度指令為深度學習提供了超過 21 Teraflops 的峰值性能。 黃仁勛認為,,傳統(tǒng)計算是“專家+時間”,,新型計算是“算法+數(shù)據(jù)+HPC”。為此,,英偉達今天還發(fā)布了全球首款深度學習超級計算機NVIDIA DGX-1,,它正是基于全新的Tesla P100 GPU 打造,并集成了硬件,、深度學習軟件以及開發(fā)工具,。 為了卡位人工智能,這個處理器企業(yè)因此跳到了前臺,,做起了HPC細分市場的生意,,這一模式上的突破令筆者感到驚訝。 據(jù)悉,,DGX-1的吞吐量相當于 250 臺 CPU 服務(wù)器,。而相比一年前問世的NVIDIA Maxwell架構(gòu)四路解決方案也快了12倍,這意味著深度學習中同樣的學習任務(wù)以前需要25小時,,現(xiàn)在僅僅需要2個小時,。 當然,這款人工智能專門領(lǐng)域的HPC也價格不菲,,建議售價高達12.9萬美元,。不過,黃仁勛算了一筆賬:“同樣計算能力的CPU服務(wù)器需要250臺,,以每臺1萬美元計算就要250萬美元,,服務(wù)器之間連接的網(wǎng)絡(luò)設(shè)備還需要追加50萬美元?!?/span> 12.9萬美元vs.300萬美元,,單單從價格的數(shù)量級來看,,這也無疑是一種創(chuàng)新方案。 據(jù)悉,,DGX-1將于今年6月正式推向市場,,而同樣搭載了Tesla P100 GPU的IBM、惠普,、戴爾的深度學習服務(wù)器預(yù)計在2017年第一季度問世,。 除了GPU之外,芯片業(yè)的另一熱門當屬FPGA,,英特爾還在去年耗資167億美元收購FPGA企業(yè)Altera,。兩種不同領(lǐng)域的技術(shù)因為人工智能的出現(xiàn)出現(xiàn)了交集的可能,那么專注GPU的英偉達怎么看呢,? 黃仁勛一手拿著Tesla M40,,一手拿著Tesla M4,回應(yīng)說:“沒有理由使用FPGA或者專用芯片,。我們的GPU不僅高效節(jié)能,,而且是通用架構(gòu),可以進行轉(zhuǎn)碼,、圖像處理,、深度學習。這兩款產(chǎn)品已經(jīng)成為我們增長最快的業(yè)務(wù),,被全球的互聯(lián)網(wǎng)企業(yè)所采用,。” 前者提供后臺的計算性能,,專為訓練深度學習神經(jīng)網(wǎng)絡(luò)設(shè)計,,后者則定位為低功耗小巧型加速器,用于機器學習前端圖像與視頻的采集處理和傳輸,。 據(jù)悉,,谷歌和國內(nèi)的百度、阿里和京東等互聯(lián)網(wǎng)企業(yè)都在應(yīng)用Tesla M系列GPU,。 如果說此次英偉達通過發(fā)布全球首款深度學習超級計算機NVIDIA GTX-1,,而從處理器后臺跳到了前臺,那么從2007年發(fā)布并行架構(gòu)軟件平臺CUDA開始,,黃仁勛就不再認為英偉達是家純粹的GPU企業(yè)了,。在今天的GPU大會上,黃仁勛一開場也是這樣強調(diào):“我們是一家軟件公司”,。 在戰(zhàn)略新品發(fā)布環(huán)節(jié)當中,,其實,軟件部分是黃仁勛今天最先發(fā)布的——NVIDIA SDK系列更新。 這些更新包括NVIDIA CUDA 8,。英偉達并行計算平臺的最新版本可以讓開發(fā)者直接使用Pascal架構(gòu)一系列的全新特性,,包括統(tǒng)一內(nèi)存和 NVLink。該版本還包括全新的圖表分析庫 nvGRAPH,,后者可用于機器人路徑規(guī)劃、網(wǎng)絡(luò)安全和物流分析,,將 GPU 加速的應(yīng)用擴展到大數(shù)據(jù)分析領(lǐng)域,。 英偉達還發(fā)布了cuDNN v5,一個 GPU 加速的深度神經(jīng)網(wǎng)絡(luò)基元庫,,可提供Pascal GPU支持,、循環(huán)神經(jīng)網(wǎng)絡(luò)和用于醫(yī)療、油氣和其他行業(yè)的增強特性,。 據(jù)悉,,cuDNN的深度學習框架,包括谷歌的TensorFlow,、加州大學伯克利分校的Caffe,、蒙特利爾大學的Theano和紐約大學的Torch,這些又驅(qū)動亞馬遜,、臉譜和谷歌等所用的深度學習解決方案的運行,。 也正因為有了來自于CUDA的軟件基礎(chǔ),今天奪人眼球的全球首款深度學習HPC才得以從GPU躍升為可以直接使用的產(chǎn)品,。因為作為系統(tǒng),,它必須包括全面的深度學習軟件套件,比如NVIDIA深度學習GPU訓練系統(tǒng) (DIGITS)以及cuDNN v5等,,使得研究人員和數(shù)據(jù)科學家能夠快速便捷地訓練深度神經(jīng)網(wǎng)絡(luò),。 GTC大會上,全球首款深度學習HPC,,全新Pascal架構(gòu)GPU,,成熟的深度學習框架,這些人工智能領(lǐng)域的創(chuàng)新是否能讓轉(zhuǎn)型期的英偉達持續(xù)獲得華爾街的信任,? 畢竟,,轉(zhuǎn)型就是一場有關(guān)自身未來的對賭游戲,而黃仁勛為英偉達選擇了與人工智能對賭,。 翔snowman 原創(chuàng)出品 公眾號轉(zhuǎn)載需注明來源 科技茱比莉 有視角的科技觀察 有態(tài)度的科技評論
|
|