2016年7月爆出了舉世震驚的軟銀234億英鎊收購ARM公司事件,軟銀首席執(zhí)行官孫正義就此表示,,這一收購標(biāo)志著軟銀的一次“范式轉(zhuǎn)變”——投資物聯(lián)網(wǎng),。誠然,ARM作為壟斷了智能手機業(yè)的芯片設(shè)計公司,,最近一兩年來正積極向物聯(lián)網(wǎng)拓展,,因為物聯(lián)網(wǎng)有望在未來數(shù)年內(nèi)成為可替代智能手機產(chǎn)業(yè)規(guī)模的戰(zhàn)略性機遇。 然而,,ARM僅僅提供物聯(lián)網(wǎng)芯片的設(shè)計,,即便真如Gartner所預(yù)測在2020年將有260億物聯(lián)網(wǎng)設(shè)備,但這也只是物聯(lián)網(wǎng)的物理基礎(chǔ),。如何對這260億物聯(lián)設(shè)備7×24源源不斷產(chǎn)生出來的數(shù)據(jù)進(jìn)行分析,、判斷和商業(yè)變現(xiàn),單靠人工則遠(yuǎn)遠(yuǎn)不能滿足這一需求,,而必須依靠自動化的算法,,這就是Gartner所積極倡導(dǎo)的算法經(jīng)濟。 人工智能將成主流商業(yè)競爭策略 為什么說人工智能將成主流商業(yè)競爭策略?這是因為在算法經(jīng)濟時代,,人工智能是終極算法,,對終極算法的追求必將成為主流商業(yè)競爭策略。 在華盛頓大學(xué)教授Pedro Domingos的2015年新書《終極算法》中,,有這樣論斷:“終極算法”就是通過機器學(xué)習(xí)的方式,,自動發(fā)現(xiàn)和創(chuàng)造其它所有算法的“主算法”。這個所謂的“主算法”是單一的,、全球通用的算法,,這個“主算法”對于生物界來說是人類大腦,對于以物聯(lián)網(wǎng)為基礎(chǔ)的機器世界來說就是人工智能,。 在過去60年間,全球最頂尖的科學(xué)家們一直在研究如何用數(shù)學(xué)的方式來模擬人類的智能,。早期可證明《數(shù)學(xué)原理》的“邏輯理論家”程序讓機器具備邏輯推理能力,,中期的專家系統(tǒng)讓機器能獲得人類的知識,再到后來旨在讓機器自主學(xué)習(xí)知識的機器學(xué)習(xí)算法,,科學(xué)家們對人工智能的探索一直沒有停止,。 進(jìn)入到2016年,也是人工智能學(xué)科誕生60周年之際,,基于深度學(xué)習(xí)的機器學(xué)習(xí)算法成為人工智能主流,,而深度學(xué)習(xí)的核心就是多層深度神經(jīng)元網(wǎng)絡(luò)DNN,這也是目前主流科學(xué)家能達(dá)到的最為成熟的機器智能,。 2016年7月21日,,技術(shù)解決方案提供商SoftServe發(fā)布了Big Data Snapshot 研究報告,研究顯示 62% 的大中型公司希望在未來的兩年內(nèi)能將機器學(xué)習(xí)用于商業(yè)分析,。這意味著商用多層深度神經(jīng)元網(wǎng)絡(luò)DNN,,即將成為各大企業(yè)追逐的主流商業(yè)競爭策略。 硬件進(jìn)步推動人工智能商用 我們正在進(jìn)入人工智能的商用時代,。經(jīng)過60年的發(fā)展,,基于DNN的人工智能已經(jīng)從高校和實驗室走進(jìn)了企業(yè),并從企業(yè)擴散向千家萬戶,。谷歌今年剛發(fā)布的智能硬件Google Home,、即將量產(chǎn)的阿里互聯(lián)網(wǎng)汽車、微軟人工智能助理Cortana等,,都是基于DNN的規(guī)?;虡I(yè)應(yīng)用。 在更為廣泛的傳統(tǒng)企業(yè)應(yīng)用層面,,一場大規(guī)模的人工智能商用化正在開始,,這是基于硬件的進(jìn)步,其中一個顯著的進(jìn)步是GPU在人工智能商用中的崛起?!哆B線》雜志在2015年底發(fā)表了一篇名為《與Google競爭,,F(xiàn)acebook開源了人工智能硬件》文章中談及GPU在人工智能商用時代的崛起。現(xiàn)在,,F(xiàn)acebook,、Google、微軟,、百度等大型互聯(lián)網(wǎng)公司正在轉(zhuǎn)向利用GPU完成人工智能商業(yè)應(yīng)用,。 在過去,算法模型依靠CPU計算得出,,但人工智能算法的獨特性在于分布式并行計算,,這并非基于串行計算的CPU所擅長。實際上針對圖形圖像處理的GPU從一開始就是大規(guī)模并行計算,,這也是為什么斯坦福大學(xué)的吳恩達(dá)教授會考慮采用GPU優(yōu)化人工智能算法的初衷,。研究表明,12 顆 NVIDIA GPU 可以提供相當(dāng)于2,000 顆 CPU 的深度學(xué)習(xí)性能,。 盡管從長期來看,,開發(fā)真正的人工智能芯片依然是全球?qū)W界與企業(yè)界共同需要完成的任務(wù),但那仍需要很長時間的探索與實驗,。從當(dāng)前人工智能商業(yè)化需求來看,,把GPU用于人工智能商用顯然具有極大的優(yōu)勢。這就是2016年4月,,NVIDIA推出基于GPU的全球首款深度學(xué)習(xí)超級計算機DGX-1的原因,。 首款GPU深度學(xué)習(xí)超級計算機 首款GPU深度學(xué)習(xí)超級計算機NVIDIA DGX-1基于 NVIDIA Tesla P100 GPU,該 GPU 采用2016年最新的 NVIDIA Pascal GPU 架構(gòu),。Pascal是第五代GPU架構(gòu),,于兩年前的GPU技術(shù)大會(GTC)上公布,產(chǎn)品將于2016年上市,,這就是Tesla P100 GPU,。 作為新一代GPU架構(gòu),Pascal相比于前一代的Maxwell有較大的性能提升,。根據(jù)NIVIDIA的數(shù)據(jù),,Pascal GPU 在訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)的性能方面有1個數(shù)量級的提高。2015年GTC大會上,,用4顆Maxwelll GPU訓(xùn)練Alexnet深度神經(jīng)網(wǎng)絡(luò)需要25小時,,到了2016年GTC大會上用8顆Pascal GPU則只用2小時;對比英特爾雙路至強E5服務(wù)器訓(xùn)練Alexnet網(wǎng)絡(luò)需要150個小時,,而DGX-1只需要2個小時,。 Alexnet神經(jīng)網(wǎng)絡(luò)是2012 年國際ImageNet計算機圖形識別大賽的冠軍深度學(xué)習(xí)算法,,著名的開源深度學(xué)習(xí)算法Caffe就是基于Alexnet。而到2015 年的 ImageNet 大賽中所有的最好成績,,都是基于深度學(xué)習(xí)且在 GPU 加速的深度神經(jīng)網(wǎng)絡(luò),,這也難怪《連線》雜志驚嘆GPU在人工智能時代的崛起。 Pascal GPU 架構(gòu)的優(yōu)勢在于:引入了NVIDIA獨家的新高速總線NVLink,,專門用于GPU以及GPU與CPU的高速互連,,GPU最高能夠以 160 GB/s的雙吐帶寬訪問系統(tǒng)內(nèi)存,相當(dāng)于 PCIe傳統(tǒng)帶寬的5 倍,;采用了目前最快,、容量最高的堆疊式內(nèi)存技術(shù)HBM2,Tesla P100也是全球首款采用 HBM2 內(nèi)存的GPU,;顯著改進(jìn)編程模型的統(tǒng)一內(nèi)存,,以單一統(tǒng)一虛擬地址來訪問系統(tǒng)中所有CPU 和 GPU內(nèi)存,極大簡化了程序的可移植性及數(shù)據(jù)吞吐能力等,。 微軟研究院首席語音科學(xué)家黃學(xué)東表示:“微軟正在開發(fā)具有 1,000 多層的超級深度神經(jīng)網(wǎng)絡(luò),。NVIDIA Tesla P100 的驚人性能將讓微軟 CNTK 能夠加速實現(xiàn)人工智能的突破?!?/p> 80萬的AI服務(wù)器,到底值不值,? NVIDIA DGX-1的定價為12,,900美金,約合80萬人民幣,。那么,,這個價格到底值不值呢? NVIDIA DGX-1提供8 顆 Tesla P100 加速器,、每顆 GPU 16GB 內(nèi)存,、7TB 固態(tài)硬盤 DL 高速緩存等配置,吞吐量相當(dāng)于250臺E5雙路X86服務(wù)器,。那么,,按2萬元人民幣一臺E5服務(wù)器簡單估算,250臺即500萬的成本,,這還不包括機房,、網(wǎng)絡(luò)、能源等額外成本,。而DGX-1采用 3U 架上型機箱,,可單獨使用也可以集成到集群當(dāng)中,顯然用DGX-1做集群更劃算,。 在集成的軟件方面,,NVIDIA DGX-1提供了一整套優(yōu)化的深度學(xué)習(xí)軟件,屬于開箱即用型。在NVIDIA的開發(fā)者網(wǎng)站Developer.nvidia.com上,,有一個Deep Learning深度學(xué)習(xí)專區(qū),,里面提供了Deep Learning SDK開發(fā)工具包、NVIDIA DIGITS圖像分類與識別軟件,、Deep Learning開源框架等定制化軟件為深度學(xué)習(xí)提供了全方位的軟件支持,,可供下載和使用。 其中,,Deep Learning SDK開發(fā)工具包內(nèi)含強大的工具及類庫,,可用于設(shè)計、開發(fā)和部署面向GPU優(yōu)化的深度學(xué)習(xí)應(yīng)用,。其中的類庫包括深度學(xué)習(xí)基礎(chǔ)cuDNN,、線性代數(shù)、稀疏矩陣,、多GPU通信以及全面的CUDA C\C++開發(fā)環(huán)境,。NVIDIA DIGITS深度學(xué)習(xí)管理調(diào)度平臺為圖像視頻類數(shù)據(jù)分類和識別,提供了包括LeNet,、AlexNet,、GoogLeNet等在內(nèi)的預(yù)設(shè)優(yōu)化算法。除此之外,,NVIDIA還定期更新開發(fā)者網(wǎng)站,,為開發(fā)者提供更多的優(yōu)化算法——如果說GPU已經(jīng)是深度學(xué)習(xí)領(lǐng)域不能或缺的組成,那么這款面向人工智能機器學(xué)習(xí)的NVIDIA DGX-1則讓更多企業(yè)拋開束縛,,以更快的步伐邁向人工智能,。 基于NVIDIA GPU的商用人工智能軟件還有一個很大的優(yōu)勢,在于GPU的普適性:針對個人電腦的GeForce,、針對云和超級計算機的Tesla,、針對機器人和無人機的Jetson以及針對汽車的DRIVE PX等所有NVIDIA GPU都共用同一種架構(gòu)。 百度,、谷歌,、Facebook、微軟是首批把 NVIDIA GPU 應(yīng)用于深度學(xué)習(xí)的企業(yè),,在近兩年內(nèi)與NVIDIA 在深度學(xué)習(xí)方面合作的企業(yè)激增了近 35 倍至 3,400 多家,,涉及醫(yī)療、生命科學(xué),、能源,、金融服務(wù)、汽車,、制造業(yè)以及娛樂業(yè)等多個行業(yè),。 考慮到NVIDIA DGX-1在硬件,、軟件和集成服務(wù)等方面的明顯優(yōu)勢,80萬的價格并不為高,。NVIDIA DGX-1顯然能夠大幅提升AI模型的學(xué)習(xí)和訓(xùn)練時間,,加快對于來自物聯(lián)網(wǎng)上各類圖片、視頻,、語音等非結(jié)構(gòu)化數(shù)據(jù)的處理速度,,比如工業(yè)生產(chǎn)線檢測的圖片、醫(yī)療影像視頻,、道路交通圖片與視頻分析等等,,幫助企業(yè)盡快、盡早地從AI算法中受益,。 中科曙光成為NVIDIA DGX-1在中國最重要的戰(zhàn)略合作伙伴之一,,而全球領(lǐng)先的監(jiān)控產(chǎn)品供應(yīng)商、中國平安城市解決方案提供商??低曇渤蔀镹VIDIA DGX-1的首單客戶,,后者將把DGX-1用于視頻監(jiān)控方面的深度學(xué)習(xí)超級計算機項目上。 NVIDIA DGX-1已經(jīng)于今年7月正式上市,,DGX-1的上市有望激活人工智能的大規(guī)模商用,。對于企業(yè)來說,在跟投物聯(lián)網(wǎng)項目的同時,,需要開始考慮人工智能策略,。在大的產(chǎn)業(yè)趨勢到來之前,只有領(lǐng)先一步,,才能步步占據(jù)先機。 |
|
來自: BGND > 《傳感器與集成電路》