微軟The Project Adam圖片識別功能,,包括狗狗品種的區(qū)分 我們正在進(jìn)入一個(gè)人工智能的時(shí)代。包括谷歌,、微軟和蘋果這樣的科技巨頭們,,正在利用他們手中的學(xué)術(shù)研究能力,開發(fā)新一代的人工智能技術(shù),,這項(xiàng)技術(shù)被稱為深度學(xué)習(xí),。通過這項(xiàng)技術(shù)人們可以完成語音識別、機(jī)器翻譯,、機(jī)器視覺等等任務(wù),。 人們普遍認(rèn)為谷歌是處于這項(xiàng)技術(shù)研究的前列。谷歌聘請了深度學(xué)習(xí)技術(shù)的大牛人物,,多倫多大學(xué)的Geoff Hinton教授,。而且谷歌也公開的討論了深度學(xué)習(xí)對于現(xiàn)實(shí)世界的推動,比如安卓手機(jī)上的語音搜索功能,,在這個(gè)領(lǐng)域已經(jīng)保持了很多的記錄,。 但是近日微軟研究院(Microsoft Research)的團(tuán)隊(duì)表示,他們的最新深度學(xué)習(xí)系統(tǒng)Adam要更勝一籌,預(yù)計(jì)將在近日在微軟總部召開的一次技術(shù)峰會上首次披露相關(guān)的消息,。按照微軟的說法,,Adam識別圖片的精度要比現(xiàn)有的系統(tǒng)高兩倍,而且使用的計(jì)算資源要少很多,。這項(xiàng)計(jì)劃的領(lǐng)頭人Peter Lee表示,,Adam就是微軟對于打造最強(qiáng)大腦的嘗試。 The Project Adam團(tuán)隊(duì):從左到右依次為Karthik Kalyanaraman, Trishul Chilimbi, Johnson Apacible, Yutaka Suzue. Lee表示,,他們曾經(jīng)做過一個(gè)名為ImageNet 22K的測試,,結(jié)果要比Google Brain的效果要好。微軟的系統(tǒng)采用神經(jīng)網(wǎng)絡(luò)算法,,能夠處理22000種以上的圖片,,而能夠擁有這種計(jì)算能力的并不多。 微軟的秘密在于,,它優(yōu)化了計(jì)算機(jī)處理數(shù)據(jù)的方法,,并且還更好的控制了計(jì)算機(jī)之間的通信。其實(shí)Adam這項(xiàng)目的想法來自微軟一面名為Trishul Chilimbi的研究員,。 跟其他的深度學(xué)習(xí)系統(tǒng)類似,,Adam也運(yùn)行在服務(wù)器集群上。深度學(xué)習(xí)旨在通過創(chuàng)建神經(jīng)網(wǎng)絡(luò),,更好的模仿大腦工作的方式,,而通常來說,這種神經(jīng)網(wǎng)絡(luò)都需要大量的服務(wù)器資源,。微軟的特殊之處在于它使用了非同步的技術(shù),。 隨著計(jì)算系統(tǒng)變得越來越復(fù)雜,機(jī)器之間的通信變的越來越困難,,但是非同步技術(shù)減輕了這個(gè)問題,。所謂非同步就是將整個(gè)系統(tǒng)分為不同的部分,而這些部分可以獨(dú)立運(yùn)行,,但是也能彼此的通信并合并為一個(gè)整體,。其實(shí)這項(xiàng)技術(shù)在手機(jī)和電腦上已經(jīng)實(shí)現(xiàn)了,主要就是在不同的處理器上進(jìn)行計(jì)算,。但是對于這么大規(guī)模的服務(wù)器系統(tǒng),,還暫時(shí)沒有成功的案例。但是包括谷歌和微軟這樣的大公司,,其實(shí)對于這種非同步技術(shù)的開發(fā)已經(jīng)持續(xù)很長的時(shí)間了,,而微軟的Adam其實(shí)來自威斯康辛大學(xué)的一個(gè)名為HOGWILD的技術(shù)原型。 HOGWILD的本意是讓一臺計(jì)算機(jī)內(nèi)的各個(gè)處理器更加獨(dú)立工作的技術(shù),,不同的處理器可以向同樣的內(nèi)存寫內(nèi)容,。對于大部分的系統(tǒng)來說,這都不是一個(gè)好注意,因?yàn)榭赡軙袛?shù)據(jù)沖突的問題,,不同機(jī)器之間會相互覆蓋的,只能在某種特殊情下才能運(yùn)行,。但是HOGWILD就能解決這個(gè)問題,,一臺機(jī)器的運(yùn)算速度會明顯的加快。而Adam技術(shù)相當(dāng)于把這個(gè)想法更近一步,,將HOGWILD應(yīng)用在整個(gè)網(wǎng)絡(luò)上,。 微軟表示這種方法能夠讓神經(jīng)網(wǎng)絡(luò)更好更快的訓(xùn)練他們自己,去理解圖片之類的東西,。深度學(xué)習(xí)大牛Andrew Ng表示,,這種方法很激進(jìn),但是確實(shí)可以節(jié)省很多的計(jì)算資源,。Andrew Ng已經(jīng)被百度聘請,。 另外Andrew Ng還對于一個(gè)問題非常的驚訝,那就是Adam運(yùn)行在普通的處理器上,,而不是GPU上,,因?yàn)楝F(xiàn)在GPU加速是非常流行的技術(shù)。很多的深度學(xué)習(xí)系統(tǒng)都在采用GPU來避免通信堵塞的問題,。但是很多的技術(shù)專家都認(rèn)為GPU還不能直接規(guī)?;酱笮偷纳窠?jīng)網(wǎng)絡(luò),因?yàn)閿?shù)據(jù)中心的通信速度,,有時(shí)候會趕不上GPU內(nèi)部的數(shù)據(jù)通信的速度,。負(fù)責(zé)Adam項(xiàng)目的Chilimbi就是其中一個(gè)。 微軟表示Adam會是完全不同的系統(tǒng),,但是很多的深度學(xué)習(xí)專家都表示其實(shí)微軟的系統(tǒng)跟谷歌的并沒有那么大的不同,,尤其是在不清楚具體的技術(shù)細(xì)節(jié)的時(shí)候,很難斷定其中的程度到底如何,。比如曾經(jīng)復(fù)雜開發(fā)Google Brain的 Matt Zeiler就表示,,微軟的結(jié)果跟業(yè)界的普遍研究結(jié)果不太匹配,但是確實(shí)很有意思,。Matt Zeiler現(xiàn)在已經(jīng)從谷歌離職,,并創(chuàng)辦了自己的深度學(xué)習(xí)公司Clarifai。微軟的Lee 表示,,這個(gè)項(xiàng)目其實(shí)還處于萌芽階段,。他們在內(nèi)部開發(fā)了一款app可以識別圖片。而Lee自己用這個(gè)app識別過狗糧和毒蟲,。但是Lee認(rèn)為這個(gè)技術(shù)在電子商務(wù),、機(jī)器人和情感分析方面還是有很大的潛力的。另外他們還在嘗試使用FPGA來更好的提速。 Lee相信Adam一定能成為終極人工智能的一部分,,這種技術(shù)能媲美人類處理任務(wù)的方法,,比如講話、圖像和文字等等,。這項(xiàng)技術(shù)的發(fā)展之路今后還是很長的,,而且已經(jīng)有了50年的歷史,但是有一點(diǎn)可以確定的是,,我們已經(jīng)離目標(biāo)更近了,。 |
|