2016年,,AlphaGo 4∶1擊敗人類圍棋冠軍,它是否會(huì)進(jìn)化到陪伴人類下棋的BetaGo(陪Ta狗),? | 作者:楊小康 1956年夏,,麥卡錫(J. McCarthy)、明斯基(M. L. Minsky)等正式提出人工智能(artificial intelligence,,AI)的概念,,標(biāo)志著人工智能學(xué)科誕生。在人工智能發(fā)展60周年的2016年,,谷歌DeepMind AlphaGo戰(zhàn)勝李世石,,樹立了人工智能新的里程碑,。 從AlphaGo看人工智能現(xiàn)狀 AlphaGo的人工智能原理 圍棋是最復(fù)雜的棋類游戲,人類高手下圍棋主要靠宏觀的直覺,,加上局部的計(jì)算,。AlphaGo憑借兩招出奇制勝:深度卷積網(wǎng)絡(luò),模仿高手,,尋找好的落點(diǎn),;深度強(qiáng)化學(xué)習(xí),形成左右互搏,,自我進(jìn)化,。 AlphaGo的第一招:模仿高手,學(xué)習(xí)高手的棋形,。要模仿高手棋形,,AlphaGo需要一個(gè)分類器來判斷棋形是否與高手的棋形相像。圍棋盤可以看成是19×19的圖像,,雖然這個(gè)圖像很小,,但約有250 150種變化。將這些變化分成高手棋形,、非高手棋形,,是一個(gè)挺難的機(jī)器學(xué)習(xí)問題,主要難在高手棋形的特征不好定義,、不易提取,。在人臉識(shí)別、車牌識(shí)別中,,可以定義顏色,、邊緣、關(guān)鍵點(diǎn)等特征,,顯然圍棋棋形的特征不能使用同樣的方法,。 AlphaGo使用了最新圖像分類器——深度卷積神經(jīng)網(wǎng)絡(luò)(deep convolutional neural network,DCNN),,可以自動(dòng)學(xué)習(xí)圖像中好的特征,。不同于傳統(tǒng)的人工神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)的層數(shù)特別多,,學(xué)習(xí)和分類的能力非常強(qiáng),。神經(jīng)網(wǎng)絡(luò)早在1943年就已提出,在1950年代末和1980年代曾興起過兩波研究熱潮,。以前的人工神經(jīng)網(wǎng)絡(luò)層數(shù)很淺,,只能解決一些簡單識(shí)別問題。2000年前后,欣頓(G. Hinton)等提出一套預(yù)訓(xùn)練后向傳播的方法,,解決了深度學(xué)習(xí)問題 [1],。DCNN是專門針對圖像識(shí)別的深度學(xué)習(xí)方法,對局部圖像進(jìn)行卷積計(jì)算,,效率很高,。 深度學(xué)習(xí)能夠發(fā)揮巨大威力的前提是,必須要有大量的數(shù)據(jù)才能訓(xùn)練深度結(jié)構(gòu),。深度學(xué)習(xí)會(huì)涉及上百萬,、甚至上億的參數(shù),如果數(shù)據(jù)不夠,,很容易過擬合,、性能降低。此外,,進(jìn)行這樣大規(guī)模的訓(xùn)練,,需要超強(qiáng)的計(jì)算能力。據(jù)說,,AlphaGo存有15萬職業(yè)棋手,、百萬業(yè)余高手的棋譜,訓(xùn)練的時(shí)候會(huì)用到1202個(gè)中央處理單元(central processing unit,,CPU)和176個(gè)圖形處理單元(graphics processing unit,,GPU),。 AlphaGo的第二招:自我學(xué)習(xí),,自我進(jìn)化。 模仿高手還不足以超越高手,。為超越頂尖高手,,AlphaGo用了一個(gè)自我學(xué)習(xí)的機(jī)制,就像金庸小說《射雕英雄傳》中的老頑童周伯通,,左右互搏,。人類高手通過自我復(fù)盤、擺棋譜來提高棋藝,,但是人類高手復(fù)盤慢,,一次復(fù)盤往往需要數(shù)小時(shí)甚至數(shù)天,其間棋手還需要吃飯,、休息,。而AlphaGo只要有電就可以一直左右“互搏”下去,其復(fù)盤速度極快,,每分鐘就可以研究上萬盤棋,,這樣的特性使得AlphaGo有可能在學(xué)習(xí)速度上超越人類高手。 為了達(dá)到左右互搏的效果,AlphaGo采用了一個(gè)名為深度強(qiáng)化學(xué)習(xí)的技術(shù),。強(qiáng)化學(xué)習(xí)很符合智能體(agent)的學(xué)習(xí)規(guī)律,,類似孩子在不斷跌倒中自我強(qiáng)化學(xué)會(huì)走路,猴子在胡蘿卜加大棒下自我強(qiáng)化學(xué)會(huì)表演,。強(qiáng)化學(xué)習(xí)有兩個(gè)特點(diǎn),,一是智能體通過環(huán)境交互學(xué)習(xí),二是訓(xùn)練標(biāo)注稀少,,且通常有一定的延時(shí),。強(qiáng)化學(xué)習(xí)主要通過感知、行動(dòng),、獎(jiǎng)賞三個(gè)環(huán)節(jié)構(gòu)成一個(gè)狀態(tài)轉(zhuǎn)移空間,,學(xué)習(xí)過程可以用馬爾科夫決策過程來表示。 之前,,強(qiáng)化學(xué)習(xí)的算法訓(xùn)練只能解決很小規(guī)模的狀態(tài)轉(zhuǎn)移空間,。圍棋是超大轉(zhuǎn)移空間的問題,同時(shí)也是個(gè)帶有超長延時(shí)訓(xùn)練標(biāo)注的問題,。一開始的棋難以量化好壞,,雙方要下多步后才能夠數(shù)出各自大概的目數(shù),從而判定輸贏,。AlphaGo將圍棋這一特征視為深度強(qiáng)化學(xué)習(xí)問題,,這個(gè)問題恰恰可以用深度的遞歸神經(jīng)網(wǎng)絡(luò)(diagonal recurrent neural network,DRNN)解決,。DRNN的訓(xùn)練和DCNN沒有太大區(qū)別,。在左右互搏中,AlphaGo局部會(huì)采用一種名為蒙特卡洛搜索樹的隨機(jī)策略進(jìn)行搜索,,令整個(gè)系統(tǒng)能夠自我進(jìn)化,。 AlphaGo是最新深度學(xué)習(xí)方法、棋譜大數(shù)據(jù)以及最新超算體系的總和,,并按現(xiàn)代科學(xué)技術(shù)的指數(shù)式發(fā)展繼續(xù)進(jìn)化,,沒有任何情緒波動(dòng)。盡管在此次人機(jī)大戰(zhàn)中,,人類個(gè)體告負(fù),,但AlphaGo卻是人類挑戰(zhàn)自我的里程碑! 未來人工智能感知的思考 未來人工智能的發(fā)展愿景 “類人服務(wù),、超人感知”愿景 在國內(nèi)外專家看來,,未來人工智能有很多、很高遠(yuǎn)的愿景,。筆者看來,,在人工智能的愿景中,,至少應(yīng)該包括“類人服務(wù)、超人感知”的愿景,,即以類人的方式服務(wù)人類自身,,以超人的方式感知外部世界。類人服務(wù)要求具備類人智能,,具體而言,,從人類的視角看,未來人工智能理應(yīng)在感官和思維上像人,;從機(jī)器的視角看,,未來人工智能應(yīng)該能理解人的行為和情緒。 傳統(tǒng)社會(huì)是一個(gè)二元空間,,人類社會(huì)和物理空間形成互訓(xùn)關(guān)系,。而在信息社會(huì),人,、機(jī),、物三者相互融合,形成一個(gè)三元空間,。未來,,人工智能可進(jìn)行人、機(jī),、物信息的整合,,以超越人類的精度和時(shí)空尺度,感知三元空間的信息關(guān)聯(lián)性,。 交叉學(xué)科的研究,,特別是腦科學(xué)的研究 [4],將進(jìn)一步夯實(shí)機(jī)器學(xué)習(xí)的理論基礎(chǔ),,三元空間的大數(shù)據(jù)和超級(jí)計(jì)算能力將進(jìn)一步提高機(jī)器學(xué)習(xí)的工程能力,。機(jī)器學(xué)習(xí)、大數(shù)據(jù),、超級(jí)計(jì)算機(jī)三者將共同實(shí)現(xiàn)未來人工智能超人感知、類人服務(wù)的愿景,。 類人智能 類人智能是指將類人知覺和類腦思維整合,。如果機(jī)器人具備逼近人類的交互能力,那么擊敗人類的AlphaGo將極有可能進(jìn)化到陪伴人類下圍棋的BetaGo(俗稱為“陪Ta狗”),。 可以從知覺和思維兩個(gè)層面來理解類人智能,。在知覺層面,隨著低成本,、低功耗傳感器的發(fā)展,,未來人工智能將通過視、聽、味,、觸等方式感知和認(rèn)知現(xiàn)實(shí)世界,;在思維層面,未來人工智能則需要實(shí)現(xiàn)類腦計(jì)算,。從長遠(yuǎn)來看,,研究類腦計(jì)算是通往強(qiáng)人工智能的有效方法 [2]。傳統(tǒng)的計(jì)算機(jī)相當(dāng)于左腦,,擅長邏輯思維,,處理數(shù)字;神經(jīng)元芯片相當(dāng)于右腦,,擅長形象思維,,處理圖像。目前,,IBM等公司正著手將兩者整合,,以期實(shí)現(xiàn)全腦的類腦計(jì)算。 三元空間協(xié)同感知 科學(xué)家正在研究人,、機(jī),、物的三元空間協(xié)同感知。從側(cè)重于物理空間的感知層面看,,突破人類肉眼感知的局限性是人工智能的傳統(tǒng)強(qiáng)項(xiàng),,可見光譜、紅外光譜,、太赫茲,、核磁共振等可實(shí)現(xiàn)全譜感知,相當(dāng)于賦予了人類天眼或慧眼,。 從人類社會(huì)層面看,,群體智能新技術(shù)和社會(huì)計(jì)算新學(xué)科不斷涌現(xiàn)。通過利用不同網(wǎng)絡(luò)的大數(shù)據(jù),,可以解決傳統(tǒng)社會(huì)學(xué)調(diào)查方法數(shù)據(jù)稀少的問題,,能更好、更快地分析人群,、組織和社會(huì)的行為,。 立足于信息空間的層面,未來學(xué)家認(rèn)為互聯(lián)網(wǎng)正在向著與人類大腦高度相似的方向進(jìn)化,,它將具備自己的視覺,、聽覺、觸覺,、運(yùn)動(dòng)神經(jīng)系統(tǒng),,也會(huì)擁有自己的記憶神經(jīng)系統(tǒng),、中樞神經(jīng)系統(tǒng)、自主神經(jīng)系統(tǒng),。通過借鑒研究人類智力的方法,,對互聯(lián)網(wǎng)大腦和因?yàn)榛ヂ?lián)網(wǎng)而崛起的人工智能的智力問題進(jìn)行深入研究,最終形成互聯(lián)網(wǎng),、人工智能和人類大腦的聯(lián)合智商,。 我國的人工智能戰(zhàn)略 人工智能已經(jīng)上升為我國的國家戰(zhàn)略,國家“科技創(chuàng)新2030 重大項(xiàng)目”將新增人工智能2.0,。潘云鶴院士于2016 年12 月在中國工程院院刊Engineering(主刊)上,,提出了人工智能2.0 的核心理念 [3]。2017年1 月,,中國工程院院刊信息與電子工程學(xué)部分刊出版了“人工智能2.0”(artificial intelligence 2.0)專題 [4],,潘云鶴、李未,、高文,、鄭南寧、吳澄,、李伯虎,、陳純等院士以及多位專家學(xué)者對人工智能2.0 中所涉及的大數(shù)據(jù)智能、群體智能,、跨媒體智能,、混合增強(qiáng)智能和自主智能等內(nèi)容做了深刻闡述。 AI 有三個(gè)關(guān)鍵部分構(gòu)成,,機(jī)器學(xué)習(xí)是AI 的大腦,,超級(jí)計(jì)算機(jī)是AI 的軀體,大數(shù)據(jù)是AI 成長的養(yǎng)分,。據(jù)統(tǒng)計(jì),,全球43% 的機(jī)器學(xué)習(xí)相關(guān)論文出自中國學(xué)者之手。目前,,我國已有眾多的AI 人才,,形成了AI 垂直產(chǎn)業(yè)應(yīng)用的人才基礎(chǔ)。近年來,,我國的超級(jí)計(jì)算機(jī)發(fā)展迅猛,,“神威·太湖之光”“天河二號(hào)” 超級(jí)計(jì)算機(jī)先后登頂TOP500 排行榜,這給人工智能的發(fā)展提供了堅(jiān)實(shí)的硬件基礎(chǔ),。在大數(shù)據(jù)方面,相對歐美日等國,,我國不僅擁有眾多的“冷數(shù)據(jù)”(包括人口,、地理等靜態(tài)數(shù)據(jù)),,而且擁有更多的“熱數(shù)據(jù)”(比如交易、診療等動(dòng)態(tài)數(shù)據(jù)),,大數(shù)據(jù)優(yōu)勢將有力推動(dòng)我國的AI 研究形成特色,,實(shí)現(xiàn)彎道超車。 未來,,人工智能無疑會(huì)深刻改變?nèi)祟惿?。盡管堅(jiān)信人類能夠與人工智能包容發(fā)展,但仍需要注意人工智能將引起的就業(yè)結(jié)構(gòu)改變和其沖擊倫理關(guān)系所帶來的諸多挑戰(zhàn),。 [ 本文相關(guān)工作得到國家重點(diǎn)研發(fā)計(jì)劃課題(2016YFB1001003),、國家重大科研儀器研制項(xiàng)目(NSFC61527804)等資助。] 楊小康:教授,,認(rèn)知計(jì)算和計(jì)算健康研究中心副主任,,上海交通大學(xué)電子信息與電氣工程學(xué)院,上海 200240,。 Yang Xiaokang:Professor, Vice Director of the Center for Cognitive Machines and Computational Health, School of Electronic Information and Electrical Engineering, Shanghai Jiao Tong University, Shanghai 200240.
關(guān)鍵詞: 人工智能 機(jī)器學(xué)習(xí) 深度學(xué)習(xí) 神經(jīng)網(wǎng)絡(luò) ■ 本文刊載于《科學(xué)》雜志2017年第3期,。 《科學(xué)》雜志于1915年1月在上海問世, 早年由任鴻雋,,趙元任,,胡明復(fù)等學(xué)者編輯寫作, 是我國歷史最長的綜合性科學(xué)刊物,。 雜志定位為高級(jí)科普期刊,,致力于科學(xué)知識(shí)、理念和科學(xué)精神的傳播,,科學(xué)與人文互動(dòng),,歷史和前沿并舉,為提升我國全民科學(xué)素質(zhì)和建設(shè)創(chuàng)新型國家服務(wù),。雜志現(xiàn)任主編為中國科學(xué)院院長白春禮院士,,主辦單位為上海科學(xué)技術(shù)出版社,。 |
|