久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

未來人工智能:從AlphaGo到BetaGo

 圓角望 2017-06-04



2016年,,AlphaGo 4∶1擊敗人類圍棋冠軍,它是否會(huì)進(jìn)化到陪伴人類下棋的BetaGo(陪Ta狗),?

| 作者:楊小康

1956年夏,,麥卡錫(J. McCarthy)、明斯基(M. L. Minsky)等正式提出人工智能(artificial intelligence,,AI)的概念,,標(biāo)志著人工智能學(xué)科誕生。在人工智能發(fā)展60周年的2016年,,谷歌DeepMind AlphaGo戰(zhàn)勝李世石,,樹立了人工智能新的里程碑,。

從AlphaGo看人工智能現(xiàn)狀

AlphaGo的人工智能原理

圍棋是最復(fù)雜的棋類游戲,人類高手下圍棋主要靠宏觀的直覺,,加上局部的計(jì)算,。AlphaGo憑借兩招出奇制勝:深度卷積網(wǎng)絡(luò),模仿高手,,尋找好的落點(diǎn),;深度強(qiáng)化學(xué)習(xí),形成左右互搏,,自我進(jìn)化,。

AlphaGo的第一招:模仿高手,學(xué)習(xí)高手的棋形,。要模仿高手棋形,,AlphaGo需要一個(gè)分類器來判斷棋形是否與高手的棋形相像。圍棋盤可以看成是19×19的圖像,,雖然這個(gè)圖像很小,,但約有250 150種變化。將這些變化分成高手棋形,、非高手棋形,,是一個(gè)挺難的機(jī)器學(xué)習(xí)問題,主要難在高手棋形的特征不好定義,、不易提取,。在人臉識(shí)別、車牌識(shí)別中,,可以定義顏色,、邊緣、關(guān)鍵點(diǎn)等特征,,顯然圍棋棋形的特征不能使用同樣的方法,。

AlphaGo使用了最新圖像分類器——深度卷積神經(jīng)網(wǎng)絡(luò)(deep convolutional neural network,DCNN),,可以自動(dòng)學(xué)習(xí)圖像中好的特征,。不同于傳統(tǒng)的人工神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)的層數(shù)特別多,,學(xué)習(xí)和分類的能力非常強(qiáng),。神經(jīng)網(wǎng)絡(luò)早在1943年就已提出,在1950年代末和1980年代曾興起過兩波研究熱潮,。以前的人工神經(jīng)網(wǎng)絡(luò)層數(shù)很淺,,只能解決一些簡單識(shí)別問題。2000年前后,欣頓(G. Hinton)等提出一套預(yù)訓(xùn)練后向傳播的方法,,解決了深度學(xué)習(xí)問題 [1],。DCNN是專門針對圖像識(shí)別的深度學(xué)習(xí)方法,對局部圖像進(jìn)行卷積計(jì)算,,效率很高,。

深度學(xué)習(xí)能夠發(fā)揮巨大威力的前提是,必須要有大量的數(shù)據(jù)才能訓(xùn)練深度結(jié)構(gòu),。深度學(xué)習(xí)會(huì)涉及上百萬,、甚至上億的參數(shù),如果數(shù)據(jù)不夠,,很容易過擬合,、性能降低。此外,,進(jìn)行這樣大規(guī)模的訓(xùn)練,,需要超強(qiáng)的計(jì)算能力。據(jù)說,,AlphaGo存有15萬職業(yè)棋手,、百萬業(yè)余高手的棋譜,訓(xùn)練的時(shí)候會(huì)用到1202個(gè)中央處理單元(central processing unit,,CPU)和176個(gè)圖形處理單元(graphics processing unit,,GPU),。

AlphaGo的第二招:自我學(xué)習(xí),,自我進(jìn)化。 模仿高手還不足以超越高手,。為超越頂尖高手,,AlphaGo用了一個(gè)自我學(xué)習(xí)的機(jī)制,就像金庸小說《射雕英雄傳》中的老頑童周伯通,,左右互搏,。人類高手通過自我復(fù)盤、擺棋譜來提高棋藝,,但是人類高手復(fù)盤慢,,一次復(fù)盤往往需要數(shù)小時(shí)甚至數(shù)天,其間棋手還需要吃飯,、休息,。而AlphaGo只要有電就可以一直左右“互搏”下去,其復(fù)盤速度極快,,每分鐘就可以研究上萬盤棋,,這樣的特性使得AlphaGo有可能在學(xué)習(xí)速度上超越人類高手

為了達(dá)到左右互搏的效果,AlphaGo采用了一個(gè)名為深度強(qiáng)化學(xué)習(xí)的技術(shù),。強(qiáng)化學(xué)習(xí)很符合智能體(agent)的學(xué)習(xí)規(guī)律,,類似孩子在不斷跌倒中自我強(qiáng)化學(xué)會(huì)走路,猴子在胡蘿卜加大棒下自我強(qiáng)化學(xué)會(huì)表演,。強(qiáng)化學(xué)習(xí)有兩個(gè)特點(diǎn),,一是智能體通過環(huán)境交互學(xué)習(xí),二是訓(xùn)練標(biāo)注稀少,,且通常有一定的延時(shí),。強(qiáng)化學(xué)習(xí)主要通過感知、行動(dòng),、獎(jiǎng)賞三個(gè)環(huán)節(jié)構(gòu)成一個(gè)狀態(tài)轉(zhuǎn)移空間,,學(xué)習(xí)過程可以用馬爾科夫決策過程來表示。

之前,,強(qiáng)化學(xué)習(xí)的算法訓(xùn)練只能解決很小規(guī)模的狀態(tài)轉(zhuǎn)移空間,。圍棋是超大轉(zhuǎn)移空間的問題,同時(shí)也是個(gè)帶有超長延時(shí)訓(xùn)練標(biāo)注的問題,。一開始的棋難以量化好壞,,雙方要下多步后才能夠數(shù)出各自大概的目數(shù),從而判定輸贏,。AlphaGo將圍棋這一特征視為深度強(qiáng)化學(xué)習(xí)問題,,這個(gè)問題恰恰可以用深度的遞歸神經(jīng)網(wǎng)絡(luò)(diagonal recurrent neural network,DRNN)解決,。DRNN的訓(xùn)練和DCNN沒有太大區(qū)別,。在左右互搏中,AlphaGo局部會(huì)采用一種名為蒙特卡洛搜索樹的隨機(jī)策略進(jìn)行搜索,,令整個(gè)系統(tǒng)能夠自我進(jìn)化,。

AlphaGo是最新深度學(xué)習(xí)方法、棋譜大數(shù)據(jù)以及最新超算體系的總和,,并按現(xiàn)代科學(xué)技術(shù)的指數(shù)式發(fā)展繼續(xù)進(jìn)化,,沒有任何情緒波動(dòng)。盡管在此次人機(jī)大戰(zhàn)中,,人類個(gè)體告負(fù),,但AlphaGo卻是人類挑戰(zhàn)自我的里程碑!

未來人工智能感知的思考

未來人工智能的發(fā)展愿景

“類人服務(wù),、超人感知”愿景

在國內(nèi)外專家看來,,未來人工智能有很多、很高遠(yuǎn)的愿景,。筆者看來,,在人工智能的愿景中,,至少應(yīng)該包括“類人服務(wù)、超人感知”的愿景,,即以類人的方式服務(wù)人類自身,,以超人的方式感知外部世界。類人服務(wù)要求具備類人智能,,具體而言,,從人類的視角看,未來人工智能理應(yīng)在感官和思維上像人,;從機(jī)器的視角看,,未來人工智能應(yīng)該能理解人的行為和情緒。

傳統(tǒng)社會(huì)是一個(gè)二元空間,,人類社會(huì)和物理空間形成互訓(xùn)關(guān)系,。而在信息社會(huì),人,、機(jī),、物三者相互融合,形成一個(gè)三元空間,。未來,,人工智能可進(jìn)行人、機(jī),、物信息的整合,,以超越人類的精度和時(shí)空尺度,感知三元空間的信息關(guān)聯(lián)性,。

交叉學(xué)科的研究,,特別是腦科學(xué)的研究 [4],將進(jìn)一步夯實(shí)機(jī)器學(xué)習(xí)的理論基礎(chǔ),,三元空間的大數(shù)據(jù)和超級(jí)計(jì)算能力將進(jìn)一步提高機(jī)器學(xué)習(xí)的工程能力,。機(jī)器學(xué)習(xí)、大數(shù)據(jù),、超級(jí)計(jì)算機(jī)三者將共同實(shí)現(xiàn)未來人工智能超人感知、類人服務(wù)的愿景,。

類人智能

類人智能是指將類人知覺和類腦思維整合,。如果機(jī)器人具備逼近人類的交互能力,那么擊敗人類的AlphaGo將極有可能進(jìn)化到陪伴人類下圍棋的BetaGo(俗稱為“陪Ta狗”),。

可以從知覺和思維兩個(gè)層面來理解類人智能,。在知覺層面,隨著低成本,、低功耗傳感器的發(fā)展,,未來人工智能將通過視、聽、味,、觸等方式感知和認(rèn)知現(xiàn)實(shí)世界,;在思維層面,未來人工智能則需要實(shí)現(xiàn)類腦計(jì)算,。從長遠(yuǎn)來看,,研究類腦計(jì)算是通往強(qiáng)人工智能的有效方法 [2]。傳統(tǒng)的計(jì)算機(jī)相當(dāng)于左腦,,擅長邏輯思維,,處理數(shù)字;神經(jīng)元芯片相當(dāng)于右腦,,擅長形象思維,,處理圖像。目前,,IBM等公司正著手將兩者整合,,以期實(shí)現(xiàn)全腦的類腦計(jì)算。

三元空間協(xié)同感知

科學(xué)家正在研究人,、機(jī),、物的三元空間協(xié)同感知。從側(cè)重于物理空間的感知層面看,,突破人類肉眼感知的局限性是人工智能的傳統(tǒng)強(qiáng)項(xiàng),,可見光譜、紅外光譜,、太赫茲,、核磁共振等可實(shí)現(xiàn)全譜感知,相當(dāng)于賦予了人類天眼或慧眼,。

從人類社會(huì)層面看,,群體智能新技術(shù)和社會(huì)計(jì)算新學(xué)科不斷涌現(xiàn)。通過利用不同網(wǎng)絡(luò)的大數(shù)據(jù),,可以解決傳統(tǒng)社會(huì)學(xué)調(diào)查方法數(shù)據(jù)稀少的問題,,能更好、更快地分析人群,、組織和社會(huì)的行為,。

立足于信息空間的層面,未來學(xué)家認(rèn)為互聯(lián)網(wǎng)正在向著與人類大腦高度相似的方向進(jìn)化,,它將具備自己的視覺,、聽覺、觸覺,、運(yùn)動(dòng)神經(jīng)系統(tǒng),,也會(huì)擁有自己的記憶神經(jīng)系統(tǒng),、中樞神經(jīng)系統(tǒng)、自主神經(jīng)系統(tǒng),。通過借鑒研究人類智力的方法,,對互聯(lián)網(wǎng)大腦和因?yàn)榛ヂ?lián)網(wǎng)而崛起的人工智能的智力問題進(jìn)行深入研究,最終形成互聯(lián)網(wǎng),、人工智能和人類大腦的聯(lián)合智商,。

我國的人工智能戰(zhàn)略

人工智能已經(jīng)上升為我國的國家戰(zhàn)略,國家“科技創(chuàng)新2030 重大項(xiàng)目”將新增人工智能2.0,。潘云鶴院士于2016 年12 月在中國工程院院刊Engineering(主刊)上,,提出了人工智能2.0 的核心理念 [3]。2017年1 月,,中國工程院院刊信息與電子工程學(xué)部分刊出版了“人工智能2.0”(artificial intelligence 2.0)專 [4],,潘云鶴、李未,、高文,、鄭南寧、吳澄,、李伯虎,、陳純等院士以及多位專家學(xué)者對人工智能2.0 中所涉及的大數(shù)據(jù)智能、群體智能,、跨媒體智能,、混合增強(qiáng)智能和自主智能等內(nèi)容做了深刻闡述。

AI 有三個(gè)關(guān)鍵部分構(gòu)成,,機(jī)器學(xué)習(xí)是AI 的大腦,,超級(jí)計(jì)算機(jī)是AI 的軀體,大數(shù)據(jù)是AI 成長的養(yǎng)分,。據(jù)統(tǒng)計(jì),,全球43% 的機(jī)器學(xué)習(xí)相關(guān)論文出自中國學(xué)者之手。目前,,我國已有眾多的AI 人才,,形成了AI 垂直產(chǎn)業(yè)應(yīng)用的人才基礎(chǔ)。近年來,,我國的超級(jí)計(jì)算機(jī)發(fā)展迅猛,,“神威·太湖之光”“天河二號(hào)” 超級(jí)計(jì)算機(jī)先后登頂TOP500 排行榜,這給人工智能的發(fā)展提供了堅(jiān)實(shí)的硬件基礎(chǔ),。在大數(shù)據(jù)方面,相對歐美日等國,,我國不僅擁有眾多的“冷數(shù)據(jù)”(包括人口,、地理等靜態(tài)數(shù)據(jù)),,而且擁有更多的“熱數(shù)據(jù)”(比如交易、診療等動(dòng)態(tài)數(shù)據(jù)),,大數(shù)據(jù)優(yōu)勢將有力推動(dòng)我國的AI 研究形成特色,,實(shí)現(xiàn)彎道超車。

未來,,人工智能無疑會(huì)深刻改變?nèi)祟惿?。盡管堅(jiān)信人類能夠與人工智能包容發(fā)展,但仍需要注意人工智能將引起的就業(yè)結(jié)構(gòu)改變和其沖擊倫理關(guān)系所帶來的諸多挑戰(zhàn),。


[ 本文相關(guān)工作得到國家重點(diǎn)研發(fā)計(jì)劃課題(2016YFB1001003),、國家重大科研儀器研制項(xiàng)目(NSFC61527804)等資助。]


楊小康:教授,,認(rèn)知計(jì)算和計(jì)算健康研究中心副主任,,上海交通大學(xué)電子信息與電氣工程學(xué)院,上海 200240,。

Yang Xiaokang:Professor, Vice Director of the Center for Cognitive Machines and Computational Health, School of Electronic Information and Electrical Engineering, Shanghai Jiao Tong University, Shanghai 200240.



  1. Hinton G, LeCun Y, Bengio Y. Deep learning. Nature, 2015, 521(7553): 436 – 444.

  2. 蒲慕明, 徐波, 譚鐵牛. 腦科學(xué)與類腦研究概述. 中國科學(xué)院院刊, 2016: 31(7): 725-736.

  3. Pan Y H. Heading toward artificial intelligence 2.0. Engineering , 2016: 409 – 413.

  4. Pan Y H, Li W, Gao W, et al. Special issue on artificial intelligence 2.0. Frontiers of Information Technology & Electronic Engineering, 2017: 1-152.


關(guān)鍵詞人工智能  機(jī)器學(xué)習(xí)  深度學(xué)習(xí)  神經(jīng)網(wǎng)絡(luò)  


  本文刊載于《科學(xué)》雜志2017年第3期,。

《科學(xué)》雜志于1915年1月在上海問世,

 早年由任鴻雋,,趙元任,,胡明復(fù)等學(xué)者編輯寫作,

是我國歷史最長的綜合性科學(xué)刊物,。

雜志定位為高級(jí)科普期刊,,致力于科學(xué)知識(shí)、理念和科學(xué)精神的傳播,,科學(xué)與人文互動(dòng),,歷史和前沿并舉,為提升我國全民科學(xué)素質(zhì)和建設(shè)創(chuàng)新型國家服務(wù),。雜志現(xiàn)任主編為中國科學(xué)院院長白春禮院士,,主辦單位為上海科學(xué)技術(shù)出版社,。


    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn),。請注意甄別內(nèi)容中的聯(lián)系方式,、誘導(dǎo)購買等信息,謹(jǐn)防詐騙,。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請遵守用戶 評(píng)論公約

    類似文章 更多