雷鋒網(wǎng)按:2018 全球人工智能與機(jī)器人峰會(huì)(CCF-GAIR)在深圳召開,,峰會(huì)由中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)主辦,,雷鋒網(wǎng)、香港中文大學(xué)(深圳)承辦,,得到了深圳市政府的大力指導(dǎo),,是國(guó)內(nèi)人工智能和機(jī)器人學(xué)術(shù)界、工業(yè)界及投資界三大領(lǐng)域的頂級(jí)交流盛會(huì),,旨在打造國(guó)內(nèi)人工智能領(lǐng)域最具實(shí)力的跨界交流合作平臺(tái),。 6 月 29 日上午,清華大學(xué)研究院院長(zhǎng)張鈸院士為 CCF-GAIR 2018 主會(huì)場(chǎng)「AI 前沿技術(shù)」做了題為「走向真正的人工智能」(Towards A Real Artifitial Intelligence)的大會(huì)報(bào)告,。以下為張鈸院士所做的大會(huì)報(bào)告全文,,感謝張鈸院士逐字修改。雷鋒網(wǎng)做了不改動(dòng)原意的編輯。 CCF-GAIR 2018 程序主席朱曉蕊:大家好,,我們大會(huì)第一個(gè)環(huán)節(jié)的題目是「AI 前沿技術(shù)」,。最近幾年 AI 一直都很熱,很多人都會(huì)問,,這個(gè) AI 到底能熱多久,?我想其中一個(gè)很重要的因素就是 AI 的前沿技術(shù)到底能做得有多么深入。因此我建議大家今天不妨仔細(xì)聽聽下面幾位嘉賓的演講,,或許大家能從中得到一些答案,。 首先有請(qǐng)清華大學(xué)張鈸院士為我們作大會(huì)報(bào)告。張?jiān)菏渴侵袊?guó)科學(xué)院院士,、清華大學(xué)教授,,現(xiàn)任清華大學(xué)人工智能研究院院長(zhǎng),張?jiān)菏恐饕菑氖氯斯ぶ悄芾碚?、人工神?jīng)網(wǎng)絡(luò),、遺傳算法、分形和小波等理論研究,,以及把上述理論應(yīng)用于模式識(shí)別,、知識(shí)工程、智能機(jī)器人與智能控制等領(lǐng)域的應(yīng)用研究,,他今天的報(bào)告題目是「走向真正的人工智能」,,有請(qǐng)張?jiān)菏俊?/p> 張鈸:各位領(lǐng)導(dǎo)、各位專家,,今天給我 45 分鐘的時(shí)間,我講 40 分鐘,,因?yàn)闀?huì)議的議程已經(jīng)延遲了,。 我今天要講的中心思想就是:我們現(xiàn)在離真正的人工智能還有一段很長(zhǎng)的路。為了講清這個(gè)思想,,我必須回答下面三個(gè)問題:第一,,什么叫做真正的人工智能?我們的目標(biāo)是什么,?第二,,為什么我們需要真正的人工智能?第三,,我們?nèi)绾巫呦蛘嬲娜斯ぶ悄埽?/strong>我現(xiàn)在回答這三個(gè)問題,。 首先我們?nèi)绾卧u(píng)價(jià)目前人工智能取得的成果,我們的評(píng)價(jià)很簡(jiǎn)單,,針對(duì)這 5 件事: 第一是深藍(lán)打敗人類國(guó)際象棋冠軍,;第二是 IBM 在電視知識(shí)競(jìng)賽中打敗了美國(guó)的前兩個(gè)冠軍,這兩件事是一種類型,,后面的三件事是另外一種類型,;即 2015 年微軟在 ImageNet 上做圖象識(shí)別,,它的誤識(shí)率略低于人類。還有百度,、訊飛也都宣布在單句的中文語音識(shí)別上,,它的誤識(shí)率也略低于人類。還有一個(gè)是大家非常熟悉的 AlphaGo 打敗了李世石,。這 5 件事情都是機(jī)器在一定的范圍內(nèi)超過了人類,,我們?nèi)绾蝸碓u(píng)價(jià)這 5 件事? 大家一致認(rèn)為這 5 件事之所以成功,,是由于前面三個(gè)因素,,一是大數(shù)據(jù),二是計(jì)算能力提高,,第三是有非常好的人工智能算法,。這三個(gè)因素大家都討論得非常多了,沒必要我再來說,,我現(xiàn)在要說的最后一個(gè)因素是被大家所忽略的,,這個(gè)因素是說,這所有的成果必須建立在一個(gè)合適的應(yīng)用場(chǎng)景下,。這 5 件事雖然領(lǐng)域很不一樣,,但是它們都滿足完全一樣的條件,或滿足下面的 5 個(gè)限制,,首先你必須有豐富的數(shù)據(jù)或者豐富的知識(shí),,如果這兩件東西沒有,或者很少,,你不用來談人工智能,,因?yàn)槟銦o法實(shí)現(xiàn)無米之炊。人工智能唯一的兩個(gè)資源,,一個(gè)是數(shù)據(jù),,一個(gè)是知識(shí)。還有確定性信息,、完全信息,、靜態(tài)的、單任務(wù)和有限領(lǐng)域,。這 5 個(gè)條件里面任何一個(gè)條件不滿足,,現(xiàn)在的人工智能做起來就非常困難了。 大家想想這 5 個(gè)限制條件下的應(yīng)用場(chǎng)景是什么樣的應(yīng)用場(chǎng)景,?就是照章辦事,,不需要任何靈活性,這顯然不是智能的核心。 我們現(xiàn)在分析一下上述 5 個(gè)場(chǎng)景,。下象棋是完全信息博弈,,信息完全和確定,沒有問題,。其次,,它遵循著完全確定的游戲規(guī)則演化,我們把這種情況也叫做靜態(tài),。Watson 機(jī)器人也是這樣,,Watson 是什么樣的對(duì)話問題呢?它為什么選擇知識(shí)競(jìng)賽呢,?我們知道知識(shí)競(jìng)賽提的問題都沒有二義性,,都是明確的,它的答案總是唯一性的,。所以這樣的問答對(duì)機(jī)器人來講是非常容易的,。它涉及的領(lǐng)域雖然比較寬,但也是有限的,,包括大家覺得很玄乎的圍棋,,也完全符合上面 5 個(gè)條件,所以對(duì)計(jì)算機(jī)來說也是很容易的,。目前計(jì)算機(jī)打麻將就不行,,因?yàn)榕祁愂遣煌耆畔⒉┺模员绕孱愐y,??傊覀儗?duì)目前人工智能取得的成果要有一個(gè)正確的評(píng)價(jià),。 目前的人工智能技術(shù)在以下領(lǐng)域都可以找到它的應(yīng)用,,它們是交通、服務(wù),、教育、娛樂等等,,但我要強(qiáng)調(diào)是這些領(lǐng)域里面只有滿足上述 5 個(gè)條件的事情,,計(jì)算機(jī)做起來才會(huì)容易,如果不滿足這些條件,,計(jì)算機(jī)就做起來就困難了,。大家常常關(guān)心什么樣的工作會(huì)被機(jī)器所替代,我可以明確告訴大家,,滿足這 5 個(gè)條件的工作,,總有一天會(huì)被計(jì)算機(jī)取代,就是那些照章辦事,不需要任何靈活性的工作,,比如說出納員,、收銀員等等。在座的所有工作都不可能被計(jì)算機(jī)完全代替,,但不排斥你的工作中有一部分會(huì)被計(jì)算機(jī)取代,,老師、企業(yè)家等的工作不可能被計(jì)算機(jī)完全代替,。 為什么有這 5 個(gè)限制,?原因在于我們現(xiàn)在的人工智能是沒有理解的人工智能。 我們先看符號(hào)模型,,理性行為的模型,,舉 Watson 的例子,它是個(gè)對(duì)話系統(tǒng),,我們現(xiàn)在所有做的對(duì)話系統(tǒng)都跟這個(gè)差不多,,但是 Watson 做得更好些,它里面有知識(shí)庫,,有推理機(jī)制,。沃森除了專家知識(shí)之外,還有大量互聯(lián)網(wǎng)上大眾的知識(shí),,還運(yùn)用了多推理機(jī)制,。請(qǐng)看,這就是 Watson 系統(tǒng)的體系結(jié)構(gòu),。它里面有哪些知識(shí)呢,?有很多,包括百科全書,、有線新聞,、文學(xué)作品等等。所有的知識(shí)用紙質(zhì)來表示有 2 億頁,,用存儲(chǔ)量表示達(dá)到了 4TB,。它能回答什么問題呢?用它的例子來說明,。第一個(gè)問題,,1974 年 9 月 8 日誰被總統(tǒng)赦免?這對(duì)美國(guó)人來講很好回答,,同樣對(duì)計(jì)算機(jī)來講也很好回答,,你用這幾個(gè)關(guān)鍵字「1974 年 9 月 8 日」、「被總統(tǒng)赦免」,,就能在文獻(xiàn)里頭查出來是誰,,他就是尼克松,。也就是說根據(jù)問題中的關(guān)鍵字,可以在已有的文獻(xiàn)里頭直接找到答案,,這就是一般的網(wǎng)絡(luò)檢索方法,。 第二個(gè)問題,熒光粉受到電子撞擊以后,,它的電磁能以什么方式釋放出來,?我們用「熒光粉」、「電子撞擊」,、「釋放電磁能」等關(guān)鍵詞,,也可以找到答案:「光或者光子」。這種方法就是平時(shí)網(wǎng)絡(luò)搜索的原理,,應(yīng)該說沒有什么智能,。 回答下面的問題就需要「智能」了,跟智利陸地邊界最長(zhǎng)的是哪個(gè)國(guó)家,?跟智利有陸地邊界的國(guó)家可以檢索到,,它們是阿根廷和玻利維亞,但是誰的邊境長(zhǎng),?通常查不到,。Watson 具備一定的推理能力,它從邊界間發(fā)生的事件,、邊界的地理位置等等,,經(jīng)過分析推理以后就可以找出答案,它就是阿根廷,。下一個(gè)問題也屬于這種性質(zhì),,跟美國(guó)沒有外交關(guān)系的國(guó)家中哪個(gè)最靠北,跟美國(guó)沒有外交關(guān)系的國(guó)家有 4 個(gè),,只要檢索就行了,,但是哪個(gè)國(guó)家最靠北,沒有直接答案,,但可以從其它信息中推導(dǎo)出來,,比如各個(gè)國(guó)家所處的緯度、氣候寒冷的程度等等分析出來,,答案是北朝鮮,。 智能體現(xiàn)在推理能力上。但是很不幸,,現(xiàn)在的對(duì)話系統(tǒng)推理能力都很差。Watson 系統(tǒng)好一些,,但也很有限,。換句話說,,我們現(xiàn)在的對(duì)話系統(tǒng)離真正的智能還很遠(yuǎn)。 我們通過索菲亞機(jī)器人就可以看出來,,索菲亞的對(duì)話是面向開放領(lǐng)域,,你可以隨便提問,問題就暴露出來了,。大家在電視上看到索菲亞侃侃而談,,問什么問題都能答得很好,這里面有玄機(jī),,如果你的問題是預(yù)先提出來的,,因?yàn)槔镱^有答案,因此回答得非常好,,在電視上給大家演示的都是這種情況,。 如果我們臨時(shí)提問題,問題就出來了,。這是一個(gè)中國(guó)記者給索菲亞提的 4 個(gè)問題,,它只答對(duì)了一個(gè)?!改銕讱q了」,,這個(gè)問題很簡(jiǎn)單,它答不上來,,它的回答是「你好,,你看起來不錯(cuò)」,答非所問,,因?yàn)樗焕斫饽闼鶈柕膯栴},。只有第二個(gè)問題它是有準(zhǔn)備的,里面有答案,,所以答得很好,。「你的老板是誰」,,這個(gè)肯定它有準(zhǔn)備,。第三個(gè)問題,「你能回答多少問題呢」,?它說「請(qǐng)繼續(xù)」,,沒聽懂!,。再問第四個(gè)問題,,「你希望我問你什么問題呢」?它說「你經(jīng)常在北京做戶外活動(dòng)嗎」,?這就告訴我們說,,現(xiàn)代的問答系統(tǒng)基本上沒有理解,,只有少數(shù)有少量的理解,像 Watson 這樣算是比較好的,。 為什么會(huì)這樣,?也就是說我們現(xiàn)在的人工智能基本方法有缺陷,我們必須走向具有理解的 AI,,這才是真正的人工智能,。我這里提出的概念跟強(qiáng)人工智能有什么區(qū)別?首先我們說它在這點(diǎn)上是相同的,,我們都試圖去準(zhǔn)確地描述人類的智能行為,,希望人工智能跟人類的智能相近,這也是強(qiáng)人工智能的一個(gè)目標(biāo),,但是強(qiáng)人工智能只是從概念上提出來,,并沒有從方法上提出怎么解決。大家知道強(qiáng)人工智能提出了一個(gè)最主要的概念,,就是通用人工智能,。怎么個(gè)通用法?它沒有回答,。我們現(xiàn)在提出來的有理解的人工智能是可操作的,,不只是概念,這是我們跟強(qiáng)人工智能的區(qū)別,。 人機(jī)對(duì)話的時(shí)候,,機(jī)器為什么不能理解人們提的問題。我們看一個(gè)例子就知道了,,我們?cè)谥R(shí)庫里把「特朗普是美國(guó)總統(tǒng)」這個(gè)事實(shí),,用「特朗普-總統(tǒng)-美國(guó)」這三元組存在計(jì)算機(jī)里面,如果你提的問題是「誰是美國(guó)總統(tǒng)」,?機(jī)器馬上回答出來:「特朗普」,。但是你如果問其它有關(guān)的問題,如「特朗普是一個(gè)人嗎」,?「特朗普是一個(gè)美國(guó)人嗎」,?「美國(guó)有沒有總統(tǒng)」?它都回答不了,。它太傻了,,任何一個(gè)小學(xué)生,你只要告訴他特朗普是美國(guó)總統(tǒng),,后面這幾個(gè)問題他們絕對(duì)回答得出來,。機(jī)器為什么回答不了后面的三個(gè)問題呢?就是這個(gè)系統(tǒng)太笨了,,沒有常識(shí),,也沒有常識(shí)推理,。既然特朗普是美國(guó)的總統(tǒng),美國(guó)當(dāng)然有總統(tǒng),,但是它連這一點(diǎn)常識(shí)的推理能力都沒有。所以要解決這個(gè)問題,,必須在系統(tǒng)中加上常識(shí)庫,、常識(shí)推理,沒有做到這一步,,人機(jī)對(duì)話系統(tǒng)中機(jī)器不可能具有理解能力,。但是大家知道,建立常識(shí)庫是一項(xiàng)「AI 的曼哈頓工程」,。大家想想常識(shí)庫多么不好建,,怎么告訴計(jì)算機(jī),什么叫吃飯,,怎么告訴計(jì)算機(jī),,什么叫睡覺,什么叫做睡不著覺,,什么叫做夢(mèng),,這些對(duì)人工智能來說都非常難,美國(guó)在 1984 年就搞了這樣一個(gè)常識(shí)庫的工程,,做到現(xiàn)在還沒完全做出來,。可見,,要走向真正的人工智能,,有理解的人工智能,是一條很漫長(zhǎng)的路,。 這里介紹一點(diǎn)我們現(xiàn)在做的工作,,加入常識(shí)以后,對(duì)話的性能會(huì)不會(huì)有所改善,。我們的基本做法是建立一個(gè)常識(shí)圖譜,,用這個(gè)圖譜幫助理解提出的「問題」,同時(shí)利用常識(shí)圖譜幫助產(chǎn)生合適的答案,。 下面就涉及到具體怎么做了,,我不詳細(xì)說了,我就說結(jié)果,,結(jié)果是有了常識(shí)以后,,性能有了顯著的改善,對(duì)話的質(zhì)量提高了,。這篇文章已經(jīng)發(fā)表,,有興趣可以去閱讀,。 另外是準(zhǔn)符號(hào)模型,深度學(xué)習(xí),、神經(jīng)網(wǎng)絡(luò)主要用來模擬感性行為,,感性行為是一般很難采用符號(hào)模型,因?yàn)楦行裕ǜ杏X)沒法精確描述,。比如「馬」,,怎么告訴計(jì)算機(jī)什么叫做馬?你說馬有四條腿,,什么叫做腿,?你說細(xì)長(zhǎng)的叫做腿,什么叫細(xì),?什么叫做長(zhǎng),?沒法告訴機(jī)器,因此不能用符號(hào)模型,。目前用的辦法就是我們現(xiàn)在說的神經(jīng)網(wǎng)絡(luò)或者準(zhǔn)符號(hào)模型,,也就是用人類同樣的辦法,學(xué)習(xí),、訓(xùn)練,。我不告訴機(jī)器什么叫做馬,只是給不同的馬的圖片給它看,,進(jìn)行訓(xùn)練,。訓(xùn)練完以后,然后再用沒見過的馬的圖片給它看,,說對(duì)了,,就是識(shí)別正確了,說不對(duì)就是識(shí)別不正確,,如果 90% 是對(duì)的,,就說明它的識(shí)別率是 90%。后來從淺層的神經(jīng)網(wǎng)絡(luò)又發(fā)展到多層的神經(jīng)網(wǎng)絡(luò),,從淺層發(fā)展到多層有兩個(gè)本質(zhì)性的變化,,一個(gè)本質(zhì)性的變化就是輸入,深層網(wǎng)絡(luò)一般不用人工選擇的特征,,用原始數(shù)據(jù)就行,。所以深度學(xué)習(xí)的應(yīng)用門檻降低了,你不要有專業(yè)知識(shí),,把原始數(shù)據(jù)輸進(jìn)去就行了,。第二個(gè)是它的性能提高很多,所以現(xiàn)在深度學(xué)習(xí)用得很多,原因就在這個(gè)地方,。 通過數(shù)據(jù)驅(qū)動(dòng)建立的系統(tǒng)能不能算是有智能呢,?必須打一個(gè)很大的問號(hào),就是說你做出來的人臉識(shí)別系統(tǒng)甚至識(shí)別率會(huì)比人還高,,但是我們還不能說它有智能,,為什么呢?這種通過數(shù)據(jù)驅(qū)動(dòng)做出來的系統(tǒng),,它的性能跟人類差別非常大,,魯棒性很差,很容易受干擾,,會(huì)發(fā)生重大的錯(cuò)誤,需要大量的訓(xùn)練樣本,。我們剛才已經(jīng)說過,,給定一個(gè)圖像庫我們可以做到機(jī)器的識(shí)別率比人還要高,也就是說它可以識(shí)別各種各樣的物體,,但是這樣的系統(tǒng),,我如果用這個(gè)噪聲輸給它,我可以讓它識(shí)別成為知更鳥,,我用另外的噪聲輸給它,,可以讓它識(shí)別成為獵豹。換句話講,,這樣的系統(tǒng)只是一個(gè)機(jī)械的分類器,,根本不是感知系統(tǒng)。也就是說它盡管把各種各樣動(dòng)物分得很清楚,,但是它不認(rèn)識(shí)這個(gè)動(dòng)物,,它盡管可以把獵豹跟知更鳥分開,但是它本質(zhì)上不認(rèn)識(shí)知更鳥和獵豹,,它只到達(dá)了感覺的水平,,并沒有達(dá)到感知的水平,它只是「感」,,沒有上升到「知」,。我們的結(jié)論是,只依靠深度學(xué)習(xí)很難到達(dá)真正的智能,。這是很嚴(yán)峻的結(jié)論,,因?yàn)槿绻羞@樣的問題,在決策系統(tǒng)里頭是不能用這樣的系統(tǒng),,因?yàn)樗鼤?huì)犯大錯(cuò),。我在很多場(chǎng)合講過,人類的最大的優(yōu)點(diǎn)是「小錯(cuò)不斷、大錯(cuò)不犯」,,機(jī)器最大的缺點(diǎn)是「小錯(cuò)不犯,,一犯就犯大錯(cuò)」。這在決策系統(tǒng)里頭是不允許的,,這就顯示人跟機(jī)器的截然不同,,人非常聰明,所以他做什么事都很靈活,,這就使得他很容易犯各種各樣的小錯(cuò),。但是他很理性,很難發(fā)生大錯(cuò),。計(jì)算機(jī)很笨,,但是很認(rèn)真,小錯(cuò)誤絕對(duì)不會(huì)犯,,但是它一犯就是天大的錯(cuò)誤,。剛才把那個(gè)把噪聲看成知更鳥,這不是大錯(cuò)嗎,?你把敵人的大炮看成一匹馬,,不是大錯(cuò)嗎?但是人類不會(huì)發(fā)生這種錯(cuò)誤,,人類只會(huì)把騾看成驢,,但是計(jì)算機(jī)的識(shí)別系統(tǒng)會(huì)把驢看成一塊石頭。原因在哪兒,?原因還是 AI 的理解能力問題,。 我們看這個(gè)自動(dòng)駕駛,過去講得很多,,而且講得很樂觀,,我們看看問題在什么地方。我們現(xiàn)在是這樣做,,我們通過數(shù)據(jù)驅(qū)動(dòng)的學(xué)習(xí)方法,,學(xué)習(xí)不同場(chǎng)景下的圖象分割,并判別是車輛還是行人,、道路等,,然后建立三維模型,在三維模型上規(guī)劃行駛路徑?,F(xiàn)在用硬件已經(jīng)可以做到實(shí)時(shí),,請(qǐng)問大家,這樣能不能解決問題,?如果路況比較簡(jiǎn)單,,行人、車輛很少,勉強(qiáng)可以用,。復(fù)雜的路況就用不了,。什么原因?非常簡(jiǎn)單,,好多人總結(jié)出這個(gè)經(jīng)驗(yàn),,行人或者司機(jī)都會(huì)有意無意破壞交通規(guī)則,包括外國(guó)人也一樣,,中國(guó)人更嚴(yán)重一點(diǎn),。這就使得數(shù)據(jù)驅(qū)動(dòng)方法失效,比如說我們可以用數(shù)據(jù)驅(qū)動(dòng)方法來了解各種各樣行人的行為,,我們可以通過大量進(jìn)行訓(xùn)練,,都訓(xùn)練完以后,如果出現(xiàn)新的情況呢,?計(jì)算機(jī)能理解這是人從底下鉆過來,,很危險(xiǎn)嗎?所以你不可能把所有情況都訓(xùn)練到,。自動(dòng)駕駛不可能對(duì)付突發(fā)事件,如果這個(gè)突發(fā)事件它沒見過,,它就解決不了,。怎么來解決這個(gè)問題呢?實(shí)際上就是要解決從「Without」到「With」理解的問題,。人工智能現(xiàn)在有兩種基本方法,,一種是用符號(hào)模型來模擬理性行為,符號(hào)模型可以表達(dá)信息的內(nèi)容,,所以它是在一個(gè)語義的符號(hào)空間里頭,,但是非常不幸,這個(gè)離散的符號(hào)表示,,數(shù)學(xué)工具很難用,,很多數(shù)學(xué)工具用不上去,所以它發(fā)展很慢,。在模擬感性行為的時(shí)候,,我們用的是特征空間的向量,向量就是數(shù),,可以把所有的數(shù)學(xué)工具都用上,,優(yōu)化的工具、概率統(tǒng)計(jì)的工具全部用上,。所以數(shù)據(jù)驅(qū)動(dòng)方法這幾年發(fā)展非??欤匐y的問題,下圍棋非常難吧,,計(jì)算機(jī)也可以「算」出來,。但是它有一個(gè)非常大的缺陷,它是在特征空間里,,缺乏語義,。我們用數(shù)據(jù)去訓(xùn)練一個(gè)模型,所謂「黑箱學(xué)習(xí)法」,,加上你的數(shù)據(jù)質(zhì)量不高,,很難學(xué)出有用的東西。什么叫概率統(tǒng)計(jì),?重復(fù)多了就是真理,。如果數(shù)據(jù)質(zhì)量差,充滿了「謊言」,。謊言重復(fù)多了,,就變成真理了。 我們現(xiàn)在想出的解決辦法是這樣的,,就是把這兩個(gè)空間投射到一個(gè)空間去,,這個(gè)空間叫做語義的向量空間。也就是說我們把符號(hào)變成向量,,同時(shí)把特征空間的向量變成語義空間的向量,。怎么做?一是通過 Embedding(嵌入)把符號(hào)變成向量,,盡量保持語義不變,,可惜現(xiàn)在的方法都會(huì)引起語義的丟失,我們只能在投射的過程中讓語義丟失得少,。第二方面做的工作比較少,,就是 Raising(提升),把特征空間提升到語義空間去,,這主要靠學(xué)科交叉,,靠跟神經(jīng)科學(xué)的結(jié)合。只有這些問題解決以后,,我們才能夠建立一個(gè)統(tǒng)一的理論,,因?yàn)檫^去的感知和認(rèn)知是不同的處理方法,大家說不到一塊,,如果我們能夠投射到同一空間去,,我們就可以建立一個(gè)統(tǒng)一的理論框架,這是我們的目標(biāo),。在語義空間處理就可以解決理解問題,,但是這項(xiàng)工作是非常艱巨的,。 介紹一項(xiàng)我們現(xiàn)在做的工作。人工神經(jīng)網(wǎng)絡(luò)為什么不能得到語義信息呢,?人腦的神經(jīng)網(wǎng)絡(luò)為什么可以呢,?差別就在這里,我們現(xiàn)在用的人工神經(jīng)網(wǎng)絡(luò)太簡(jiǎn)單了,,我們正想辦法把腦神經(jīng)網(wǎng)絡(luò)的許多結(jié)構(gòu)與功能加進(jìn)去,,我們這里只用了「稀疏發(fā)電」這一性質(zhì),就可以看出一些效果,,人臉,、大象或者鳥的輪廓,神經(jīng)網(wǎng)絡(luò)可以把它提取出來,。 還有一個(gè)辦法就是把數(shù)據(jù)驅(qū)動(dòng)跟知識(shí)驅(qū)動(dòng)結(jié)合起來,。剛才講了,人的智能沒法通過單純的大數(shù)據(jù)學(xué)習(xí)把它學(xué)出來,,那怎么辦,?很簡(jiǎn)單,加上知識(shí),,讓它有推理的能力,,做決策的能力,這樣就能解決突發(fā)事件,。我們現(xiàn)在做的工作就是把這些結(jié)合起來,,這是我們的基本思路,知識(shí)也好,,數(shù)據(jù)也好,都投射到同一空間,,然后都用同樣的數(shù)學(xué)方法進(jìn)行處理,,這方面我們已經(jīng)做了不少工作。 最后做一個(gè)總結(jié),,我們從這個(gè)坐標(biāo)看人工智能,,橫軸代表領(lǐng)域的寬窄,從單領(lǐng)域到多領(lǐng)域,、到開放領(lǐng)域,。縱軸代表信息的確定性與完全性,,從完全到不完全,、從確定到不確定。在左下角代表最容易的,,就是剛才講的符合 5 個(gè)條件的,,現(xiàn)在人工智能在這部分解決得非常好,,我們用白色來表示它,AlphaGo 在這里,,深藍(lán)在這里,,工業(yè)機(jī)器人在這里。現(xiàn)在我們正在向灰色地區(qū)去走,,打牌,,信息不完全,現(xiàn)在打德州撲克,,一人對(duì)一人,,計(jì)算機(jī)能戰(zhàn)勝人類,多人對(duì)弈,,計(jì)算機(jī)還不行,,這是灰色地帶,我們還可以做,,為什么可以做,?盡管打牌是不確定的,但是它在概率意義下是確定的,,你拿的這副牌的概率,,可以算出來,同花的概率是多少,,排成順的概率是多少,,既然概率能算出來,最終人類肯定會(huì)被計(jì)算機(jī)打敗,。Watson 在右邊,,它的領(lǐng)域比較寬,但是它是確定性的,,所以是在灰色的區(qū)域,。往右上方去就比較難了,自動(dòng)駕駛,、服務(wù)機(jī)器人,、大數(shù)據(jù)分析,它是一個(gè)大框,,有的簡(jiǎn)單,,有的困難,就自動(dòng)駕駛來講,,專用道,、行車很少,路況簡(jiǎn)單等,,在白色或者灰色區(qū),,如果路況復(fù)雜就到了黃色區(qū)域,,黃色區(qū)現(xiàn)在計(jì)算機(jī)還解決不好。最遠(yuǎn)的在哪兒呢,?右上角,,圖靈測(cè)試。大家對(duì)圖靈測(cè)試有很多誤解,,其實(shí)圖靈測(cè)試是開領(lǐng)域問答,,很難!索菲亞做得怎么樣,?很糟糕,。自然語言理解也在這里,復(fù)雜環(huán)境下的決策在偏左一點(diǎn)的地方,,這也是很難的,。所以我們?nèi)斯ぶ悄墁F(xiàn)在是從左下角往右上角走,我們現(xiàn)在處在出發(fā)點(diǎn)附近,。有的人想把它用一些名詞來區(qū)分人工智能的不同發(fā)展階段,,有專家問我,你的看法怎么樣,?我建議不要用新詞,,用新詞往往說不清,很麻煩,,有的人說現(xiàn)在是弱人工智能,,以后是強(qiáng)人工智能,也有人說現(xiàn)在叫增強(qiáng)智能(Augmented Intelligence)也是 AI……概念太多說不清,,還是簡(jiǎn)單一點(diǎn),,「我們正在通往真正 AI 的路上」,現(xiàn)在走得并不遠(yuǎn),,在出發(fā)點(diǎn)附近,,人工智能永遠(yuǎn)在路上,大家要有思想準(zhǔn)備,,這就是人工智能的魅力。大家為什么這么重視人工智能,?因?yàn)槲覀冇肋h(yuǎn)在路上,,這就吸引我們?nèi)ソ鉀Q這些問題,這些問題一旦解決了,,人類的社會(huì)進(jìn)步,、人類的生活就會(huì)發(fā)生本質(zhì)上的改變。 最后我用中文寫最后一段作為總結(jié),,可惜我翻譯不了,。
這是 3000 年前我們古人對(duì)機(jī)器人的想象,,看看現(xiàn)在的人工智能做得怎么樣呢,?索菲亞是我們現(xiàn)在達(dá)到的水平,可是她不會(huì)唱歌,、不會(huì)跳舞,,只會(huì)說英文,周王也聽不懂,,肯定沒有印象?,F(xiàn)在我們假設(shè)索菲亞「瞬其目而招王之左右侍妾」,,向周王的姨太太們送去秋波,王會(huì)如何呢,?我認(rèn)為沒反應(yīng),,因?yàn)樗鞣苼喪桥模貌恢源?。但是我們假設(shè)索菲亞「瞬其目而招王」,,向大王送去秋波,王會(huì)大悅,,立即神魂顛倒,,墜入愛河?我認(rèn)為不會(huì),,因?yàn)樗鞣苼喐静幌袢?,它最近才剛剛安上手腳,走路都不利索,,怎么行呢,?所以我的結(jié)論是,「索菲亞通不過穆王的測(cè)試,,當(dāng)然它更通不過圖靈測(cè)試」,。 我們的結(jié)論是什么?人工智能剛剛起步,,離真正的 AI 還很遙遠(yuǎn),,大家共同努力吧,我們?nèi)沃氐肋h(yuǎn),。 |
|