這幾天我一直在圍觀人們的反應(yīng),最想不明白的一點,,其實是人們究竟怎么開始把機器與人類放到對立的兩面? 圍棋是藝術(shù),,阿爾法狗是技術(shù),,它如何就會毀了圍棋呢?棋手們自己不是也說“(現(xiàn)在下棋)或多或少都會受到阿老師的影響吧,,下棋會讓人感到更自由一些,,沒有什么招法是完全不能下的”(周睿羊,DeepMind博客視頻),,“阿爾法狗帶給我們很多的新東西?,F(xiàn)在呢,大家更多地去嘗試以前都沒有下過的各種下法”(時越,,DeepMind博客視頻) 棋手們的意思難道不是說,,AI促使人類棋手更加強大,更樂于創(chuàng)新嗎,? DeepMind創(chuàng)始人哈薩比斯 而對于人工智能科學(xué)家而言,,阿爾法狗的使命,更不是要在圍棋賽中打敗人類,。他們之所以讓機器與頂尖的人類棋手互動,,意在為“狗”提供一個不能用其他方式替代的學(xué)習(xí)環(huán)境。DeepMind創(chuàng)始人哈薩比斯自己在很多公開場合就不止一次地說過,,是為了發(fā)現(xiàn)潛藏的通用知識(general knowledge),。“狗”,,其實是一個通用智能體,。 把DM的使命說得更冠冕堂皇些,何嘗不是人類對自身的進一步探索,? 正如物理學(xué)家費曼教授那句留在黑板上的著名遺言,,“我所不能創(chuàng)造的,都是我沒有真正懂得的”(What I cannot create, I do not understand),,如果世界在人們眼里是由外部世界和內(nèi)心世界兩部分組成的話,,也許“內(nèi)心”世界更加根本,因為外部世界的存在狀態(tài),,根本還是取決于我們大腦對它的解釋,。這便是人工智能最引人入勝的地方:借助于建造它來更好地了解我們自己,理解這個世界。 DeepMind所致力建造的這一類AI,,有個名字,,叫“受神經(jīng)學(xué)啟發(fā)的AI”(neuralscience-inspired AI)。別忘了哈薩比斯本人就是倫敦大學(xué)學(xué)院的認知神經(jīng)學(xué)博士,,DM對人類身上最感興趣的部位叫做海馬體(Hippocampus),。按維基的說法:海馬體是人類及脊椎動物腦中的重要部分,位于大腦皮質(zhì)下方,,擔(dān)當(dāng)著關(guān)于短期記憶,、長期記憶,以及空間定位的作用,。在阿茲海默病中,,海馬體是首先受到損傷的區(qū)域:表現(xiàn)癥狀為記憶力衰退以及方向知覺的喪失。大腦缺氧(缺氧癥)以及腦炎等也可導(dǎo)致海馬損傷,。平常我們開玩笑時愛說的“老癡”或“腦殘”都跟這個海馬體相關(guān),。 我們需要記住,DM的AI有兩個關(guān)鍵詞,,一是通用,,一是學(xué)習(xí)。他們所有的算法都從元數(shù)據(jù)開始進行自主學(xué)習(xí),,從而掌握某項任務(wù),,這與預(yù)編程的人工智能有本質(zhì)的不一樣。此外,,DM還強調(diào),,他們希望所有的系統(tǒng)能夠通用,也就是說,,希望同一個系統(tǒng),,或同一套算法可以有跨領(lǐng)域的廣泛應(yīng)用。公眾所熟知的贏了國際象棋的IBM傳奇深藍,,以及近年來的沃森系統(tǒng),,它們都仍然屬于窄AI范疇,也就是說,,它們是為了解決某個特定問題量身打造的AI,,因而只能解決那一類問題。 而阿爾法狗這一類DM的AI,,事實上則可以被叫做“通用人工智能”AGI(Artificial General Intelligence),,目標(biāo)既不針對特定任務(wù),也無涉預(yù)編程,。這就引出了眼下被熱議的“強化學(xué)習(xí)”技術(shù)(reinforcement learning),。 描述強化學(xué)習(xí)其實非常簡單,,它有個一目了然的框架,框架內(nèi)有兩個內(nèi)容:系統(tǒng)和環(huán)境,。這里的“系統(tǒng)”就是我們說的AI,,而它會發(fā)現(xiàn)自己處于某個“環(huán)境”當(dāng)中,要達成某項目標(biāo),。 “系統(tǒng)”與“環(huán)境”之間進行雙向交流:首先,,它通過其感知儀器來對“環(huán)境”進行觀察,在DM的學(xué)習(xí)過程中,,通常使用的是視覺,,也就是說,“系統(tǒng)”觀察到的就是像素,。這些觀察結(jié)果往往有很多“噪音”,并且信息不完整,,因為現(xiàn)實世界本身就十分混亂,,充滿干擾,而且永遠不可能對一件事獲得真正完整的信息,?!跋到y(tǒng)”的任務(wù),便是要在這樣的混亂條件下,,創(chuàng)建一個可能的,、最好的統(tǒng)計模型;這個最好的模型一旦建立,,第二項任務(wù),,便是在當(dāng)前的時間點上可供選擇的一系列行為中,選出最好的一個,,向目標(biāo)靠近,。而一旦“系統(tǒng)”確定了某一個行為是最佳之后,“系統(tǒng)”隨即將這個行為作為輸出,,并得以執(zhí)行,。其結(jié)果,有可能會,,也有可能不會,,對當(dāng)前的“環(huán)境”帶來任何改變。但無論如何,,它都成為新一輪觀察的驅(qū)動,。所以這個“系統(tǒng)”盡管表面上看,可以通過這樣一個簡單的框架圖形來描述,,但它事實上隱藏了很多的復(fù)雜性,。 解決了隱藏其后的復(fù)雜性,,其實就擁有了足夠的智能來進行幾乎一切學(xué)習(xí)。我們認同這個觀點,,因為我們知道,,包括人在內(nèi)的所有脊椎動物,都是這樣來學(xué)習(xí)的,。人類大腦中,,完成這一“強化學(xué)習(xí)”過程的是多巴胺系統(tǒng)。 了解了創(chuàng)造出阿爾法狗的DM公司的通用智能使命,,以及這一通用智能的學(xué)習(xí)原理之后,,不難看出,各類游戲其實都是其算法的絕佳測試平臺,。一兩年前連線雜志 “Wired” 就有過長文報道,,DM最初使用經(jīng)典的80年代雅達利游戲(Atari )來測試他們的算法。當(dāng)AI在玩雅達利時,,它所獲得的輸入沒有別的,,就是純粹的像素,完全就像人在看著屏幕學(xué),,屏幕尺寸大概是200*150,,所以它所得到的就是每幀3萬個點,目的也很簡單,,一切從頭琢磨自學(xué),,為了拿高分。 在基本的學(xué)習(xí)能力具備后,,再通過模擬海馬體的工作原理,,來為智能體增加能力,例如學(xué)習(xí)抽象概念,,以及增進長期記憶,。 如果說AI是在利用包括棋類在內(nèi)的游戲來作為測試平臺,達到提升功力的目的的話,,它真正的目標(biāo)可能更多地在于幫助人類完成更加關(guān)鍵的工作,,例如與預(yù)測相關(guān)的醫(yī)療、氣候,、能源,、宏觀經(jīng)濟等應(yīng)用。這樣一來,,人工智能技術(shù)可以毫無疑問地被認為是眼下最重要的技術(shù)之一,,更可能正是潛在的“元解決方案”(meta-solution),可以協(xié)助人類解決所有的其它問題,。 提到“元解決方案”,,不可避免的是與之相伴的倫理討論,。在科幻作品、斷章取義的名人演說,、雞毛令箭的媒體報道的共同作用下,,AI所獲得的倫理關(guān)注尤其熱鬧。但是它與任何強大的新技術(shù)無異,,技術(shù)本身是中立的,,決定它是否符合倫理的,永遠是掌握技術(shù)的人,。在此過程中,,公眾、媒體,、研究機構(gòu)(企業(yè))以及政府幾方的透明,,對每一步的監(jiān)管都因此變得至關(guān)重要。 阿爾法狗的創(chuàng)造者的使命是要將世界的信息組織起來,,讓它更好地為全世界共享,,換句話說,就是利用 AI或者AGI 來自動將無序的信息轉(zhuǎn)化為知識,,從而利用這些知識使人類更加強大。因此,,與世界最優(yōu)秀的人工智能專家一起,,挖掘出暗藏在圍棋這一古老游戲后面的智慧,促成技術(shù)的進步,,這應(yīng)當(dāng)是烏鎮(zhèn)比武會上所有人的勝利吧,。 原標(biāo)題:DeepMind的使命不是要下贏圍棋 |
|