新智元推薦1 發(fā)表于 《科技導(dǎo)報(bào)》2016,34(7) 2016年3月,,在韓國首爾四季酒店舉行的谷歌 DeepMind圍棋挑戰(zhàn)賽,,人工智能圍棋軟件AlphaGo以4∶1戰(zhàn)勝了韓國棋手李世乭九段。本次比賽后,,關(guān)于人工智能和機(jī)器學(xué)習(xí)的話題迅速升溫,,引起社會(huì)各界的關(guān)心。然而,,除了在本領(lǐng)域工作的一線科研人員,,其他人士對人工智能和機(jī)器學(xué)習(xí)的發(fā)展現(xiàn)狀和前景了解的卻不多,甚至存在不少誤解,。在此,,本文希望能跟讀者探討一下人工智能和機(jī)器學(xué)習(xí),談?wù)勂浒l(fā)展現(xiàn)狀與未來趨勢,。 1 什么是機(jī)器學(xué)習(xí),? 機(jī)器學(xué)習(xí)是人工智能的一個(gè)分支學(xué)科,主要研究的是讓機(jī)器從過去的經(jīng)歷中學(xué)習(xí)經(jīng)驗(yàn),,對數(shù)據(jù)的不確定性進(jìn)行建模,,在未來進(jìn)行預(yù)測。 舉一個(gè)最簡單的二分類例子(圖1),,假設(shè)現(xiàn)在想用機(jī)器自動(dòng)把網(wǎng)頁分成2大類:體育和非體育類網(wǎng)頁,。首先需要收集訓(xùn)練樣本,在這里,,指得就是各種體育類和非體育類的網(wǎng)頁,。接下來,需要對樣本進(jìn)行分析,,通過一些抽象化的描述,,定義特征。譬如,,分析網(wǎng)頁里應(yīng)用的詞語以及每個(gè)詞語出現(xiàn)的次數(shù),。第三步為數(shù)據(jù)建模。通常,,需要設(shè)計(jì)數(shù)學(xué)模型,,來分析特征與標(biāo)簽的分布情況,。具體來說,是通過優(yōu)化方法,,學(xué)習(xí)一個(gè)映射函數(shù),,其輸入是一個(gè)樣本的特征向量,其輸出是標(biāo)簽(體育類或非體育類),。在預(yù)測階段,,當(dāng)用戶輸入一個(gè)新的網(wǎng)頁樣本時(shí),我們同樣做特征抽取,,通過使用學(xué)習(xí)完畢獲得的映射函數(shù),,自動(dòng)去預(yù)測這個(gè)樣本的標(biāo)簽類別。 上述例子僅是一個(gè)較常見的有監(jiān)督二分類問題,。在機(jī)器學(xué)習(xí)領(lǐng)域,,通常人們習(xí)慣把算法分為3類:有監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí),。所謂有沒有“監(jiān)督”,,指的是機(jī)器在學(xué)習(xí)階段, 能否看到樣本的標(biāo)簽(如上述例子中的體育及非體育類別),。半監(jiān)督學(xué)習(xí)通常也被稱為弱監(jiān)督學(xué)習(xí),,目的是通過少量的例子,在無標(biāo)簽的樣本中自動(dòng)學(xué)習(xí)參數(shù),。至于無監(jiān)督學(xué)習(xí),,通常人們接觸比較多的是聚類問題:通過分析數(shù)據(jù)樣本的相似性,來把相似的數(shù)據(jù)組合成集群,。 2 機(jī)器學(xué)習(xí)的當(dāng)前研究重點(diǎn)和發(fā)展趨勢 除了上述3大類算法,,機(jī)器學(xué)習(xí)還有很多有趣的子領(lǐng)域。 比如近些年興起的深度學(xué)習(xí)熱潮,,指的是通過使用多層的神經(jīng)網(wǎng)絡(luò)模型在大數(shù)據(jù)上建模,。比如谷歌的AlphaGo系 統(tǒng),就是通過在數(shù)十萬的人類對弈棋譜上學(xué)習(xí)策略網(wǎng)絡(luò)(Policy Network)和估值網(wǎng)絡(luò)(Value Network),,再結(jié)合蒙特卡洛搜索樹算法來決定如何走棋的,。所謂策略網(wǎng)絡(luò),其實(shí)是一個(gè)卷積神經(jīng)網(wǎng)絡(luò),,用來選擇如何落子,。所謂估值網(wǎng)絡(luò),也是一個(gè)卷積神經(jīng)網(wǎng)絡(luò),,用來分析當(dāng)前的勝率,。圍棋的棋盤相對較大,是一個(gè)19×19 的網(wǎng)格,每一步有上百種走法,。對于李世乭這類頂級(jí)棋手來說,可以預(yù)測未來的局勢,。對于計(jì)算機(jī)來說并非易事,,因?yàn)榭梢月渥拥乃阉骺臻g太大。谷歌之所以取得成功,,正是因?yàn)槠浜芎玫匕堰@2個(gè) 神經(jīng)網(wǎng)絡(luò)與蒙特卡洛搜索樹結(jié)合,,精確地分析和預(yù)測了李世乭的棋路。 在大數(shù)據(jù)時(shí)代,,機(jī)器學(xué)習(xí)領(lǐng)域還有 一個(gè)熱點(diǎn)是把系統(tǒng)與算法結(jié)合,,設(shè)計(jì)大規(guī)模分布式的機(jī)器學(xué)習(xí)算法與系統(tǒng),使得機(jī)器學(xué)習(xí)算法可以在多處理器和多機(jī)器的集群環(huán)境下作業(yè),,處理更大量級(jí)的數(shù)據(jù),。這方面較為知名的系統(tǒng)包括: 加州大學(xué)伯克利分校的Spark、谷歌的TensorFlow,、華盛頓大學(xué)的Dato(原名 GraphLab),、卡內(nèi)基梅隴大學(xué)的Petuum、微軟的DMTK系統(tǒng)等,。也許在 幾十年前,,計(jì)算機(jī)科學(xué)的核心是操作系統(tǒng)、算法和編程語言,。但是在今天,,在大數(shù)據(jù)的背景下,計(jì)算機(jī)科學(xué)逐漸演變成一個(gè)越來越強(qiáng)調(diào)跨領(lǐng)域合作的學(xué) 科,。如何有效地把系統(tǒng)和機(jī)器學(xué)習(xí)方法相結(jié)合來處理海量數(shù)據(jù),,這將是未來人工智能和計(jì)算機(jī)科學(xué)發(fā)展的關(guān)鍵。 除了這2個(gè)最近5年比較熱門的領(lǐng)域,,其實(shí)機(jī)器學(xué)習(xí)還有許多有意思的科研方法,。譬如,優(yōu)化算法一直是機(jī)器學(xué)習(xí)領(lǐng)域的重點(diǎn),,如何處理各種凸優(yōu)化和非凸優(yōu)化問題,、如何處理分布式優(yōu)化,避免局部最優(yōu)解,,一直是學(xué)者最關(guān)注的問題之一,。其他值得關(guān)注的領(lǐng)域,還包括強(qiáng)化學(xué)習(xí)(reinforcement learning),、概率圖模型(probabilistic graphical models),、統(tǒng)計(jì)關(guān)系學(xué)習(xí)(statistical relational learning)等。 3 谷歌AlphaGo成功的啟示 在谷歌的AlphaGo系統(tǒng)戰(zhàn)勝李世乭后,由于對技術(shù)背景缺乏了解,,加上部分公司和媒體為了達(dá)到商業(yè)目的而進(jìn)行的夸張宣傳,,部分人對人工智能和機(jī)器學(xué)習(xí)技術(shù)的發(fā)展表示擔(dān)憂。有人認(rèn)為,,圍棋是人類最后的智力堡壘,,計(jì)算機(jī)攻克了圍棋,那么人類是不是離滅亡也不遠(yuǎn)了,? 在國內(nèi)外人工智能學(xué)者的討論中,, 美國喬治亞理工大學(xué)機(jī)器學(xué)習(xí)助理教授Le Song認(rèn)為這種論斷具有基本的邏輯錯(cuò)誤,因?yàn)楣沤裰型?,?huì)下圍棋并不代表能統(tǒng)治世界,,絕大多數(shù)的國家領(lǐng)導(dǎo)人也都不是圍棋棋手。從事實(shí)出發(fā),,谷歌的AlphaGo系統(tǒng)僅僅是在人類棋譜上訓(xùn)練而成的計(jì)算機(jī)圍棋軟件系統(tǒng),,其根本不具有理解人類語言、圖片和推理等其他機(jī)器智能,。另外,,需要強(qiáng)調(diào)的是,AlphaGo系統(tǒng)的背后,,是幾十名谷歌科學(xué)家數(shù)年的辛苦工作,,設(shè)計(jì)算法和調(diào)試程序的反復(fù)迭代,才取得的成果,。 所以,,AlphaGo的棋商,歸根到底也是谷歌科學(xué)家們集體智慧的結(jié)晶,。 不久前,,我通過微博對我的朋友們 (主要來自科技界)做了一項(xiàng)多項(xiàng)選擇調(diào)查:“你覺得 AlphaGo戰(zhàn)勝李世乭意味著什么?” 361位用戶參與了投票,其中44.5%的票投給了“一次對技術(shù)發(fā)展 有益的測試,?!保?9.5%的票投給了“AI 歷史上的里程碑事件,?!保?3.8%的票給與了“無感,,圍棋規(guī)則明確,,機(jī)器善長?!?;另外有10%左右的票認(rèn)為李世乭不在巔峰,,應(yīng)該給柯潔機(jī)會(huì)。然而,,只有 0.6%的票認(rèn)為“機(jī)器即將滅亡人類”,。由此可見,科技界總體相對還是比較理智的,。 毫無疑問,,我認(rèn)為AlphaGo是近年來機(jī)器學(xué)習(xí)、系統(tǒng)和高效搜索算法結(jié)合成功的典范,,谷歌AlphaGo成功給我們的啟示是多方面的: 1)正確的選題。谷歌選擇了可以量化,、規(guī)則明確的計(jì)算機(jī)圍棋領(lǐng)域,,其主要負(fù)責(zé)人David Silver 和 Aja Huang的博士論文均是計(jì)算機(jī)圍棋,有著超過10年的經(jīng)驗(yàn),。 2)恰當(dāng)?shù)姆椒ㄅc時(shí)機(jī),。在計(jì)算機(jī)性能大幅度提升的大背景下,谷歌通過訓(xùn)練大規(guī)模深度學(xué)習(xí)網(wǎng)絡(luò),,結(jié)合高效的傳統(tǒng)蒙特卡洛搜索樹,,成功地控制了圍棋的復(fù)雜度。 3)精密的工程實(shí)現(xiàn),。在數(shù)十名谷歌工程師的努力下,,AlphaGo有了單機(jī)和分布式 2個(gè)版本,針對時(shí)間限制,,設(shè)計(jì)了快速落子和仔細(xì)斟酌的策略,,對時(shí)間采取毫秒級(jí)別的估計(jì)。這些工程上的細(xì)節(jié),,無疑是決定成敗的關(guān)鍵之一,。 卡內(nèi)基梅隴大學(xué)博士、Facebook圍棋項(xiàng)目負(fù)責(zé)人田淵棟認(rèn)為:谷歌AlphaGo的成功,,告訴我們結(jié)合機(jī)器學(xué) 習(xí)與傳統(tǒng)符號(hào)搜索方法可以解決人工 智能里相對復(fù)雜的推理問題,。這點(diǎn)我 十分同意。David Silver 等 2016 年 1 月 在《Nature》發(fā)表的介紹AlphaGo的論文 中,,也明確提到了,,只有把機(jī)器學(xué)習(xí)與 高效的搜索方法集合,AlphaGo才能取 得最高的Elo棋力評(píng)價(jià)(圖2),。 4 理性看待人工智能和機(jī)器學(xué)習(xí)的未來 人工智能和機(jī)器學(xué)習(xí)的路還很長,, 我們應(yīng)該正確認(rèn)識(shí)AI能夠在當(dāng)前取得的成就,才可以解決更加復(fù)雜的問題,。 我們能看到上述 AlphaGo 對技術(shù)發(fā)展 的積極啟示,,但是也不能忽略:對于自然語言理解,雖然經(jīng)過了數(shù)十年的發(fā)展,依然沒有人工智能系統(tǒng)可以做到完 全正確地理解人類的語言(包括語音識(shí)別和機(jī)器翻譯),;在機(jī)器人領(lǐng)域,,即使工業(yè)機(jī)器人發(fā)展迅速,我們依然沒有看到具有常識(shí)和推理能力的智能家庭機(jī)器人,;在計(jì)算機(jī)視覺領(lǐng)域,,即使我們在人臉識(shí)別和圖片分類上取得了不小的成就,但是對于關(guān)系理解和完整的場景認(rèn)知,,現(xiàn)在系統(tǒng)能做到的還很有限,。 作為科學(xué)工作者,我們的本質(zhì)工作就是追尋事物發(fā)展的基本規(guī)律,,尋找真理,。所以在媒體出現(xiàn)與事實(shí)不符的報(bào)道時(shí),我們需要客觀地分析技術(shù)的發(fā)展,,理性地看待科學(xué)技術(shù)的成長,,澄清謠言。 歷史上,,也曾出現(xiàn)過由于對人工智能的炒作而造成的技術(shù)發(fā)展停滯,,這一時(shí)期被稱作是 AI 寒冬(AI winter)。在1970年代,,由于較早前對人工智能技 術(shù)發(fā)展過于樂觀,,但在由于實(shí)際實(shí)現(xiàn)中發(fā)現(xiàn)困難重重,美國國防部先進(jìn)研究項(xiàng)目局取消了大部分對人工智能研究項(xiàng)目的資助,,導(dǎo)致人工智能技術(shù)在當(dāng)時(shí)發(fā)展停滯不前,。 對于“人工智能威脅論”,大可不必?fù)?dān)心機(jī)器滅亡人類,。至于人工智能技術(shù)發(fā)展對于社會(huì)的影響,,我認(rèn)為是雙向的。首先,,我同意卡內(nèi)基梅隴大學(xué)機(jī)器學(xué)習(xí)系A(chǔ)lex Smola教授的觀點(diǎn):AI技術(shù)在未來確實(shí)有可能對流水線工人,、卡車司機(jī)、保潔員等相對低技能要求的工種造成沖擊,,然而解決的辦法只能是提高整個(gè)社會(huì)的教育水平,。其次,我認(rèn)為社會(huì)也在對人工智能技術(shù)的發(fā)展產(chǎn)生各種積極的約束:譬如,,用戶對于技術(shù)的安全性和穩(wěn)定性的要求,;用戶對于數(shù)據(jù)隱私的要求;用戶對于產(chǎn)品的道德約束,??偠灾?,當(dāng)前是人工智能發(fā)展的一個(gè)令人興奮的時(shí)期,機(jī)器學(xué)習(xí)技術(shù)對于整個(gè)人類的發(fā)展,,也是具有不可估量的潛力,。我們應(yīng)該正視科學(xué)技術(shù)發(fā)展的進(jìn)步,理性看待所取得的結(jié)果,。 作者:王威廉 美國卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)科學(xué)學(xué)院 發(fā)表于 《科技導(dǎo)報(bào)》2016,,34(7) 《科技導(dǎo)報(bào)》 中國科協(xié)學(xué)術(shù)會(huì)刊 聯(lián)系電話:010-62194182 長按二維碼 即刻關(guān)注 |
|