王威廉機(jī)器學(xué)習(xí)：現(xiàn)在與未來

shawnsun007 2016-04-20

展開全文

王威廉機(jī)器學(xué)習(xí)：現(xiàn)在與未來

新智元推薦1

發(fā)表于《科技導(dǎo)報(bào)》2016，34（7）

2016年3月,，在韓國首爾四季酒店舉行的谷歌 DeepMind圍棋挑戰(zhàn)賽,，人工智能圍棋軟件AlphaGo以4∶1戰(zhàn)勝了韓國棋手李世乭九段。本次比賽后,，關(guān)于人工智能和機(jī)器學(xué)習(xí)的話題迅速升溫,，引起社會(huì)各界的關(guān)心。然而,，除了在本領(lǐng)域工作的一線科研人員,，其他人士對人工智能和機(jī)器學(xué)習(xí)的發(fā)展現(xiàn)狀和前景了解的卻不多，甚至存在不少誤解,。在此,，本文希望能跟讀者探討一下人工智能和機(jī)器學(xué)習(xí)，談?wù)勂浒l(fā)展現(xiàn)狀與未來趨勢,。

1 什么是機(jī)器學(xué)習(xí),？

機(jī)器學(xué)習(xí)是人工智能的一個(gè)分支學(xué)科，主要研究的是讓機(jī)器從過去的經(jīng)歷中學(xué)習(xí)經(jīng)驗(yàn),，對數(shù)據(jù)的不確定性進(jìn)行建模,，在未來進(jìn)行預(yù)測。

王威廉機(jī)器學(xué)習(xí)：現(xiàn)在與未來

舉一個(gè)最簡單的二分類例子（圖1）,，假設(shè)現(xiàn)在想用機(jī)器自動(dòng)把網(wǎng)頁分成2大類：體育和非體育類網(wǎng)頁,。首先需要收集訓(xùn)練樣本，在這里,，指得就是各種體育類和非體育類的網(wǎng)頁,。接下來，需要對樣本進(jìn)行分析,，通過一些抽象化的描述,，定義特征。譬如,，分析網(wǎng)頁里應(yīng)用的詞語以及每個(gè)詞語出現(xiàn)的次數(shù),。第三步為數(shù)據(jù)建模。通常,，需要設(shè)計(jì)數(shù)學(xué)模型,，來分析特征與標(biāo)簽的分布情況,。具體來說，是通過優(yōu)化方法,，學(xué)習(xí)一個(gè)映射函數(shù),，其輸入是一個(gè)樣本的特征向量，其輸出是標(biāo)簽（體育類或非體育類）,。在預(yù)測階段,，當(dāng)用戶輸入一個(gè)新的網(wǎng)頁樣本時(shí)，我們同樣做特征抽取,，通過使用學(xué)習(xí)完畢獲得的映射函數(shù),，自動(dòng)去預(yù)測這個(gè)樣本的標(biāo)簽類別。

上述例子僅是一個(gè)較常見的有監(jiān)督二分類問題,。在機(jī)器學(xué)習(xí)領(lǐng)域,，通常人們習(xí)慣把算法分為3類：有監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí),。所謂有沒有“監(jiān)督”,，指的是機(jī)器在學(xué)習(xí)階段，能否看到樣本的標(biāo)簽（如上述例子中的體育及非體育類別）,。半監(jiān)督學(xué)習(xí)通常也被稱為弱監(jiān)督學(xué)習(xí),，目的是通過少量的例子，在無標(biāo)簽的樣本中自動(dòng)學(xué)習(xí)參數(shù),。至于無監(jiān)督學(xué)習(xí),，通常人們接觸比較多的是聚類問題：通過分析數(shù)據(jù)樣本的相似性，來把相似的數(shù)據(jù)組合成集群,。

2 機(jī)器學(xué)習(xí)的當(dāng)前研究重點(diǎn)和發(fā)展趨勢

除了上述3大類算法,，機(jī)器學(xué)習(xí)還有很多有趣的子領(lǐng)域。比如近些年興起的深度學(xué)習(xí)熱潮,，指的是通過使用多層的神經(jīng)網(wǎng)絡(luò)模型在大數(shù)據(jù)上建模,。比如谷歌的AlphaGo系統(tǒng)，就是通過在數(shù)十萬的人類對弈棋譜上學(xué)習(xí)策略網(wǎng)絡(luò)（Policy Network）和估值網(wǎng)絡(luò)（Value Network）,，再結(jié)合蒙特卡洛搜索樹算法來決定如何走棋的,。所謂策略網(wǎng)絡(luò)，其實(shí)是一個(gè)卷積神經(jīng)網(wǎng)絡(luò),，用來選擇如何落子,。所謂估值網(wǎng)絡(luò)，也是一個(gè)卷積神經(jīng)網(wǎng)絡(luò),，用來分析當(dāng)前的勝率,。圍棋的棋盤相對較大，是一個(gè)19×19 的網(wǎng)格，每一步有上百種走法,。對于李世乭這類頂級(jí)棋手來說，可以預(yù)測未來的局勢,。對于計(jì)算機(jī)來說并非易事,，因?yàn)榭梢月渥拥乃阉骺臻g太大。谷歌之所以取得成功,，正是因?yàn)槠浜芎玫匕堰@2個(gè) 神經(jīng)網(wǎng)絡(luò)與蒙特卡洛搜索樹結(jié)合,，精確地分析和預(yù)測了李世乭的棋路。

在大數(shù)據(jù)時(shí)代,，機(jī)器學(xué)習(xí)領(lǐng)域還有一個(gè)熱點(diǎn)是把系統(tǒng)與算法結(jié)合,，設(shè)計(jì)大規(guī)模分布式的機(jī)器學(xué)習(xí)算法與系統(tǒng)，使得機(jī)器學(xué)習(xí)算法可以在多處理器和多機(jī)器的集群環(huán)境下作業(yè),，處理更大量級(jí)的數(shù)據(jù),。這方面較為知名的系統(tǒng)包括：加州大學(xué)伯克利分校的Spark、谷歌的TensorFlow,、華盛頓大學(xué)的Dato（原名 GraphLab）,、卡內(nèi)基梅隴大學(xué)的Petuum、微軟的DMTK系統(tǒng)等,。也許在幾十年前,，計(jì)算機(jī)科學(xué)的核心是操作系統(tǒng)、算法和編程語言,。但是在今天,，在大數(shù)據(jù)的背景下，計(jì)算機(jī)科學(xué)逐漸演變成一個(gè)越來越強(qiáng)調(diào)跨領(lǐng)域合作的學(xué) 科,。如何有效地把系統(tǒng)和機(jī)器學(xué)習(xí)方法相結(jié)合來處理海量數(shù)據(jù),，這將是未來人工智能和計(jì)算機(jī)科學(xué)發(fā)展的關(guān)鍵。除了這2個(gè)最近5年比較熱門的領(lǐng)域,，其實(shí)機(jī)器學(xué)習(xí)還有許多有意思的科研方法,。譬如，優(yōu)化算法一直是機(jī)器學(xué)習(xí)領(lǐng)域的重點(diǎn),，如何處理各種凸優(yōu)化和非凸優(yōu)化問題,、如何處理分布式優(yōu)化，避免局部最優(yōu)解,，一直是學(xué)者最關(guān)注的問題之一,。其他值得關(guān)注的領(lǐng)域，還包括強(qiáng)化學(xué)習(xí)（reinforcement learning）,、概率圖模型（probabilistic graphical models）,、統(tǒng)計(jì)關(guān)系學(xué)習(xí)（statistical relational learning）等。

3 谷歌AlphaGo成功的啟示

在谷歌的AlphaGo系統(tǒng)戰(zhàn)勝李世乭后，由于對技術(shù)背景缺乏了解,，加上部分公司和媒體為了達(dá)到商業(yè)目的而進(jìn)行的夸張宣傳,，部分人對人工智能和機(jī)器學(xué)習(xí)技術(shù)的發(fā)展表示擔(dān)憂。有人認(rèn)為,，圍棋是人類最后的智力堡壘,，計(jì)算機(jī)攻克了圍棋，那么人類是不是離滅亡也不遠(yuǎn)了,？

在國內(nèi)外人工智能學(xué)者的討論中,，美國喬治亞理工大學(xué)機(jī)器學(xué)習(xí)助理教授Le Song認(rèn)為這種論斷具有基本的邏輯錯(cuò)誤，因?yàn)楣沤裰型?，?huì)下圍棋并不代表能統(tǒng)治世界,，絕大多數(shù)的國家領(lǐng)導(dǎo)人也都不是圍棋棋手。從事實(shí)出發(fā),，谷歌的AlphaGo系統(tǒng)僅僅是在人類棋譜上訓(xùn)練而成的計(jì)算機(jī)圍棋軟件系統(tǒng),，其根本不具有理解人類語言、圖片和推理等其他機(jī)器智能,。另外,，需要強(qiáng)調(diào)的是，AlphaGo系統(tǒng)的背后,，是幾十名谷歌科學(xué)家數(shù)年的辛苦工作,，設(shè)計(jì)算法和調(diào)試程序的反復(fù)迭代，才取得的成果,。所以,，AlphaGo的棋商，歸根到底也是谷歌科學(xué)家們集體智慧的結(jié)晶,。

不久前,，我通過微博對我的朋友們（主要來自科技界）做了一項(xiàng)多項(xiàng)選擇調(diào)查：“你覺得 AlphaGo戰(zhàn)勝李世乭意味著什么?” 361位用戶參與了投票，其中44.5%的票投給了“一次對技術(shù)發(fā)展有益的測試,?！保?9.5%的票投給了“AI 歷史上的里程碑事件,?！保?3.8%的票給與了“無感,，圍棋規(guī)則明確,，機(jī)器善長?！?；另外有10%左右的票認(rèn)為李世乭不在巔峰,，應(yīng)該給柯潔機(jī)會(huì)。然而,，只有 0.6%的票認(rèn)為“機(jī)器即將滅亡人類”,。由此可見，科技界總體相對還是比較理智的,。

毫無疑問,，我認(rèn)為AlphaGo是近年來機(jī)器學(xué)習(xí)、系統(tǒng)和高效搜索算法結(jié)合成功的典范,，谷歌AlphaGo成功給我們的啟示是多方面的：

1）正確的選題。谷歌選擇了可以量化,、規(guī)則明確的計(jì)算機(jī)圍棋領(lǐng)域,，其主要負(fù)責(zé)人David Silver 和 Aja Huang的博士論文均是計(jì)算機(jī)圍棋，有著超過10年的經(jīng)驗(yàn),。

2）恰當(dāng)?shù)姆椒ㄅc時(shí)機(jī),。在計(jì)算機(jī)性能大幅度提升的大背景下，谷歌通過訓(xùn)練大規(guī)模深度學(xué)習(xí)網(wǎng)絡(luò),，結(jié)合高效的傳統(tǒng)蒙特卡洛搜索樹,，成功地控制了圍棋的復(fù)雜度。

3）精密的工程實(shí)現(xiàn),。在數(shù)十名谷歌工程師的努力下,，AlphaGo有了單機(jī)和分布式 2個(gè)版本，針對時(shí)間限制,，設(shè)計(jì)了快速落子和仔細(xì)斟酌的策略,，對時(shí)間采取毫秒級(jí)別的估計(jì)。這些工程上的細(xì)節(jié),，無疑是決定成敗的關(guān)鍵之一,。

王威廉機(jī)器學(xué)習(xí)：現(xiàn)在與未來

卡內(nèi)基梅隴大學(xué)博士、Facebook圍棋項(xiàng)目負(fù)責(zé)人田淵棟認(rèn)為：谷歌AlphaGo的成功,，告訴我們結(jié)合機(jī)器學(xué) 習(xí)與傳統(tǒng)符號(hào)搜索方法可以解決人工智能里相對復(fù)雜的推理問題,。這點(diǎn)我十分同意。David Silver 等 2016 年 1 月在《Nature》發(fā)表的介紹AlphaGo的論文中,，也明確提到了,，只有把機(jī)器學(xué)習(xí)與高效的搜索方法集合，AlphaGo才能取得最高的Elo棋力評(píng)價(jià)（圖2）,。

4 理性看待人工智能和機(jī)器學(xué)習(xí)的未來

人工智能和機(jī)器學(xué)習(xí)的路還很長,，我們應(yīng)該正確認(rèn)識(shí)AI能夠在當(dāng)前取得的成就，才可以解決更加復(fù)雜的問題,。我們能看到上述 AlphaGo 對技術(shù)發(fā)展的積極啟示,，但是也不能忽略：對于自然語言理解，雖然經(jīng)過了數(shù)十年的發(fā)展，依然沒有人工智能系統(tǒng)可以做到完全正確地理解人類的語言（包括語音識(shí)別和機(jī)器翻譯）,；在機(jī)器人領(lǐng)域,，即使工業(yè)機(jī)器人發(fā)展迅速，我們依然沒有看到具有常識(shí)和推理能力的智能家庭機(jī)器人,；在計(jì)算機(jī)視覺領(lǐng)域,，即使我們在人臉識(shí)別和圖片分類上取得了不小的成就，但是對于關(guān)系理解和完整的場景認(rèn)知,，現(xiàn)在系統(tǒng)能做到的還很有限,。

作為科學(xué)工作者，我們的本質(zhì)工作就是追尋事物發(fā)展的基本規(guī)律,，尋找真理,。所以在媒體出現(xiàn)與事實(shí)不符的報(bào)道時(shí)，我們需要客觀地分析技術(shù)的發(fā)展,，理性地看待科學(xué)技術(shù)的成長,，澄清謠言。

歷史上,，也曾出現(xiàn)過由于對人工智能的炒作而造成的技術(shù)發(fā)展停滯,，這一時(shí)期被稱作是 AI 寒冬（AI winter）。在1970年代,，由于較早前對人工智能技術(shù)發(fā)展過于樂觀,，但在由于實(shí)際實(shí)現(xiàn)中發(fā)現(xiàn)困難重重，美國國防部先進(jìn)研究項(xiàng)目局取消了大部分對人工智能研究項(xiàng)目的資助,，導(dǎo)致人工智能技術(shù)在當(dāng)時(shí)發(fā)展停滯不前,。

對于“人工智能威脅論”，大可不必?fù)?dān)心機(jī)器滅亡人類,。至于人工智能技術(shù)發(fā)展對于社會(huì)的影響,，我認(rèn)為是雙向的。首先,，我同意卡內(nèi)基梅隴大學(xué)機(jī)器學(xué)習(xí)系A(chǔ)lex Smola教授的觀點(diǎn)：AI技術(shù)在未來確實(shí)有可能對流水線工人,、卡車司機(jī)、保潔員等相對低技能要求的工種造成沖擊,，然而解決的辦法只能是提高整個(gè)社會(huì)的教育水平,。其次，我認(rèn)為社會(huì)也在對人工智能技術(shù)的發(fā)展產(chǎn)生各種積極的約束：譬如,，用戶對于技術(shù)的安全性和穩(wěn)定性的要求,；用戶對于數(shù)據(jù)隱私的要求；用戶對于產(chǎn)品的道德約束,?？偠灾?，當(dāng)前是人工智能發(fā)展的一個(gè)令人興奮的時(shí)期，機(jī)器學(xué)習(xí)技術(shù)對于整個(gè)人類的發(fā)展,，也是具有不可估量的潛力,。我們應(yīng)該正視科學(xué)技術(shù)發(fā)展的進(jìn)步，理性看待所取得的結(jié)果,。

作者：王威廉美國卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)科學(xué)學(xué)院發(fā)表于《科技導(dǎo)報(bào)》2016,，34（7）

《科技導(dǎo)報(bào)》

中國科協(xié)學(xué)術(shù)會(huì)刊

聯(lián)系電話：010-62194182

長按二維碼即刻關(guān)注

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布,，不代表本站觀點(diǎn),。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,，謹(jǐn)防詐騙,。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點(diǎn)擊一鍵舉報(bào),。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自： shawnsun007 > 《數(shù)據(jù)分析與人工智能》

舉報(bào)/認(rèn)領(lǐng)