雷鋒網(wǎng)按:AlphaGo 終于又來了,。5月23日,也就是明天,,曾在去年以一己之力將“人工智能”浪潮帶到新層次的圍棋人工智能AlphaGo就將再次出馬,。在這次為期5天的活動當(dāng)中,AlphaGo將會與世界最頂尖圍棋選手柯潔展開正式對決,,同時還會進(jìn)行耳目一新的“配對賽”以及“團(tuán)體賽”,。 目前雷鋒網(wǎng)了解到的具體賽程如下: ·5月23日,開幕式,、柯潔 vs AlphaGo三番棋第一場,; ·5月24日,人工智能論壇,; ·5月25日,,柯潔 vs AlphaGo三番棋第二場; ·5月26日,,配對賽,,團(tuán)隊(duì)賽(相談棋); ·5月27日,,柯潔 vs AlphaGo三番棋第三場,。 這次比賽核心目的只有一個——在公開場合驗(yàn)證AlphaGo的實(shí)力,看是否已經(jīng)打造出了在圍棋上超越所有人類的“AI”,。 作為國內(nèi)最重要的科技媒體,,雷鋒網(wǎng)也將全程跟蹤此次賽事。但在比賽正式開始前,,有幾個問題你可能需要了解一下: 1.這次的“新AlphaGo”跟“老AlphaGo”有什么不同,? 2.柯潔能否戰(zhàn)勝“新AlphaGo”? 3.比賽相關(guān)直播應(yīng)該如何觀看,? 新AlphaGo:砍斷“人類束縛” 作為一個從2014年發(fā)展至今的圍棋人工智能項(xiàng)目,,其實(shí)AlphaGo在發(fā)展歷程中使用過多個名字,,比如最早期亦城圍棋上的“DeepMind”,又或者是之前在野狐平臺上的“Master”,。那么這次的“新AlphaGo”是否也只是一個新名字,? 答案必然是否定的,,之前起新名字很可能有保密,、個人喜好等原因,,但這次新添加的“新”字只為了突出一點(diǎn)——這是“機(jī)器自學(xué)”為主的一版AlphaGo。 這一點(diǎn)判斷的線索,,來自于今年初,,Master在網(wǎng)絡(luò)上一口氣橫掃60名人類棋手的時候。當(dāng)時Master第二次戰(zhàn)勝柯潔之后,,棋圣聶衛(wèi)平曾表示:
著名棋手古力在成為Master的第60個手下敗將,之后,,也在微博發(fā)表了自己的感受:
這種表現(xiàn),,與將近一年前的“老AlphaGo”可謂天差地別,。想要達(dá)成這樣的成績只有一種可能——DeepMind尋找到了一種機(jī)制來擺脫圍棋中的“人類束縛”,。 迷之改進(jìn):一舉讓AlphaGo成為人類老師 作為一個極其特殊的棋類和任務(wù),圍棋擁有數(shù)量極其龐大的可能性,,總的局面數(shù)量達(dá)到10^172,,而可觀測宇宙范圍內(nèi)的原子數(shù)量不過10^80,。這也意味著窮舉絕對不是一條明智的路線。 最終DeepMind給出了一套能夠“模擬”出人類頂尖高手的方案:深度學(xué)習(xí)+蒙特卡洛搜索樹+自我進(jìn)化,。 這一套架構(gòu)在DeepMind發(fā)布在《自然》雜志中的論文中已經(jīng)有詳細(xì)敘述,, (https://www./nature/journal/v529/n7587/full/nature16961.html) 如果你對其中的細(xì)節(jié)感興趣,推薦閱讀國內(nèi)人工智能創(chuàng)業(yè)公司彩云AI創(chuàng)始人,、CEO袁行遠(yuǎn)在知乎上的相應(yīng)回答,。 (https://www.zhihu.com/question/41176911/answer/90118097) 深度學(xué)習(xí)用以分析人類棋盤,蒙特卡洛搜索樹用來減輕工作量,,自我進(jìn)化用來提升能力,。但有限的運(yùn)算能力還是給DeepMind出了一個不小的難題,后者最終想出了一個辦法:只對學(xué)習(xí)到的人類棋招進(jìn)行蒙特卡洛搜索樹運(yùn)算,,這恰如人類棋手依賴定式,。 定式,又名定石,,指的是人類下圍棋長久積累下來的一種經(jīng)驗(yàn),,對弈雙方在特定情況下會遵循固定下法。著名棋手吳清源則將簡單描述為“在角部彼我棋子接觸時最合理的走法”,。 這些定式被記載在各式各樣的棋譜當(dāng)中,,成為新手入門必看的書籍。 雖然定式是某種意義上是最合理的走法,,但它卻是理想化條件下的產(chǎn)物,,想要完整復(fù)現(xiàn)定式,意味著雙方都必須抱有同樣的理想化思路,。而歷史上并不缺乏不遵守定式,,或者用新定式打敗對方的事例。 問題來了,,為什么千變?nèi)f化的圍棋會出現(xiàn)定式,?而且死守定式會輸,不學(xué)習(xí)定式也會輸,。答案只有一個——人類需要定式來減少圍棋上面的變化,,這樣進(jìn)入中盤之后人類才能利用自身能力掌握棋局走向。 湊巧的是,,這回我們遇到的是運(yùn)算能力遠(yuǎn)超人類的計算機(jī),,讓掌握更多乃至全部圍棋奧秘?fù)碛辛艘唤z可能。 但究竟新AlphaGo怎么樣擺脫“人類束縛”,?參考之前“老AlphaGo”的工作方式,,排除運(yùn)算過程中所有人類元素可能是最徹底的方法。但這樣一來就必須找到另外一種減輕運(yùn)算壓力的策略。目前來看,,這個秘密也只能等DeepMind方面稍后公開了,。 人類敗局已定? 盡管去年人類代表是韓國選手,,但明眼人都可以看出當(dāng)下和去年圍棋人機(jī)比賽的熱度差別,。這從另外一個側(cè)面也反映出了絕大部分觀眾的看法:這次人類要輸。而去年3月李世乭1:3扳回一局時,,柯潔還曾在直播中表示:
而在上個月的發(fā)布會上,,柯潔卻顯得尤為謙遜:
“輕易言敗”這樣的措辭與其在央視節(jié)目上的慷概激昂形成了強(qiáng)烈對比,。客觀公正地說,,柯潔的勝算很小,,三番棋中哪怕有一盤能夠獲勝都是成功。 而另外兩場比賽(配對賽,、團(tuán)隊(duì)賽)同樣值得認(rèn)真關(guān)注,,這兩場比賽中,人類棋手將首先與AlphaGo配對比賽,、然后再“群毆”AlphaGo,。這不僅體現(xiàn)了DeepMind的自信,同時也再次突出本次本次圍棋峰會的主題:
換句話說,,別再糾結(jié)人類和機(jī)器誰輸誰贏了,趕緊認(rèn)真感受科技帶來的巨大改變、預(yù)見未來吧,! |
|
來自: 昵稱71360118 > 《待分類》