【原】重磅 | 不是為了輸贏！柯潔VS AlphaGo大戰(zhàn)之前,，你需要知道的幾大看點(diǎn)

昵稱71360118 2020-09-01

展開全文

雷鋒網(wǎng)按：AlphaGo 終于又來了,。5月23日，也就是明天,，曾在去年以一己之力將“人工智能”浪潮帶到新層次的圍棋人工智能AlphaGo就將再次出馬,。在這次為期5天的活動當(dāng)中，AlphaGo將會與世界最頂尖圍棋選手柯潔展開正式對決,，同時還會進(jìn)行耳目一新的“配對賽”以及“團(tuán)體賽”,。

目前雷鋒網(wǎng)了解到的具體賽程如下：

·5月23日，開幕式,、柯潔 vs AlphaGo三番棋第一場,；

·5月24日，人工智能論壇,；

·5月25日,，柯潔 vs AlphaGo三番棋第二場；

·5月26日,，配對賽,，團(tuán)隊(duì)賽（相談棋）；

·5月27日,，柯潔 vs AlphaGo三番棋第三場,。

這次比賽核心目的只有一個——在公開場合驗(yàn)證AlphaGo的實(shí)力，看是否已經(jīng)打造出了在圍棋上超越所有人類的“AI”,。

作為國內(nèi)最重要的科技媒體,，雷鋒網(wǎng)也將全程跟蹤此次賽事。但在比賽正式開始前,，有幾個問題你可能需要了解一下：

1.這次的“新AlphaGo”跟“老AlphaGo”有什么不同,？

2.柯潔能否戰(zhàn)勝“新AlphaGo”？

3.比賽相關(guān)直播應(yīng)該如何觀看,？

新AlphaGo：砍斷“人類束縛”

作為一個從2014年發(fā)展至今的圍棋人工智能項(xiàng)目,，其實(shí)AlphaGo在發(fā)展歷程中使用過多個名字,，比如最早期亦城圍棋上的“DeepMind”，又或者是之前在野狐平臺上的“Master”,。那么這次的“新AlphaGo”是否也只是一個新名字,？

答案必然是否定的,，之前起新名字很可能有保密,、個人喜好等原因,，但這次新添加的“新”字只為了突出一點(diǎn)——這是“機(jī)器自學(xué)”為主的一版AlphaGo。

這一點(diǎn)判斷的線索,，來自于今年初,，Master在網(wǎng)絡(luò)上一口氣橫掃60名人類棋手的時候。當(dāng)時Master第二次戰(zhàn)勝柯潔之后,，棋圣聶衛(wèi)平曾表示:

Master改變了我們傳統(tǒng)的厚薄理念,，顛覆了多年的定式。圍棋遠(yuǎn)不像我們想象的那么簡單,，還有巨大的空間等著我們?nèi)祟惾ネ诰?，阿法狗也好，Master也罷,，都是‘圍棋上帝’派來給人類引路的,。

著名棋手古力在成為Master的第60個手下敗將，之后,，也在微博發(fā)表了自己的感受：

作為第 60 個勇士,，犧牲了。,。,。經(jīng)過這幾天的對局，我深深的感受到圍棋的神秘,，似乎 Master 給我們打開一道圍棋的神秘之門,，不論勝負(fù)，人類與人工智能共同探索圍棋世界的大幕即將拉開,，新一次的圍棋革命正在進(jìn)行著,。。,。

這種表現(xiàn),，與將近一年前的“老AlphaGo”可謂天差地別,。想要達(dá)成這樣的成績只有一種可能——DeepMind尋找到了一種機(jī)制來擺脫圍棋中的“人類束縛”,。

迷之改進(jìn)：一舉讓AlphaGo成為人類老師

作為一個極其特殊的棋類和任務(wù)，圍棋擁有數(shù)量極其龐大的可能性,，總的局面數(shù)量達(dá)到10^172,，而可觀測宇宙范圍內(nèi)的原子數(shù)量不過10^80,。這也意味著窮舉絕對不是一條明智的路線。

最終DeepMind給出了一套能夠“模擬”出人類頂尖高手的方案：深度學(xué)習(xí)+蒙特卡洛搜索樹+自我進(jìn)化,。

這一套架構(gòu)在DeepMind發(fā)布在《自然》雜志中的論文中已經(jīng)有詳細(xì)敘述,，

（https://www./nature/journal/v529/n7587/full/nature16961.html）

如果你對其中的細(xì)節(jié)感興趣，推薦閱讀國內(nèi)人工智能創(chuàng)業(yè)公司彩云AI創(chuàng)始人,、CEO袁行遠(yuǎn)在知乎上的相應(yīng)回答,。

（https://www.zhihu.com/question/41176911/answer/90118097）

深度學(xué)習(xí)用以分析人類棋盤，蒙特卡洛搜索樹用來減輕工作量,，自我進(jìn)化用來提升能力,。但有限的運(yùn)算能力還是給DeepMind出了一個不小的難題，后者最終想出了一個辦法：只對學(xué)習(xí)到的人類棋招進(jìn)行蒙特卡洛搜索樹運(yùn)算,，這恰如人類棋手依賴定式,。

定式，又名定石,，指的是人類下圍棋長久積累下來的一種經(jīng)驗(yàn),，對弈雙方在特定情況下會遵循固定下法。著名棋手吳清源則將簡單描述為“在角部彼我棋子接觸時最合理的走法”,。

這些定式被記載在各式各樣的棋譜當(dāng)中,，成為新手入門必看的書籍。

雖然定式是某種意義上是最合理的走法,，但它卻是理想化條件下的產(chǎn)物,，想要完整復(fù)現(xiàn)定式，意味著雙方都必須抱有同樣的理想化思路,。而歷史上并不缺乏不遵守定式,，或者用新定式打敗對方的事例。

問題來了,，為什么千變?nèi)f化的圍棋會出現(xiàn)定式,？而且死守定式會輸，不學(xué)習(xí)定式也會輸,。答案只有一個——人類需要定式來減少圍棋上面的變化,，這樣進(jìn)入中盤之后人類才能利用自身能力掌握棋局走向。

湊巧的是,，這回我們遇到的是運(yùn)算能力遠(yuǎn)超人類的計算機(jī),，讓掌握更多乃至全部圍棋奧秘?fù)碛辛艘唤z可能。

但究竟新AlphaGo怎么樣擺脫“人類束縛”,？參考之前“老AlphaGo”的工作方式,，排除運(yùn)算過程中所有人類元素可能是最徹底的方法。但這樣一來就必須找到另外一種減輕運(yùn)算壓力的策略。目前來看,，這個秘密也只能等DeepMind方面稍后公開了,。

人類敗局已定？

盡管去年人類代表是韓國選手,，但明眼人都可以看出當(dāng)下和去年圍棋人機(jī)比賽的熱度差別,。這從另外一個側(cè)面也反映出了絕大部分觀眾的看法：這次人類要輸。而去年3月李世乭1:3扳回一局時,，柯潔還曾在直播中表示：

我們必須承認(rèn)谷歌就是了不起,， AlphaGo 確實(shí)是超一流的水平，但是也沒有到不可戰(zhàn)勝的地步,。

而在上個月的發(fā)布會上,，柯潔卻顯得尤為謙遜：

有點(diǎn)小緊張，但我不會輕易言敗,，在阿爾法圍棋出現(xiàn)之前,，我以為計算力是AI的優(yōu)勢，后來讓我震驚的是他的大局觀,，AI的宏觀思維讓我很佩服,。AlphaGo圍棋讓我們重新思考，這么下是不是錯的,，會給我們很多啟發(fā),，輸?shù)耐纯嗍峭饨鐭o法想象的，我會不惜一切去追求勝利,。

“輕易言敗”這樣的措辭與其在央視節(jié)目上的慷概激昂形成了強(qiáng)烈對比,。客觀公正地說,，柯潔的勝算很小,，三番棋中哪怕有一盤能夠獲勝都是成功。

而另外兩場比賽（配對賽,、團(tuán)隊(duì)賽）同樣值得認(rèn)真關(guān)注,，這兩場比賽中，人類棋手將首先與AlphaGo配對比賽,、然后再“群毆”AlphaGo,。這不僅體現(xiàn)了DeepMind的自信，同時也再次突出本次本次圍棋峰會的主題：