文/張蕾應(yīng)虹霞車?yán)虬l(fā)自北京,、廊坊、日本東京,、大阪 2016年3月,,《圍棋天地》第6期,首席編輯張大勇給農(nóng)心杯棋評(píng)起的標(biāo)題是《帝國(guó)斜陽(yáng)》,。 “人類圍棋創(chuàng)造了帝國(guó),,大家在這個(gè)帝國(guó)之中進(jìn)行爭(zhēng)霸。但是我覺(jué)得,,這是我們最后一期純?nèi)祟悋澹▋?nèi)容),,從下期開始有計(jì)算機(jī)的交融。起名叫《帝國(guó)斜陽(yáng)》——這是純?nèi)祟悋宓狞S昏,。” 在那期雜志后,,英國(guó)DeepMind公司出品的圍棋軟件AlphaGo4:1擊敗了韓國(guó)的李世石九段,,突破了人工智能(AI)在圍棋上的無(wú)法在互先的比賽中戰(zhàn)勝人類頂級(jí)高手的上限。 新一期的雜志被命名為《駭世晨曦》,。 “當(dāng)時(shí)寫《帝國(guó)斜陽(yáng)》的時(shí)候,,還是認(rèn)為李世石肯定贏?!?/p> “可是你用’斜陽(yáng)’,,夕陽(yáng)西下的這種感覺(jué)都有了?!?/p> “我當(dāng)時(shí)說(shuō)’斜陽(yáng)’,,是指(一天中)最后的時(shí)光,,正常的晝夜輪替,并不是要崩塌了,,并不是說(shuō)你不行,。” 可這好像成了一道悲觀的寓言,。 “輸完三盤棋以后,,整個(gè)棋界微信圈都特別悲涼,覺(jué)得突然來(lái)了一個(gè)外星人,,災(zāi)難來(lái)臨了一樣,。” 迷戀與恐懼 張大勇與當(dāng)今世界圍棋第一人柯潔合著了《夢(mèng)戰(zhàn)》一書,,記述后者在第二屆夢(mèng)百合杯決賽中戰(zhàn)勝李世石的驚險(xiǎn)歷程和內(nèi)心成長(zhǎng),。當(dāng)時(shí)兩人擺棋時(shí),一家媒體來(lái)采訪,,第一個(gè)問(wèn)題就是,,你希不希望人工智能圍棋出現(xiàn)?柯潔直接回:當(dāng)然不希望,,因?yàn)槲艺幵邳S金時(shí)代,。 張大勇與當(dāng)今世界圍棋第一人柯潔合著了《夢(mèng)戰(zhàn)》 張大勇明白,,李世石的脆敗,這使得棋手的神圣感淡化了很多,,“棋界有沮喪的感覺(jué)”,,曾經(jīng)篤定自己已經(jīng)爬上圍棋世界頂峰的、屈指可數(shù)的高手們被迫環(huán)顧四周,,“發(fā)現(xiàn)很多高峰在旁邊立著”,,“這個(gè)感覺(jué),我覺(jué)得對(duì)于頂尖高手來(lái)講,,對(duì)他內(nèi)心的摧殘非常難受,。” 大事件面前,,人們開始分化,。有人頑固。一位圈內(nèi)人士本來(lái)身體不好,,因?yàn)槔钍朗斊?,病情加重,“他是特別傷心,,發(fā)自內(nèi)心地傷心,。他病休了一段時(shí)間,,他覺(jué)得人類圍棋竟然被一個(gè)計(jì)算機(jī)打成這樣,他在AlphaGo之后數(shù)個(gè)月,,極力證明AlphaGo走的棋不行,。”到了去年底今年初AlphaGo化身Master網(wǎng)絡(luò)快棋對(duì)職業(yè)高手60連勝后,,“他就變成了回避這個(gè)的事情,。有點(diǎn)像剪辮子,有的人受不了,,要藏起來(lái),,堅(jiān)決不剪,……他平日性格非常好,,待人也非常友善,,(但)有的時(shí)候你跟他談起來(lái)計(jì)算機(jī)強(qiáng),他就跟你翻臉,?!?/p> 也有人困惑。理智的言辭是“不要盲目崇拜”,。過(guò)激的話也有,。有的棋手在時(shí)過(guò)半年后,還認(rèn)為AlphaGo和李世石的人機(jī)大戰(zhàn)是“做了一個(gè)局”,。 有一部分棋手迅速臣服,,擁抱AI。第一盤比賽后,,張大勇問(wèn)韓國(guó)棋手金志錫九段:機(jī)器棋力怎么樣,?金直接擺了兩個(gè)子。在職業(yè)棋界,,傳統(tǒng)規(guī)矩是每三個(gè)段位讓一子,。讓兩子就意味著職業(yè)九段面對(duì)職業(yè)初級(jí)水平,“相當(dāng)于跑百米,,他先讓跑20米似的”,。 正在北京大學(xué)哲學(xué)系讀書的李喆六段發(fā)表了三篇與人機(jī)大戰(zhàn)有關(guān)的文章,其中第二盤戰(zhàn)罷后的《這兩盤棋沒(méi)有人會(huì)比李世石做得更好》,,閱讀量的后臺(tái)數(shù)據(jù)是30多萬(wàn),達(dá)到歷史之最,。 李世石在于AlphaGo的對(duì)決中以失利告終 看第二盤棋棋譜,,李喆哭了,。 “我確實(shí)從來(lái)沒(méi)有因?yàn)槠蹇捱^(guò),,基本上輸棋也沒(méi)有哭過(guò),更沒(méi)有看到棋譜哭,?!币徊郊鐩_,以及后面的一系列走法,,當(dāng)時(shí)大家都認(rèn)為AlphaGo虧了,,但最后它贏了,“贏得漂亮”,。 “那步肩沖我認(rèn)為展現(xiàn)出來(lái)說(shuō)明AI已經(jīng)有了所謂的’創(chuàng)造性’,,不是機(jī)器本身的創(chuàng)造,而是它下出來(lái)的東西,,幾乎是經(jīng)驗(yàn)之外的,,雖然我們下過(guò)這步棋,但不是在這樣的情況之下,,……他的這個(gè)肩沖,,用俗一點(diǎn)的話就是超越時(shí)代的,我們這個(gè)時(shí)代可能下不出來(lái)這個(gè)棋,?!?/p> 他形容當(dāng)時(shí)的感受:“很震撼”,“就好像一個(gè)畫家看到一個(gè)一百年后的藝術(shù)品,?!?/p> “你說(shuō)他超越了時(shí)代,但他在這個(gè)時(shí)代出現(xiàn)了,,那他豈不是創(chuàng)造了一個(gè)時(shí)代,?” “對(duì),是這樣的,。圍棋現(xiàn)在已經(jīng)進(jìn)入了智能圍棋的時(shí)代,。” 李喆在日后的一篇文章中說(shuō),,“人工智能,,在迄今為止的工具進(jìn)化史中,它的出現(xiàn)很晚,。越晚出現(xiàn)的工具,,力量通常會(huì)越強(qiáng),人們對(duì)它的迷戀和恐懼也會(huì)越大,?!?/p> 怪獸長(zhǎng)成記 2017年3月18日,日本東京電氣通信大學(xué),。 加藤英樹是UEC杯比賽會(huì)場(chǎng)上最忙碌的人,。他是年紀(jì)最大的“參賽者”,,要會(huì)友、社交,、教徒,、受訪,還義務(wù)承擔(dān)一些順便的會(huì)務(wù)工作,。 樸廷桓和DeepZenGo的研發(fā)者加藤英樹 UEC杯是日本電氣通信大學(xué)主辦的機(jī)器圍棋比賽,,到2017年已經(jīng)10屆,。在AlphaGo降臨之前,這里是圍棋AI最前沿的陣地,。加藤英樹是日本最強(qiáng)AI圍棋DeepZenGo的代表,,按照他的劃分,1984到2005年,,AI圍棋走過(guò)漫長(zhǎng)的古典時(shí)代,,人類將自己對(duì)圍棋的理解,平移到AI圍棋中,,由于變化太多,,邏輯復(fù)雜,這樣的平移成果很差,。隨著2006年蒙特卡洛樹搜索的出現(xiàn),,Zen誕生,UEC杯開辦,,見證了AI圍棋急劇發(fā)展的時(shí)期,。2016年DeepMind發(fā)表論文,AI圍棋進(jìn)入AlphaGo時(shí)代,。AlphaGo的原理中既包含蒙特卡洛樹搜索,,又增加了政策網(wǎng)絡(luò)和價(jià)值網(wǎng)絡(luò)兩個(gè)通過(guò)自我學(xué)習(xí)而構(gòu)建起的神經(jīng)網(wǎng)絡(luò),使得機(jī)器棋力突破職業(yè)水平的瓶頸,,并以幾何倍的速度日益進(jìn)化,。去年Zen受AlphaGo影響升級(jí)為DeepZenGo,實(shí)力亦大為增長(zhǎng),。 末代UEC杯開賽,。從明年起,比賽將更換主辦方,。 比賽的場(chǎng)面很松弛,,程序員們穿著休閑裝,正式開賽以后便把時(shí)間都交給機(jī)器,主人們?nèi)齻z倆聚在一起聊天,。 “這個(gè)圈子本來(lái)是很和氣的一個(gè)圈子,不過(guò)今年變成兩大怪獸對(duì)決,?!眮?lái)自臺(tái)灣的旅日棋手王銘琬九段在與其他人交談時(shí)說(shuō)道,“那種感覺(jué)就是一個(gè)小村子的角力比賽,,兩大怪獸突然跑進(jìn)來(lái)參賽,。”往年機(jī)器賽畢會(huì)接受職業(yè)棋士指導(dǎo)一盤,,而今年的冠亞軍決出后幾乎是以指導(dǎo)的姿態(tài)去跟職業(yè)棋手下,。” “(過(guò)去跟現(xiàn)在)完全是兩回事,?!?/p> 大概在六七年前,王銘琬擔(dān)任UEC杯裁判長(zhǎng),,那時(shí)候他最大的任務(wù),,是在機(jī)器中途停掉“不知道要怎么辦”時(shí),去評(píng)判誰(shuí)贏誰(shuí)輸——就像踢足球踢不到90分鐘就沒(méi)體力踢下去了,。 對(duì)于半途而廢局面勝負(fù)評(píng)判的爭(zhēng)議,,大家通常不太在乎。 “參加這個(gè)棋賽的選手,,大家都是同志,,不是敵人。大家都為了提升電腦圍棋,,往一個(gè)目標(biāo)去努力,。”王銘琬說(shuō),。 加藤在現(xiàn)場(chǎng)指導(dǎo)初來(lái)參賽的大學(xué)生程序員也體現(xiàn)出這樣的意味,。今天強(qiáng)大的“怪獸”也是笨拙的過(guò)往積累出來(lái)的,即便在去年,,Zen還需要被讓三個(gè)子,。今年實(shí)現(xiàn)互先,并互有勝負(fù),。 雷米-庫(kù)倫和黃士杰 將蒙特卡洛樹搜索用于圍棋程序的先驅(qū),、法國(guó)人雷米-庫(kù)倫(RémiCoulom)今年的成績(jī)不佳,,只得到第五。 雷米是AjaHuang的老師,AjaHuang是AlphaGo論文并列第一作者,,AlphaGo的人肉臂黃士杰博士,。 雷米稱對(duì)自己的成績(jī)?cè)缬蓄A(yù)料,因?yàn)闆](méi)有用GPU(圖形處理器GraphicsProcessingUnit的縮寫),。 “我的大部分業(yè)務(wù)還是售賣手機(jī)應(yīng)用,,手機(jī)上可沒(méi)有GPU,所以我還是要將精力集中在不使用GPU的情況下,,如何讓軟件變得更強(qiáng),。”42歲的法國(guó)人說(shuō),,“也許是因?yàn)槲易兝狭?,我發(fā)現(xiàn)我對(duì)于激烈的競(jìng)爭(zhēng)沒(méi)有那么大的動(dòng)力。我們會(huì)繼續(xù)精進(jìn)瘋石,,但我這么做是出于樂(lè)趣,。” 剛聽說(shuō)AlphaGo的消息時(shí),,他為Aja感到高興,,但同時(shí)也有一點(diǎn)難過(guò),“因?yàn)檫@是一種終結(jié)……十年來(lái),,打敗職業(yè)棋手一直是一個(gè)令人興奮的目標(biāo)?,F(xiàn)在這一切都終結(jié)了。但是,,沒(méi)關(guān)系,,我可以把注意力轉(zhuǎn)移到其他項(xiàng)目上?!?/p> 可能是語(yǔ)言的緣故,,也可能出于靦腆,談話間他會(huì)有很多躊躇,。尤其是在被問(wèn)到與Aja如今的聯(lián)系時(shí),,雷米說(shuō),“是的,,我們有聯(lián)系,,但是你知道,他們公司對(duì)員工對(duì)外交流控制得很嚴(yán)……有時(shí)候我會(huì)問(wèn)他問(wèn)題,,他會(huì)說(shuō),,’啊……可能……也許……’他啥也不能說(shuō)?!?/p> 這是獨(dú)立開發(fā)者和大公司員工之間的距離,。 “新技術(shù)需要強(qiáng)大的計(jì)算力,,所以我想大公司能夠動(dòng)用龐大的計(jì)算力,,而我沒(méi)有這樣的途徑。所以……作為一個(gè)個(gè)人研究者,,現(xiàn)在已無(wú)力與大公司抗衡,,但是,不管怎樣,,在計(jì)算機(jī)游戲的歷史上,有的時(shí)候有好的想法比擁有強(qiáng)大的硬件要更重要,。能夠冒出好的想法依然還是讓人心潮澎湃,。” 曾經(jīng)在AI圍棋界處于頭號(hào)地位的Zen,,是由尾島陽(yáng)兒和加藤英樹兩人自主開發(fā),。加藤10年前因過(guò)勞而患抑郁癥,辭職后靠政府的殘障年金過(guò)日子,。遵醫(yī)囑的話,,他每天只能工作3到4小時(shí)。但從UEC杯到接下來(lái)大阪舉辦的最強(qiáng)棋士戰(zhàn)(中日韓棋手羋昱廷,、井山裕太,、樸廷桓迎戰(zhàn)DeepZenGo),63歲的老人家要連軸轉(zhuǎn),。如今DeepZen的研發(fā)經(jīng)費(fèi)還是出自尾島和加藤個(gè)人,,加藤的經(jīng)濟(jì)收入主要來(lái)自講演和熱心人士捐助,加上早年研究所時(shí)代的積蓄,。去年因AlphaGo帶熱人工智能而加入Zen團(tuán)隊(duì)工作的DOWANGO,,主要負(fù)責(zé)向兩位研發(fā)者提供服務(wù)器。 抑郁癥給加藤造成身體的損害是不可逆的,,“腦子中有部分組織半永久不可復(fù)元了,,血清素不足,神經(jīng)傳導(dǎo)受限,,所以容易誘發(fā)睡眠障礙,,一過(guò)勞就會(huì)暈倒?!奔犹匍_玩笑說(shuō),,人工智能火了之后,自己也成了人氣明星,,因?yàn)閆en,,他的工作紛至沓來(lái),,簡(jiǎn)直“像藝人一樣”,嗔怪Zen“真是一個(gè)耍得父母團(tuán)團(tuán)轉(zhuǎn)的孩子??!” 從入行以來(lái),加藤的動(dòng)力始終沒(méi)變,,“人工智能研發(fā)至今都還沒(méi)有大腦——我想給它植入一個(gè),!給圍棋軟件,植入一個(gè)真正意義上的聰明的大腦,,這是我最初開始研發(fā)圍棋人工智能的理由之一,。標(biāo)準(zhǔn)19路的圍棋很難,很難擊敗專業(yè)棋手,,但AlphaGo在我沒(méi)有想像到的,,在ZEN的短板處增強(qiáng)了研發(fā),擊敗了職業(yè)棋手,,老實(shí)說(shuō),,我很困惑?!?/p> “在我們IT或者計(jì)算機(jī)科學(xué)領(lǐng)域里面,,毫無(wú)例外,重要的工作都是由公司來(lái)做,?!比斯ぶ悄軐<摇⒈本┼]電大學(xué)教授劉知青說(shuō),。他同時(shí)是北郵九鼎計(jì)算機(jī)圍棋研究所所長(zhǎng),。 在程序世界里,存在著成千上萬(wàn)種編程語(yǔ)言,,真正走進(jìn)大眾生活的,,都是大公司出品,比如C++是貝爾實(shí)驗(yàn)室的,,JAVA是甲骨文的,,Windows是微軟的……大學(xué)里的研究組也做,但影響都不及人們耳熟能詳?shù)倪@些產(chǎn)品,,“因?yàn)檫@些東西除了科學(xué)上的進(jìn)步之外,,……它要數(shù)據(jù)的準(zhǔn)備,它要計(jì)算資源,,……大量的機(jī)器,、人員、資金,,方方面面的投入,?!?/p> 說(shuō)到底,計(jì)算機(jī)科學(xué)不像數(shù)學(xué)領(lǐng)域,,“證明”即達(dá)成,。計(jì)算機(jī)科學(xué)始終要面對(duì)工程和效率的問(wèn)題。在怪物養(yǎng)成記背后,,是程序員個(gè)人選擇的合集,。 劉知青在紐約大學(xué)念書時(shí),親眼目睹了兩種選擇下的人生道路,。有的全職終身教授放棄了教職,,去了貝爾實(shí)驗(yàn)室,“他們?cè)敢庠诖蟮膱F(tuán)隊(duì)里面,,做出一個(gè)更有影響的事情,。”也有的人堅(jiān)持留在大學(xué)里,,做一般公司不太做的初期創(chuàng)新,這里包含了研究的自由,。 “最早的蒙特卡洛的方法,,神經(jīng)網(wǎng)絡(luò)的方法,都是大學(xué)的研究團(tuán)隊(duì)來(lái)做的,,并不是公司來(lái)做,。只是當(dāng)這些東西相對(duì)成熟了,那么大公司就把它拿來(lái),,做成一個(gè)有影響力的產(chǎn)品,。”劉知青說(shuō),。 隨著UEC杯的落幕,,我與雷米談起他對(duì)這個(gè)比賽最美好的記憶。他說(shuō):“我得過(guò)4次冠軍,。每次獲勝都是很美好的記憶,。事實(shí)上,我人生第一次來(lái)日本也是因?yàn)閁EC杯主辦者的邀請(qǐng),,多虧了UEC杯,,我才能來(lái)日本,現(xiàn)在也和日本人做生意,。我印象深刻的是,,我第一次來(lái)日本。此前我從未到過(guò)亞洲,。我生在法國(guó),。那是2007年(我來(lái)到日本),,就好像發(fā)現(xiàn)了一個(gè)嶄新的星球一樣?!?/p> 數(shù)與道的轉(zhuǎn)化 2015年,,樊麾結(jié)束歐洲圍棋大會(huì)后回到在法國(guó)的家。他收到一封郵件,,英文的,。他英文不好,一般這樣的郵件會(huì)遭到無(wú)視,。但誰(shuí)知道為什么,,他讀了這封來(lái)自英國(guó)的郵件。 郵件說(shuō),,我們是一家倫敦的公司,,想邀請(qǐng)你來(lái)看一看。樊麾跟他們開了線上會(huì)議,,上網(wǎng)搜了公司主頁(yè),,看到了上面有圍棋,說(shuō)服自己相信收到了一個(gè)真實(shí)的邀請(qǐng),。 英國(guó)人告訴這位早年在中國(guó)成為職業(yè)二段后遠(yuǎn)渡重洋在法國(guó)為圍棋開枝散葉的棋手,、教練,希望他輔助他們研究機(jī)器圍棋,。樊麾一度設(shè)想自己會(huì)渾身插滿設(shè)備,,用以導(dǎo)出下棋時(shí)的思考方式。 而最終他要做的非常簡(jiǎn)單:跟程序下棋,。他很輕松地說(shuō),,要一個(gè)小時(shí)就夠了。 2015年10月,正在與AlphaGo苦戰(zhàn)當(dāng)中的樊麾(右一),。 他第一次跟機(jī)器下棋在2005年的法國(guó),。一開始機(jī)器運(yùn)轉(zhuǎn)的聲音很平緩,對(duì)弈時(shí),,機(jī)器的響聲變得劇烈起來(lái),,聽上去仿佛真的有腦漿在翻滾在思考。到了2015年,,他以為,,類似的經(jīng)驗(yàn),平移到英國(guó),,就可以,。 在他的概念里,,人類棋手強(qiáng)于全局觀,能用組織化的思維看待各個(gè)要素,,所以在與AlphaGo的第一局比賽時(shí),,“我下得很有全局觀,下得很慢,,不急于進(jìn)攻,。”對(duì)局中,,他漸漸發(fā)現(xiàn),,AlphaGo要的,跟他一樣,。 比賽的結(jié)果全世界都知道了,,5:0,AlphaGo完勝,。 跟AlphaGo對(duì)弈之后,,“我內(nèi)心的圍棋世界坍塌了”。其后樊麾參加一項(xiàng)重要的歐洲比賽,,每局45分鐘的時(shí)限,,加上被AlphaGo沉重打擊的內(nèi)心,他幾乎沒(méi)有信心參賽,。 “但非常奇怪的事情發(fā)生了——我贏了所有的比賽,非常輕易的,。我努力想要弄清楚到底發(fā)生了什么,。我看到我和AlphaGo的比賽,找到了一個(gè)新的視角來(lái)看我自己的比賽,?!?/p> 樊麾在波士頓大學(xué)演講時(shí)道出了自己的故事。 “當(dāng)你學(xué)圍棋的時(shí)候,,你學(xué)的第一件事是定式,、布局,好的方向,,好的形狀,。第二步就是怎么樣最好地利用這些形狀。但這些還遠(yuǎn)遠(yuǎn)不夠,。如果你想打敗大師,,你必須忘記你之前學(xué)的所有的東西。因?yàn)槟銓W(xué)的所有東西都像一個(gè)籠子一樣,,把你關(guān)在里面……你想的是定式是什么,,布局是什么,,有時(shí)你忘了如何才能讓這些棋子聯(lián)合生效,這就是為什么,,當(dāng)我和AlphaGo比完賽之后,,我覺(jué)得世界坍塌了,但同時(shí)建立起了新的東西,,現(xiàn)在我下起棋來(lái)完全自由了,。” 這個(gè)自由的故事為他贏得了掌聲,。他在AlphaGo的V18版本中經(jīng)歷和思考的,,世界頂級(jí)棋手們?cè)赩25及此后的版本中,逐漸體味,。 “最開始看到當(dāng)然覺(jué)得不能理解,,覺(jué)得不知道好在哪。但是他就在你不知道他哪里好的時(shí)候他就贏了,。所以再多看了一些之后,,雖然你不理解他好在哪,但他就是這么下就可以贏,。所以你就想辦法慢慢去理解唄,。越來(lái)越感受到他的強(qiáng)?!敝茴Q蚓哦握f(shuō),,“一開始感覺(jué)很難接受這個(gè)東西,但是越來(lái)越覺(jué)得自己理解得太淺太淺了,,對(duì)圍棋的理解,。越來(lái)越覺(jué)得自己還是太弱?!?/p> 國(guó)際象棋領(lǐng)域很早就引入計(jì)算機(jī)輔助棋手訓(xùn)練,,計(jì)算機(jī)的棋力早已做到可以讓職業(yè)高手一馬。從項(xiàng)目本身的復(fù)雜程度來(lái)說(shuō),,國(guó)際象棋要稍遜于圍棋,,因此對(duì)于定式和原則的限定會(huì)更明確,在這樣的背景下,,被計(jì)算機(jī)攻破職業(yè)堡壘后,,人與機(jī)器達(dá)到接受與融合,部分定式廢止,,公認(rèn)的和棋被推翻,,人類的棋力也得到大幅提高。 某種程度上,國(guó)際象棋已經(jīng)成為圍棋的前車之鑒,。 顛覆會(huì)帶來(lái)震蕩,,認(rèn)知上的震蕩,表面不彰,,內(nèi)心翻滾澎湃,。 “這個(gè)我倒不覺(jué)得是打擊,我倒覺(jué)得是挺興奮的一個(gè)事情,,這太有趣了,。如果沒(méi)有它的話,我們可能一百年之后,,一上來(lái)還不敢用點(diǎn)三三,。其實(shí)它點(diǎn)三三之后我們都明白它為什么點(diǎn)三三,它不扳粘,,它是有它的很明顯的道理的,,但是由于我們的慣性思維,點(diǎn)三三之后一定會(huì)扳粘的,,習(xí)慣了,,那樣的話我們就不會(huì)去點(diǎn)三三?!崩顔戳握f(shuō),。開局不久點(diǎn)三三已經(jīng)成為多位職業(yè)棋手在大賽中嘗試運(yùn)用的新招法。 三-三是指從棋盤邊線開始數(shù),向里橫向第三行,,縱向第三列的交叉點(diǎn),。人機(jī)大戰(zhàn)首局,柯潔執(zhí)黑在第3手和第7手連續(xù)搶占兩個(gè)三-三,。 “我覺(jué)得很有意思的是,我之前有一個(gè)同學(xué)拍了一個(gè)畢業(yè)作品,,是講的吳清源和秀哉的那盤棋,,里面引用了一句話,三三的弱點(diǎn)是星位,,星位的弱點(diǎn)是三三,現(xiàn)在Master或者是AlphaGo很好地去證明了這一點(diǎn),。因?yàn)橐郧爸v星位的弱點(diǎn)是三三,,更多的意思是抽象的,腳步很空虛,,不踏實(shí)的,。但是現(xiàn)在三三可以直接肩沖,,星位可以直接點(diǎn)三三,但是并不能證明星位和三三就不好了,。這其實(shí)是一個(gè)很辯證的東西,,很有意思。我覺(jué)得圍棋里充滿了這樣的東西,?!?/p> “研究機(jī)器的招法的樂(lè)趣在于什么?” “研究機(jī)器的招法的樂(lè)趣在于把它轉(zhuǎn)化成我能理解的思維方式,?!?/p> 李喆在此前做了七路圍棋研究,整個(gè)棋盤全部算清,,一比較就知道下哪個(gè)點(diǎn),。到十九路圍棋,人已經(jīng)算不清了,,“我們就說(shuō)這個(gè)地方是厚還是薄,,這個(gè)地方是虛還是實(shí),我用什么樣的策略,?!?/p> “人工智能體現(xiàn)出來(lái)的其實(shí)更趨近于第一種思路,雖然它也達(dá)不到窮盡,,但它還是基于數(shù)的一種,,最后是勝率的比較?!笨傊?,“在能夠用數(shù)學(xué)達(dá)到的地方,就用數(shù)學(xué)去達(dá)到它,,我們?cè)跀?shù)學(xué)達(dá)不到的地方,,我們用道的方式來(lái)理解,道理的方式更模糊,,但是更具有普遍性,,認(rèn)識(shí)圍棋也是這樣?!比斯ぶ悄鼙旧聿皇窃趧?chuàng)造,,它只是一個(gè)算法,但作為接收方,,我們以人的方式理解,,這就構(gòu)成了“數(shù)和道的對(duì)話”,“用我們的道理的方式理解它的創(chuàng)造性,就會(huì)變成我們自己的吸收,,我覺(jué)得這個(gè)是非常非常有意義的事情,。” “人是沒(méi)有出路的” 2016年11月,。 60歲的日本棋手趙治勛九段對(duì)DeepZenGo的電王戰(zhàn)中,,DeepZen顯示勝率超過(guò)50%的情況下,加藤代表主動(dòng)認(rèn)負(fù),,引起爭(zhēng)議,。 “一般來(lái)說(shuō)是將勝率預(yù)測(cè)設(shè)定在某一特定數(shù)值,比方說(shuō)30%(低于30%則機(jī)器認(rèn)負(fù)),。但如果在勝率預(yù)測(cè)40%的時(shí)候,,我感覺(jué)盤面比較艱難,也會(huì)武斷地決定投子認(rèn)輸,。這種靈活的判斷,,還是只有人類能做,機(jī)器不靈......所以基本上是由我來(lái)作出判斷的,?!傊J(rèn)輸這件事,,目前還是需要研發(fā)團(tuán)隊(duì)來(lái)作出判斷,,而不是交給AI圍棋本身。我聽說(shuō)AlphaGo的這個(gè)數(shù)值是10%,,我不太喜歡這個(gè),,這里還是有文化差異的吧,日本和歐美對(duì)圍棋文化的理解不同,。在日本,,有’玷污棋譜’一說(shuō),如果最后的棋型走得很奇怪的話,,對(duì)圍棋是一種褻瀆,。日本有這樣的傳統(tǒng)?!?/p> 對(duì)此,,劉知青則表示反對(duì),“我覺(jué)得把它中斷下來(lái)是不合適的,,因?yàn)槲易鳛橐粋€(gè)科研人員來(lái)看它,這是一個(gè)測(cè)試過(guò)程,,我希望能夠展現(xiàn)它的弱點(diǎn)是什么,。加藤把它停下來(lái)了,其實(shí)是阻礙它的弱點(diǎn)的暴露?!?/p> 另有觀點(diǎn)認(rèn)為,,加藤替機(jī)器做決定,可能使機(jī)器喪失原本運(yùn)籌的取勝機(jī)會(huì),。加藤也承認(rèn),,自己電王戰(zhàn)時(shí)意識(shí)還停留在機(jī)器水平大幅落后于人類棋手時(shí)期,認(rèn)為死磨硬泡等待對(duì)手犯錯(cuò)與玷污棋譜無(wú)異,,“現(xiàn)在回過(guò)頭來(lái),,我覺(jué)得那個(gè)時(shí)候,就有必要修改認(rèn)輸機(jī)制了——因?yàn)榈搅嘶ハ?,你是可以等待?duì)方出錯(cuò)的,,這沒(méi)有關(guān)系。然而我當(dāng)時(shí)并沒(méi)意識(shí)到,?!ú贿^(guò))有這種(原本勝機(jī)喪失掉)可能也沒(méi)有什么。本來(lái)就是研發(fā)者在承擔(dān)所有的責(zé)任,。比方說(shuō),,如果在對(duì)弈過(guò)程中,程序出現(xiàn)BUG,,然后AI圍棋輸了,,這些責(zé)任都是研發(fā)者在承擔(dān)。最后的認(rèn)輸判斷也不例外,。說(shuō)到底,,一切交由AI,也是研發(fā)者作出的判斷,?!?/p> 劉知青反對(duì):“你沒(méi)有決定權(quán),當(dāng)它下棋的時(shí)候,,你已經(jīng)沒(méi)有決定權(quán)了”“你替他認(rèn)輸,,真是有悖于科學(xué)的道理,……你要看AlphaGo被李世石擊敗的時(shí)候,,它是怎么下荒唐棋的,,這個(gè)是我們?yōu)閿?shù)不多的一個(gè)機(jī)會(huì)見到這件事,你不讓它(繼續(xù)下),,怎么辦,?” 科學(xué)精神、人類的自主權(quán),,人對(duì)工具的態(tài)度,,與工具的關(guān)系,,與自我和認(rèn)知緊密相聯(lián)。 有人工智能專家曾經(jīng)預(yù)言,,如果制造出能戰(zhàn)勝職業(yè)棋手的國(guó)際象棋AI,,那么后者一定具備從戰(zhàn)略素養(yǎng)到戰(zhàn)術(shù)能力的全方位的強(qiáng)人工智能。事情并未這樣發(fā)展,,但結(jié)果是人類收獲了足以輔佐其棋藝精進(jìn)的機(jī)器,。 跟國(guó)際象棋AI類似,圍棋AI并非從人類總結(jié)出的棋理邏輯出發(fā)來(lái)構(gòu)建,,而是將人下棋的過(guò)程,,拆解出大量的對(duì)弈積累(政策網(wǎng)絡(luò)),識(shí)別形狀的好壞(價(jià)值網(wǎng)絡(luò)),,對(duì)變化的可能性進(jìn)行有效篩選剪枝后隨機(jī)搜索驗(yàn)證(蒙特卡洛樹搜索),,得出人看來(lái)最優(yōu)化的一步(勝率最高)落子。 “AlphaGo(圍棋行為的輸入和輸出)的過(guò)程,,它也可以更好地揭示了人下圍棋的過(guò)程,。”劉知青說(shuō),,這反過(guò)來(lái)讓我們“對(duì)于人類思考的一種方式,,可能有個(gè)更深的、更本質(zhì)的理解,,我覺(jué)得這個(gè)意義上可能更重大一點(diǎn),。……曾經(jīng)認(rèn)為圍棋就是一個(gè)神圣的東西,,其實(shí)它不是,,或者說(shuō)認(rèn)為我們大腦思維是一種神圣的東西,其實(shí)也不是,,它是一個(gè)神經(jīng)系統(tǒng)的物理過(guò)程,,但可能超出了普通的認(rèn)識(shí),但是也不是一個(gè)不可超越的或者是神秘的過(guò)程,,現(xiàn)在我們可以看到,,所有的這些物理過(guò)程都不是神秘的,我們有更好的認(rèn)識(shí),,而且是可以復(fù)制他們的,,而且可以超越他們的?!?/p> 這樣的認(rèn)知,、復(fù)制和超越的過(guò)程,使得人工智能由弱變強(qiáng),,終極問(wèn)題隨之誕生:最終人工智能會(huì)導(dǎo)向何種歸宿呢,? 樂(lè)觀的觀點(diǎn)是工具強(qiáng)大且受人控制,,為人服務(wù)。悲觀的如特斯拉的老板ElonMusk,,他認(rèn)為最好的情況是,人成為機(jī)器的寵物,?;艚鹨矊?duì)人類未來(lái)的掌控權(quán)擔(dān)憂。 “我覺(jué)得首先這個(gè)東西好壞不講,,這個(gè)趨勢(shì)是必然的,,就是說(shuō)這個(gè)是必然的方向,無(wú)論好壞,?!眲⒅嗾J(rèn)為,縱然前途未知,,人類卻仍然會(huì)將人工智能發(fā)展下去,,并承擔(dān)好與壞可能性的并存。 “人必須要做,。因?yàn)槿艘?jìng)爭(zhēng),。你競(jìng)爭(zhēng)就得利用這個(gè)東西,除非你不競(jìng)爭(zhēng)了,,你說(shuō)我放棄,,沒(méi)有人愿意放棄,你要競(jìng)爭(zhēng),,你必須要做這個(gè)事情,,除非你說(shuō)跟我無(wú)關(guān),我這人放棄了,,但是只要你想競(jìng)爭(zhēng),,你必須要利用機(jī)器,你利用這個(gè)機(jī)器的時(shí)候,,你就要促進(jìn)它的發(fā)展,,這個(gè)機(jī)器肯定會(huì)越來(lái)越強(qiáng),這個(gè)與你一直無(wú)關(guān)嗎,?” “其實(shí)是人性促使了這個(gè)東西,?” “是的。人是沒(méi)有出路的,?!嗽诮柚@樣的工具,你沒(méi)有辦法(避免爭(zhēng)奪掌控權(quán)),?!?/p> 人類親手為自己開創(chuàng)了一個(gè)未知的結(jié)局,。在劉知清看來(lái),意義更多地落于奔向這個(gè)結(jié)局的過(guò)程:“我們是通過(guò)人工智能的研究,,通過(guò)機(jī)器的發(fā)展,,也是認(rèn)識(shí)人的局限性、人的能量,、人的地位,,其實(shí)都是認(rèn)識(shí)我們自己,認(rèn)識(shí)到我們自己,?!?/p> 自由的人 從小下棋,國(guó)家隊(duì)10年,,有個(gè)問(wèn)題一直困惑著李喆——下棋的社會(huì)意義是什么,?父母親是醫(yī)生、教師,,他們的社會(huì)意義很好理解,。棋手成天下棋,為了什么,?追尋棋道嗎,?那么,棋道又是什么,?是勝負(fù)嗎,?當(dāng)一位棋手年紀(jì)漸長(zhǎng),反應(yīng)速度變慢,,計(jì)算力下降,,無(wú)法在現(xiàn)有的競(jìng)技體系中獲取勝利了,那他(她)追求的就不是棋道了嗎,? 李喆跟時(shí)越,、樸文垚等棋手朋友探討過(guò)這個(gè)問(wèn)題,沒(méi)誰(shuí)說(shuō)得清,。他去看書找答案,,獲得一些啟發(fā),但難以系統(tǒng),。所以,,當(dāng)讀大學(xué)的機(jī)會(huì)降臨時(shí),他毫不猶豫地選擇暫別競(jìng)技體系,,那時(shí)他的等級(jí)分排在全國(guó)前三,,距離世界冠軍并不遠(yuǎn)。 AlphaGo的降臨成為棋手參悟圍棋,、理解自身與社會(huì)關(guān)系的重大機(jī)會(huì),。 “我們對(duì)于圍棋的認(rèn)識(shí)有了更趨近真理的方法,,之前從來(lái)不知道我們對(duì)圍棋的認(rèn)識(shí)到底達(dá)到一個(gè)什么程度,有了這個(gè)之后,,可能有了更好的參照,,有更好的幫助我們?nèi)ダ斫狻,!崩顔凑f(shuō),。 AlphaGo是用強(qiáng)大到深不可測(cè)的棋力來(lái)給人們提供參照的。 “AlphaGo的棋風(fēng)可能是千變?nèi)f化的,,沒(méi)有什么是它的棋風(fēng)。它沒(méi)有棋風(fēng),,隨心(所欲),。”周睿羊說(shuō),,“看到它樸實(shí)地下,,就可以贏,就是美啊,?!?/p> “對(duì)你來(lái)說(shuō),它是一個(gè)棋手嗎,?” “當(dāng)然……是,。對(duì)于我們現(xiàn)在來(lái)說(shuō),它就是神,?!?/p> 羅洗河九段受邀參與人工智能圍棋的研制和測(cè)試時(shí),旁人為了增加產(chǎn)品與工作人員的親近感,,說(shuō),,我們把產(chǎn)品當(dāng)孩子一樣養(yǎng)大吧。羅洗河說(shuō),,我不這么認(rèn)為,,“我就是在造神”。一年多的工作下來(lái),,羅說(shuō),,“造神是無(wú)法求證的理想。不斷的更近一些也是很美妙的,?!?/p> 跟很多棋手的感知相反,圍棋AI給王銘琬的啟示是,,“不用那么懷疑自己”,,“其實(shí)我個(gè)人下棋一開始還是蠻有用概率性的想法去下,。” 這位本因坊戰(zhàn),、王座戰(zhàn),、日本大師賽冠軍,圈中人稱“怪腕”的棋手說(shuō),,“因?yàn)槲冶旧聿⒉皇悄欠N一流的棋手,,運(yùn)氣好的時(shí)候拿一兩個(gè)頭銜。我跟柯潔,、趙治勛一開始就站在不一樣的地方在看這個(gè)圍棋,。柯潔是以下贏為目的,,而我只覺(jué)得,,下完了……只要好玩就好了?!瓏咫娔X到現(xiàn)在并沒(méi)有告訴人到現(xiàn)在人對(duì)圍棋的看法和研究是沒(méi)有用的,,正好是相反,這個(gè)方向是沒(méi)錯(cuò)的……以前自己對(duì)這個(gè)方向的努力還不夠,?!?/p> 在王銘琬看來(lái),“圍棋的目的不是為了打敗對(duì)方,,而是雙方共同創(chuàng)出的一個(gè)時(shí)間跟作品,。從這個(gè)方面來(lái)說(shuō),電腦打敗人類,,是讓人類回歸原點(diǎn),。”勝負(fù)只是一個(gè)人為的機(jī)制,,“說(shuō)人類很注重勝負(fù)只是因?yàn)樗菀讏?bào)道,,容易理解,并不是說(shuō)人類真的只喜歡勝負(fù),,要是脫離了勝負(fù)這個(gè)桎梏,、枷鎖的話,說(shuō)不定會(huì)有更自由的發(fā)揮,,是(我)自己抱有的看法,。” 圍棋傳媒有個(gè)經(jīng)典問(wèn)題:如果有“圍棋上帝”,,你認(rèn)為自己跟祂有多大差距,? 在AlphaGo出現(xiàn)之后,棋手們對(duì)這個(gè)問(wèn)題的答案有了更謙遜,同時(shí)又包含更多可能性的回答和思考,。 正在與DeepzenGo對(duì)弈的趙治勛(右) “人很難去評(píng)判有沒(méi)有上帝這回事,。但上帝,,確實(shí)是遲遲不肯露臉的那個(gè)存在,不肯跟我們?nèi)祟惼迨忠黄鹎写?,一切喝酒聊天,。但AI出來(lái)了,至少在形式上是看得見摸得著的,。它比人類更強(qiáng)大,,比李世石、柯潔更強(qiáng)大,,成了一種類似上帝般的存在,,然后我們?nèi)祟悶榱私咏θプ汾s去超越,。這跟從前不一樣的。從前的話,,一旦成了人類中的最強(qiáng)棋手,,就會(huì)以為老子天下第一,不得了了,。但現(xiàn)在,,AI來(lái)襲!它或許就是上帝的化身,,是看得見摸得著的上帝,。而因?yàn)榭吹靡姡覀內(nèi)祟惼迨秩タ拷?。從前看不見,,所以人類就在那里坐等著。在未?lái)的圍棋世界,,就算你達(dá)到人類棋手之最了,,你未必是圍棋世界之最,就會(huì)激發(fā)起你的上進(jìn)心,。而不像從前,,自以為老子天下第一,你會(huì)變得謙卑,,用心精進(jìn),。這,我覺(jué)得實(shí)在太有趣了!”韓國(guó)旅日的超一流棋手,、日本棋戰(zhàn)獲頭銜次數(shù)最多的棋手趙治勛九段說(shuō),。 作為一個(gè)傳奇人物,他在當(dāng)下最傳奇的事情莫過(guò)于,,沒(méi)有手機(jī),。 “在日本,沒(méi)有手機(jī)的恐怕也只有我一個(gè)了(笑),。因?yàn)槲也粫?huì)弄手機(jī),,對(duì)我純屬浪費(fèi)?!?/p> 這個(gè)沒(méi)有通訊工具的人,,我們只有在棋賽上才得一見。在3月日本大阪舉行的最強(qiáng)棋士戰(zhàn)中,,趙治勛出任裁判長(zhǎng),。循慣例,日本大賽會(huì)舉行前夜祭,。標(biāo)志性的蓬亂的頭發(fā),,紅潤(rùn)的面色,趙治勛在舞臺(tái)中央妙語(yǔ)連珠,,活像得到了落語(yǔ)大師的真?zhèn)?。前夜祭上每個(gè)人都著正裝出席,加藤英樹先生也脫下圍棋AI大賽上的休閑打扮,,換上筆挺光鮮的西裝,。 在性質(zhì)不同的比賽中快速切換,讓人難免有恍惚之感,。世界似乎越來(lái)越大,,在思維層面上,我們擁有不斷被解放出來(lái)的自由,。 “如果可以選擇,,您更愿意做很老實(shí)但很少犯錯(cuò)無(wú)懈可擊不知疲倦的AI圍棋棋手,還是很狡猾但會(huì)犯錯(cuò)的人類棋手,?”這個(gè)問(wèn)題只提給過(guò)老頑童趙治勛,。 “我寧愿當(dāng)個(gè)人,下棋有輸?shù)臅r(shí)候,,也有贏的時(shí)候,。輸棋的時(shí)候我總會(huì)非常非常悲傷,簡(jiǎn)直就是世界末日,。但正因?yàn)檫@樣,,所以贏棋時(shí)的快樂(lè),就是百倍的。而如果是一直贏下去,,永遠(yuǎn)不會(huì)輸?shù)脑?,恐怕太無(wú)趣了。所以我想當(dāng)人,?!壁w治勛說(shuō)。 他還擁有著為人的任性,。在嚴(yán)肅闡述了AlphaGo的強(qiáng)大之后,,他說(shuō),“如果代表人類出戰(zhàn)的是柯潔,,我相信他將百分百戰(zhàn)勝AI圍棋,。”理由也是百分百人的理由,,“我堅(jiān)信柯潔能贏,。因?yàn)槲腋P(guān)系很好。這不是玩笑話,??聺嵅?9歲。我從前也有過(guò)一陣棋力還算強(qiáng)的時(shí)候,。按道理說(shuō),,柯潔不可能知道我,可是在某些聚會(huì)中見面,,他都會(huì)主動(dòng)跟我打招呼,,向我問(wèn)好,,我非常非常開心,!真的。我一直以為他不可能知道我這個(gè)人的......我是柯潔的粉絲,!” 而在昨天的第一局較量后,,執(zhí)黑以1/4子惜敗的柯潔表示:“(自己)輸?shù)脹](méi)什么脾氣?!?。 (楊昕雨對(duì)本文亦有貢獻(xiàn)。感謝常昊,、周睿羊,、李喆、劉知青,、華學(xué)明,、張大勇、謝銳、王煜輝,、房學(xué)峰,、王平、加藤英樹,、羋昱廷,、趙治勛、王銘琬,、俞斌,、馬林、羅洗河,、雷米-庫(kù)倫受訪) |
|
來(lái)自: 源來(lái)花開401 > 《實(shí)政》