第 4416 篇深度好文:7369 字 | 12 分鐘閱讀 本文優(yōu)質(zhì)度:★★★★★+ 口感:黃金鳳尾蝦 筆記君邀您閱讀前,,先思考: 人們?yōu)槭裁磳θ斯ぶ悄苄判谋铮?/p> 人工智能真的會取代人類工作嗎,? 人工智能的極限在哪里? 今天我們要講的題目是“人工智能的極限”,。這是一個最高層的題目,,我們先要講人工智能不能干什么,或者我們?nèi)四芨墒裁?,然后再考慮怎么干,。五年前我講大數(shù)據(jù)的時候,,不斷說服大家去相信它,因為它能帶來機器智能,。但五年后的今天,,大家對人工智能的信任爆棚,而且把時間表都列出來了,,這個時間表是一個很保守的能夠?qū)崿F(xiàn)的時間表,,并不是瞎寫的。首先說下打撲克這件事,,下一屆的撲克冠軍可能是機器,。從計算機的算法角度來講,打撲克的難度大于圍棋,。因為博弈論,,是你一個人做決定,假如說你在做一個關(guān)于企業(yè)市場的決定,,或者你有一個學習計劃,,設(shè)定一個目標等,都是很容易的事情,。但是,,如果你有一個對手,總給你搗亂,,這就成為一個難事了,。回到圍棋和撲克,,下圍棋時,,只有一個人給你搗亂,但打撲克就相當于三個人給你搗亂,,自然更難,。總是很多人問我“智能時代孩子學計算機是不是更好”,當下,,無論中國家長還是美國家長,,似乎普遍都希望孩子學計算機。事實也是如此,。在美國,,現(xiàn)在大學里對于像ABC、亞裔的學生來講,基本上就剩兩個專業(yè)了,,一個是計算機科學,,第二個是非計算機科學。 比如說MIT(麻省理工)的本科生,,有40%的人隨便挑專業(yè),,最后有40%選擇的是計算機。 但是,,2024年計算機可能就可以自己編寫一些程序了,。今天,計算機已經(jīng)能寫腳本了,,那做這種初級工作的程序員可能就失業(yè)了,。 2012年時,已經(jīng)有科學家在研究工智能機器翻譯,,即把人的自然語言翻譯成計算機的語言,,這樣的話,以后產(chǎn)品經(jīng)理不用再找工程師干活了,。 到2026年,,計算機就可以完成中學生水平的作文了。今年華爾街日報,、紐約時報的很多文章計算機寫的,,標題、第一段,、結(jié)尾是人寫的,,中間全是計算機寫的。 2028年,,計算機能編輯視頻,,這是比文字更難的操作。 2049年不得了,,最佳暢銷的小說都是計算機寫的,,不過距離今天已過了30年。 2059年就很可怕了,,說計算機能研究數(shù)學——最難的科學。按照趨勢來講,,這些都是可能發(fā)生的,,所以,我對這張人工智能時間表并不懷疑,。但是,,普遍樂觀之下,擔心也在逐漸加深:人工智能會不會讓我們失去自由?我們會不會成為機器的奴隸,?我們何以為人,? 計算機做事情的過程,基本上是先從技術(shù)開始,,到最后走向人文,。最早計算機用來計算,連程序都沒有,;到上個世紀40年代,,做出來的計算機才能夠進行編程,可以把一個完整流程的過程解決掉,;到60年代,,計算機有一大突破,在控制上能夠做得非常漂亮了,。今年是2019年,,阿波羅登月50周年。1969年時,,一個阿波羅的主控計算機系統(tǒng)要幾個房間這么大,,但功能還不如一個手機的千分之一。所以,,那個時候能控制38萬公里之外的登月,,實在是很了不起的事。一直到90年代之后,,機器翻譯的論文開始出現(xiàn)了,;2000年之后,語言的處理這件看似不是計算機的事兒,,現(xiàn)在也能通過計算做成了,;再接下來是圖像識別。其實我們今天關(guān)注人工智能,,主要是因為2016年阿爾法狗贏了人類?,F(xiàn)在所有的棋類比賽,冠軍都是計算機,。不過,,這些都屬于綠色部分的問題,是比較容易解決的,,難的是白色雪山上的問題——科學研究,。比如科學,我?guī)字芮叭チ颂擞始覍W院,,前院長講一個報告時提到阿波羅登月50年,,我們不需要再派人去月球的原因——沒必要,,就像中國似的,派個機器人去就可以了,,因為機器人在當?shù)刈隹茖W實驗不受環(huán)境干擾,,比人做得好。 再比如基因編輯這個熱門話題,,一旦編輯錯了,,人就會得病,單單靠人對基因的那一點點了解是不能做到解決疾病而不帶來任何副作用的效果的,,這就要靠計算機了,。 接下來商業(yè)談判,找一個計算機做決策,,最后的結(jié)果可能比你親自討價還價的結(jié)果要好,。之后可能還可能寫小說;再接下來可怕了,,發(fā)明技術(shù),;比較難的是政治;最難的是藝術(shù),。大家看上面這首李白風格的詩,,它是計算機自動生成的,大部分中文系畢業(yè)的大學生是寫不出來的,。有精通唐詩的人會說這個是現(xiàn)代人的平仄,,不是古代人的平仄,這個問題不做深究,。大家再看下面這首稍微復(fù)雜一點的詩,,配了兩幅圖,是不是挺有意境的,?這是幾年前我在谷歌做自動問答項目時,,用漢語的語言模型寫出來的詩。說實話,,一般人還真寫不出來,,即便拿它做圖靈測試,也肯定能通過,。以上提到的這些事兒如果計算機都能做了,,那還有什么事情是計算機還不能做的,?如果一定要劃條邊界的話,就是計算機還有什么缺陷,?拿作詩來說,,計算機能寫出漂亮的詞句,但是總體來說思想貧乏,;拿計算機作為文字處理來說,,它完全能從客觀事實中總結(jié)簡單的規(guī)律,甚至能預(yù)測未來的走勢,,但缺乏獨立見解,。什么意思?你把這幾年百度的財報給它,,它會寫出一個很好的評論,,比如按照這個趨勢,接下來它的增長還會怎么樣,。但百度財報一出來之后,,就有無數(shù)人吐槽,這個“吐槽”就是獨立思想的體現(xiàn),。另外,,計算機可以把事物進行分類,很清楚地劃出內(nèi)涵和外延,,但卻不能創(chuàng)造概念,。分類的話,比如人臉識別這件事兒,,云端有一個涉及臉部特征的單子,,計算機可以將人進行分類,一群是要找的“罪犯”,,一群是不在搜尋范圍內(nèi)的,,會劃分得非常清楚。但是如果抓了一些人,,讓計算機對其貼標簽,,它就犯難了。不過,,我們?nèi)祟愄貏e擅長創(chuàng)造概念,,比如說現(xiàn)在的一些詞兒,像“開掛”這種的,,計算機無論如何是起不出來的,,這是人的特長。接下來結(jié)合我自己寫作的例子,、心得進行分享,。我寫了兩本與歷史有關(guān)的書,一本是《文明之光》,,一本是今年的《全球科技通史》,。寫作前期我也拜訪了一些學歷史的學者,,到后面慢慢體會到,你想寫史,,基本上有三個層次,,我們以上海為例:第一,記錄史實,。這件事計算機比人做得精準,、細致。攝像頭就是很好的工具,,可以將上海所有的生活記錄下來,,然后刪掉沒用的,留下特別的,。 第二,,總結(jié)規(guī)律。計算機也能總結(jié)出規(guī)律來,,大概每天早上經(jīng)過陸家嘴的人流情況,、人民廣場的人流情況等,比如說過年要放煙花,,慢慢地它就能總結(jié)出哪些日子比較重要,。 第三,也是更為關(guān)鍵的一點,,寫史這件事要傳達一個春秋大意,,比如司馬光寫《通鑒》,就是告訴你如何當個好皇帝,,是有很強的目的性的,;我寫《全球科技通史》就是要向大家傳達它起的作用,這件事情計算機是做不到的,。前面講這些,,表達的都是:智能時代,很多具體的事情計算機都可以做到,,但人最重要的是思想,,這是計算機無法企及的。除此之外,,人工智能的能力是否有邊界呢,?當然有,人工智能的邊界在某種程度上就是數(shù)學的邊界,,因為它的基礎(chǔ)在很大程度上是數(shù)學,。這張圖我用了好多次,就是說人工智能有三根支柱,,分別是摩爾定律,、大數(shù)據(jù)和數(shù)學模型,。摩爾定律,大家可能對它無感,。但是如果換一個方式來描述,,比如5年性能漲十倍,是不是震驚一些,?再比如,10年,,性能漲100倍,。拿蘋果手機來說,2017年蘋果手機出到第十代,,運行速度是2007年第一代的100倍,,第一代是跑不了任何程序的。正是因為性能的提升,,才使得我們原來做不到的事,,今天的人工智能做到了。 1946年人類第一臺計算機誕生了,,每秒5000次,,而且特別耗電。如果我們用1946年的技術(shù)能夠?qū)崿F(xiàn)一個阿爾法狗(2016年出現(xiàn)),,需要幾百萬個三峽發(fā)電站的發(fā)電量,。但現(xiàn)在,完全不需要,。這就是科技進步,,這就是摩爾定律。大數(shù)據(jù)今天不詳細講了,,但要記住沒有大數(shù)據(jù)就沒有人工智能,。說下數(shù)據(jù)模型,去年的圖靈獎頒給了三個做深度學習的科學家,,就是一個數(shù)據(jù)模型或者說是數(shù)學工具,。實際上現(xiàn)在谷歌已經(jīng)將其開源出來了,里面有高很多數(shù)據(jù),,買幾個GPU,,你也能達一個水平很高的人工智能系統(tǒng)。人工智能在過去大概60年里,,做的事情基本上就是把一個個我們看似不是數(shù)學的問題變成數(shù)學的問題。 例如人臉識別這件事,,本是一個推理的問題,,后來成了數(shù)學問題,,所以計算機能實現(xiàn)人臉識別了,顯得很智能,。其實就是特征提取,、模式匹配和機器學習的問題。 寫詩也一樣,,就像前面講的,,機器不過是把李白的詩進行了統(tǒng)計。包括語音識別,、機器翻譯都是統(tǒng)計和概率的問題,。 1.數(shù)學不是萬能的 我們回到問題的原點:可計算。按照剛才說的,,人工智能的邊界取決于數(shù)學的邊界,,那如果數(shù)學有邊界,人工智能一定有邊界,,這句話對不對,?邏輯上是對的。 那數(shù)學有沒有邊界,?這就要講計算機的老祖宗阿蘭·圖靈對這個問題的思考:計算和不可計算的邊界在哪里,? 他受到兩位導師的啟發(fā),分別是他的老板和19世紀末20世紀初最有名的數(shù)學家希爾伯特,。 左:希爾伯特19世紀末20世紀初最有名的數(shù)學家 中:圖靈的老板 右:圖靈 數(shù)學是完備的么,? 數(shù)學是一致的么? 數(shù)學是可驗證的么,? 他通過畫大數(shù)學這個圈子得出本身數(shù)學的圈子是可以越畫越大的,,但是畫特別大之后,就會產(chǎn)生一個不一致性,。最后有一個有名的數(shù)學家叫庫爾特·哥德爾證明了這個問題:你想一致就不完備,,要想完備就不一致,說明數(shù)學不是萬能的,。數(shù)學是可驗證的,,但很多時候驗證起來會很困難。比如說今天比特幣交易為什么這么貴,?就是因為驗證成本很高,。世界上其實有很多的問題不是數(shù)學問題,也就是說,,不可能世界上所有的問題都由人工智能來解決,。假設(shè)上海市所有道路上行駛的都是無人駕駛汽車,這個交通問題就變成了一個數(shù)學問題;但假設(shè)有一半不是無人駕駛汽車,,在一條單行道上,,人在無人駕駛汽車前面,并且站著不動了,,而人工智能第一定律是不能傷害人,。這時,如何解決這個問題,?里面的乘客可能會選擇打電話叫警察來“趕走”這個人,。這樣的解決方法恰恰說明這并不是一個數(shù)學問題。以及現(xiàn)在大家經(jīng)常討論的“一個條件優(yōu)秀的女孩子三番五次被渣男騙還相信他”的話題,,也不是數(shù)學問題,,所以靠數(shù)學是解決不了的。其實,,今天世界上的所有問題,是一個大白圈,,數(shù)學問題不過是一個小黃圈,,為了讓你們看得清楚一些,把黃圈畫大一些,,但實際差距要大得多得多,。這個問題搞清楚后,可能又有人問了,,數(shù)學問題是否都有解,?答案是否定的。1900年,,希爾伯特提出了23個數(shù)學問題(目前已經(jīng)被解決了17個,,但中國一個沒解決),第10問題涉及到可計算:對于大量的數(shù)學問題,,我有沒有辦法一下判斷它到底有沒有解,。對于任意多個未知數(shù)的整系數(shù)不定方程,要求給出一個可行的算法,,使得借助于它,,通過有限次運算,可以判定該方程有無整數(shù)解,。第一個方程式有沒有整數(shù)解,?有,勾股定律就是這樣一個方程式,。最早發(fā)現(xiàn)這個問題答案的,,是古埃及人和美索不達米亞;大概過了2000多年,畢達哥拉斯證明了這個定理,。 第二個呢,?它叫做費爾馬大定理,X?+Y?=Z?,,但他不知道如何證明這個定理,。直到1986年,英國一位很有名的數(shù)學家懷爾斯經(jīng)過多次證明后,,發(fā)現(xiàn)它無解,。 第三個方程式有沒有解呢?不知道,。很多時候不知道是最麻煩的答案,。因為凡事得先判斷有沒有解,才能知道下一步如何做,。假設(shè)我們想把一個現(xiàn)實生活中的問題,,變成數(shù)學問題,然后用人工智能解決,,這條路到底能不能走通,,首先得要有一個判斷,這個問題到底能不能變成數(shù)學問題,。所以,,希爾伯特第十問題其實蘊涵著哲學意義,它隱含了一個更為深刻的認識論問題:對于大部分數(shù)學問題,,我們能否找到答案的前提是,,能否判定答案是否存在! 到目前為止,,我們所解決的數(shù)學問題其實只是所有數(shù)學問題中很小的一部分,。但是,尚未找到答案和沒有答案是兩回事,,如果我們能證明一些問題本身就沒有答案呢,?最后,第十問題的解決過程頗具戲劇性,。它是在二戰(zhàn)之后才引起大家廣泛研究的,,這時大家才覺得這個問題重要。最初,,也就是20世紀60年代,,美國著名的女數(shù)學家朱莉?羅賓遜被認為是最可能解決這個難題的人。但是,,她離解決這個問題最終還是差幾步,,始終突破不了,。不過,數(shù)學界自古英雄出少年,,到了1970年,,一個不到20歲的年輕的俄羅斯數(shù)學家尤里·馬季亞謝維奇在大學本科畢業(yè)第二年就解決了這個問題。這個問題的解決,,是一個災(zāi)難,,也是一個福音。雖然數(shù)學問題只占所有問題的一小部分,,但在這一小部分中,,我甚至無法判斷這個問題有解還是無解。這是告訴人們:你無法判斷有沒有解,,就不知道該不該把生活中遇到的問題轉(zhuǎn)換成一個類似人工智能問題去解決,。所以這是一個災(zāi)難。但是,,對于有些應(yīng)用來講,,比如說加密,只需要驗證它有沒有答案就好了,,我不希望你把它給解決掉,,你解決了,我這個比特幣還怎么用,?所以也是一個福音。接下來我們就講驗證,,即便是驗證,,很多時候今天數(shù)學或者人工智能的問題也很難驗證答案。比如說IBM宣傳的很熱的看病機器人,,說它的水平已經(jīng)超過了醫(yī)生的平均水平,,治療疑難雜癥的技術(shù)已經(jīng)超過了專家。但這兩年不斷曝出負面的新聞,,它所開方子的效果無法驗證,,多次為患者提供不準確且不安全的建議。但是,,尚未有病人因沃森的失誤受到傷害,。這也是人工智能今天的一個邊界。不過這樣也很正常,,那些為數(shù)不多的有答案的問題中也只有少部分能通過計算解決,。 把剛才的數(shù)學問題放大一下,黃色部分是所有的數(shù)學問題,,中間只有一小部分的問題知道有解無解,,知道有無解之后才有一部分問題可以解。對于可以解決的問題,圖靈才給一個答案,。對于可以解決的數(shù)學問題怎么辦,?它設(shè)計了一套機械的數(shù)學模型,說按照這套機械來運轉(zhuǎn),,任何一個可以計算的問題都可以在這個機械上被計算,。所以,今天一個數(shù)學問題能不能通過計算來解決,,就看它在圖靈機上跑一遍能不能跑通,。當然,圖靈機跑的時間是無限的,,內(nèi)存也可以是無限大的,,而在我們實際生活中的計算機里是沒有這么大的內(nèi)存的。因此,,圖靈當時潛意識有一個基本上是沒法驗證,,但又基本認為是正確的想法,就是運算跟機械運動是相關(guān)的,,但是人的意識覺得思維是跟量子力學是相關(guān)的,。也就是說,我們腦子里的這些意識來自于很多不確定性,,帶有隨機性,,所以意識和計算是兩回事。對此,,圖靈有一個很清晰的判斷:計算能夠解決的問題,,是可計算問題的一個子集。哪怕在有解的問題里,,也只有一小部分是可計算,,但可計算不等于工程上可以實現(xiàn)。比如比特幣,,它是不可破解的嗎,?不是的,但你破解它可能要5萬年并且成本也非常非常高,。所以,,還要進行細分。在工程上可以實現(xiàn)的問題,,也只有一少部分是人工智能可以解決的,。最后一總結(jié),就是這么兩副圖,,所有的問題最后就剩這么點兒了,。有答案的問題再一一往下,,才是人工智能問題怎么解決。面對諾大的世界,,人工智能雖然出現(xiàn)了,,能夠幫我們解決問題,可能只是這么多,,但它也已經(jīng)非常厲害了,。既然人工智解決不了的問題這么多,,人類為什么會高估人工智能的水平呢?這涉及到一個認知的問題,,人類的認知過程如圖所示:從圖中可以看出,,人的認知邊界是隨著我們所學知識的增加不斷擴大的,但是到大學之后,,會有一個方向性,,即朝著某個專業(yè)、某個方向去發(fā)展,。比如說寫作水平,,理工科的學生到大學后寫作水平基本就那樣了,但他很可能會成為一個領(lǐng)域的專家,。綠色是大學時的認知邊界,,但是如果你讀博士的話,認知邊界就要突破這個綠色部分,;否則是無法畢業(yè)的,,當然,這是對專家的要求,。遺憾的是,大部分專業(yè)人士和專家眼里的世界是這樣的:他自己有一個角度朝著某一點看,,覺得小時候認知是藍色部分,,中學是灰色部分,大學是綠色部分,,博士階段是紅色部分,。殊不知,經(jīng)過多年努力創(chuàng)造新知,,卻只看到了世界的一個角度,。知識邊界在空白部分,我們折騰來折騰去只解決了這么一點點,。我們以為往前走了一步,,似乎就能解決世界上各種問題了,,但是真實的邊界很大的。我們今天對待人工智能的看法也是一樣的,,這就是我們今天對人工智能態(tài)度爆棚的原因,。人最重要的是思想,一個人如果沒有了思想,,那不如讓機器取而代之,,成本也更低一些。實際上,,我很喜歡阿蘭·圖靈的這句話:“我們僅能前瞻不遠,,卻有很多事情還要做?!?/section>所以,,今天對于人工智能來講,它并不是說發(fā)展得太快,,而是說我們可能用得還不夠好,。在這個過程中,我們其實是在做兩件事:第一,,我們把一個個原來看似不是人工智能的問題變成人工智能的問題,,前提是它的確是個數(shù)學問題。所以,,是人工智能的問題用人工智能解決,,不是的就不要用。上帝的歸上帝,,凱撒的歸凱撒,。第二,在未來的世界,,我們?nèi)撕我詾槿??其實,這個世界上還有很多問題特別需要由人來解決,,而非人工智能,。比如數(shù)據(jù)資產(chǎn)、比如政府工作等等,。無論你從事什么,,人一定要是找到自己的立足點,因為人工智能之外,,還有很多事情屬于人的世界,。
|