那些節(jié)點(diǎn)性的知識,、碎片性的知識以一種我們不知道的方式化合起來,形成一種全新的知識,。 前段時(shí)間看到一條新聞,,說的是谷歌的機(jī)器翻譯取得了顛覆性的進(jìn)展,據(jù)說,,它的機(jī)器翻譯的準(zhǔn)確度已經(jīng)可以和人工翻譯媲美了,,這也意味著人工智能的翻譯和人工翻譯這二者的水平已經(jīng)相當(dāng)接近了。 可能很多朋友沒有看到這條新聞,,也可能一些朋友看到這條新聞的對它一掠而過,。也許是我個(gè)人的原因,我對這條新聞特別的注意,,因?yàn)槲宜较聦Υ擞幸粋€(gè)尺度——機(jī)器翻譯的成熟度,,其實(shí)就標(biāo)志著人工智能的成熟度。 我記得大概是一年以前,,我和凱文·凱利——也就是我們通常說的KK,,在優(yōu)酷做對話的時(shí)候,我向他問到過這個(gè)問題,。我問:“我們現(xiàn)在的工作當(dāng)中,,馬上面臨失業(yè)的工作有哪些?”由于當(dāng)時(shí)現(xiàn)場有同聲傳譯的人,,他說,,也許做同聲傳譯的人將加入最早失業(yè)的隊(duì)伍里去。 當(dāng)時(shí)我聽了以后非常震驚,。我一直非常敬佩做同聲傳譯的人,,他們能夠完全不假思索的將一種語言從耳朵里聽進(jìn)去,再將另一種語言從嘴里說出來,。這樣一種技能,,我覺得是一種挑戰(zhàn)人語言能力和智力的工作,而KK竟然說他們是最早會失業(yè)的人群,。 KK這樣認(rèn)為的理由很簡單,。翻譯技能是一種通過不斷地積累,、修正、試錯(cuò),,最后逐漸完善的一種工作,,而今天的計(jì)算機(jī)已經(jīng)遠(yuǎn)不是單機(jī)計(jì)算的方式,現(xiàn)在的計(jì)算機(jī)是是網(wǎng)絡(luò)計(jì)算的,,大量信息,、大量知識每時(shí)每刻匯入到云端,將每一個(gè)節(jié)點(diǎn)上獲得的認(rèn)知混入到共享的云里,。這個(gè)時(shí)候人類的智慧,、人類的知識、人類的智能就會形成一種類似于“拔一毛而利天下”的一種功能,。 我們每一個(gè)人的聰明過去都只屬于我們自己,,很少每時(shí)每刻把這種智能混入到一個(gè)人類共有的大腦當(dāng)中。今天借助于云端的計(jì)算,,我們不自覺地將我們每個(gè)人通過學(xué)習(xí)獲得的認(rèn)知都可以混入到人類共有的大腦里,。而且匯聚的知識的數(shù)量龐大,并隨著數(shù)量的數(shù)據(jù)的增大而形成一種知識的涌現(xiàn),。 當(dāng)單個(gè)節(jié)點(diǎn)的知識,、個(gè)體的知識不斷的匯入到人類共有的大腦的時(shí)候,一方面數(shù)據(jù)每時(shí)每刻都在增加,,而且數(shù)據(jù)的增加符合梅特卡夫定律——就是說當(dāng)匯聚的量越大的時(shí)候,,那些節(jié)點(diǎn)性的知識、碎片性的知識以一種我們不知道的方式化合起來,,形成一種全新的知識,。 這樣一種形成方式我們把它稱之為“涌現(xiàn)”,就是低智能,、低能量的個(gè)體匯聚起來形成一種高智能的,、高能量的超級有機(jī)體。比如螞蟻,,它是一種低智能的動物,,但是很多的螞蟻匯聚到一起,他們會形成一種遠(yuǎn)超于他們個(gè)體智能的集體智能,,包括蜜蜂,、白蟻、蝙蝠都有這種由于巨量的匯聚而形成的涌現(xiàn),。 所以,,將來人類知識的增長、知識的進(jìn)化一旦不是由單個(gè)個(gè)體來承擔(dān),,而是人類所有個(gè)體都匯聚成一個(gè)整體的時(shí)候,,這種知識的進(jìn)化速度比以前任何物種的進(jìn)化速度都要快得多,。所以他認(rèn)定,,將來,,在很快時(shí)間內(nèi)——五年之內(nèi),機(jī)器翻譯就有可能替代人工翻譯,。 剛剛說到的這條新聞似乎讓我感受到,,人工智能對于人的智能的挑戰(zhàn)已經(jīng)漸漸接近人的腳步聲。安迪.格魯夫說,,很多真正具有挑戰(zhàn)性的東西,、壞消息都是踏著貓步而來的。貓走路是沒有聲音的,,除非聽覺極其敏感的人——比如說盲人能聽到貓過來的聲音,,我們普通的人是感受不到這種聲音的。 事實(shí)上,,在很多產(chǎn)業(yè)里,,形成顛覆性創(chuàng)新的那些技術(shù)往往都是在人的眼皮子底下在進(jìn)化,而它的最初形態(tài)看上去是非常簡陋的,。比如說數(shù)碼相機(jī)剛剛出來的時(shí)候甚至只有10萬像素,。這個(gè)行業(yè)用了很長的時(shí)間把10萬像素提高到100萬像素——我還真見過100萬像素的數(shù)碼相機(jī),大家可以想象100萬像素的數(shù)碼相機(jī)拍出來的清晰度能有多高,。 現(xiàn)在,,我能在電腦里找到的像素最低的照片是200萬像素的諾基亞手機(jī)拍出來的。在今天看來,,這樣的照片如果不是因?yàn)橛袣v史價(jià)值,,我真的想馬上把它刪掉,質(zhì)量非常低,。從10萬像素到100萬像素花了很長時(shí)間,,從100萬像素到200萬像素還是經(jīng)歷了很慢的進(jìn)程,200萬像素到300萬像素的速度就漸漸加快,。 當(dāng)數(shù)碼相機(jī)到500萬像素的時(shí)候,,它已經(jīng)讓人感受到,它不再是一個(gè)玩具了,,在某種程度上它是可以派上正當(dāng)用場的,。當(dāng)我們意識到它已經(jīng)開始成熟的時(shí)候,它飛快的從500萬像素成長到800萬像素,,從800萬像素到1000萬,、1500萬,現(xiàn)在很多手機(jī)的像素都達(dá)到1700萬,,甚至超過2000萬,。記得當(dāng)我看到那種1500萬單反相機(jī)拍出的照片的時(shí)候,,我覺得已經(jīng)是到極致了,但是今天我們看來都是稀松平常的,。 所以很多行業(yè),、很多產(chǎn)品,當(dāng)他們剛剛問世的時(shí)候,,都是非常幼稚,、非常簡陋,讓你覺得他就跟玩具一樣,,使用這樣的工具如同是兒戲,,但是技術(shù)就是在我們不以為然當(dāng)中以一種指數(shù)級的速度在往前發(fā)展。一旦技術(shù)讓我們刮目相看,,讓人們覺得已經(jīng)很成熟甚至近乎完美的時(shí)候,,不僅僅表示現(xiàn)有的產(chǎn)品成熟,而且表明它正在以更高的速度往前發(fā)展,。 所以2016年滿世界都在談?wù)撊斯ぶ悄?,但是人工智能至今還沒有拿出讓人覺得肅然起敬、讓人刮目相看的產(chǎn)品,,我們很多人對其聽之任之,,覺得它要真的成氣候是猴年馬月的事情。但是,,成熟技術(shù)到來的方式,,和我們有的時(shí)候在一個(gè)車站等車等了半個(gè)小時(shí)車還不來的時(shí)候是非常相似的——我們等得非常疲憊,干脆到別的地方散散步,、溜達(dá)溜達(dá)再回來的時(shí)候,,發(fā)現(xiàn)車已經(jīng)早就走了。 為什么谷歌機(jī)器翻譯的成就特別值得注意,?這是因?yàn)樵谌斯ぶ悄茴I(lǐng)域有幾個(gè)層級,,而機(jī)器翻譯已經(jīng)是在最深的層級上了。一般來說,,所謂智能首先在識別,,識別各種各樣的信號,最初級的識別是語音識別,,所以我們現(xiàn)在很多人已經(jīng)開始在用一些語音輸入的軟件,,有的時(shí)候你覺得還可以用,有的時(shí)候會讓你失望得無言以對,。 有一次我嘗試用語音輸入來寫一篇文章,,后來發(fā)現(xiàn)不行,校改需要的時(shí)間往往比我從一開始打字需要的時(shí)間還要長,因?yàn)橐屑?xì)的看那些錯(cuò)誤,。剛開始我很自然的認(rèn)為是因?yàn)槲业陌l(fā)音不標(biāo)準(zhǔn)導(dǎo)致語音識別錯(cuò)誤,,后來我做了一個(gè)實(shí)驗(yàn),我用中央人民廣播電臺的播音員讀的話對著手機(jī),,結(jié)果還是一大堆錯(cuò)誤,,這顯然不僅僅是語音不標(biāo)準(zhǔn)的問題。 比語音識別更難的是圖像識別,。今年6月份,,我到硅谷的時(shí)候去參觀吳韌博士的新大腦公司,。我們進(jìn)去的時(shí)候門口有攝像頭,,進(jìn)去的時(shí)候已經(jīng)被錄像了,但是那時(shí)候不知道,。后來我到了他的辦公室,,他的助理問我們要名片,然后在電腦里輸入了什么東西,,把電腦轉(zhuǎn)過來問:這是您的照片吧,? 我一看,說:“是,?!蹦鞘撬鶕?jù)名字在網(wǎng)上搜到一張差不多是十年前的照片。然后他照片馬上輸入到庫里,,不到一分鐘,,他們就在海量的錄像庫里找到我剛才進(jìn)來的那段錄像,問:“這是您吧,?” 我說這是我,,這種人臉識別要比語音識別難度更大。 但是更難的是語義識別,。每一種語言識別都有它的模糊性,,它的每一個(gè)詞都有其雙關(guān)性,對語境的強(qiáng)依賴等等,。以漢語為例,,在老舍的《茶館》里不是有那么一段話嗎——有兩個(gè)壞家伙來敲詐王掌柜的時(shí)候有一段很著名的對話。 “王掌柜的,,您那天說的那點(diǎn)意思,,什么時(shí)候意思意思?” “您說的那點(diǎn)意思得多少意思???” “嗨,王掌柜您是明白人,您還能把那點(diǎn)意思搞得沒意思嗎,?” 如果這段話要讓電腦來識別真是太難了,,如果想讓外國人剛學(xué)漢語的時(shí)候說這一段話,會讓他抓狂,。 再比如野蠻女友對她的男友說的第一句話——“我現(xiàn)在出發(fā)了,,你要是到了你就等著?!钡诙涫恰拔乙堑搅四氵€沒到,,你就等著!”第三句話是——“你要是到了你不等著,,你就等著?。 ?/p> 這三句話要是讓電腦來識別,,真的會抓狂,。要是有一天電腦不僅能明白剛才第一段里的各種每一個(gè)“意思”的意思,明白第二段對話的每一個(gè)“等著”的真實(shí)含義,,那人工智能真的是到了相當(dāng)成熟的地步,。 而今天的谷歌翻譯取得的這個(gè)成果還只是階段性的,研究人員讓精通兩門語言的人——比如說讓母語是西班牙語也精通英語的人,,讓他來評判機(jī)器將兩種語言互譯的時(shí)候是否準(zhǔn)確,。與此同時(shí),再找精通兩種語言的人來進(jìn)行翻譯,,最后按對照的結(jié)果按6分算,,機(jī)器的得分是5.53分,人的得分是5.55分,,得分已經(jīng)是相當(dāng)接近了,。 但是大家要注意,人的進(jìn)化速度,、人的智力增長速度是很慢的,,甚至在很多時(shí)候是在逐漸退化的。比如說你25歲的時(shí)候腦子很好用,,到30歲的時(shí)候腦子就不一定好用,,到40、50歲就逐漸衰退了,。 而電腦由于處于云計(jì)算的時(shí)代,、一個(gè)大數(shù)據(jù)的時(shí)代,我們最聰明的時(shí)刻都會匯聚到云里去,,這個(gè)云相當(dāng)于人類共有的大腦,。人的這些聰明已經(jīng)被匯聚到里面,即使這個(gè)人得了阿茲海默綜合征,但是你的聰明已經(jīng)被匯聚到人類共有的大腦,。 關(guān)鍵是這些碎片認(rèn)知以我們所不知道的方式迅速的匯集,,就像在物理世界中,水蒸氣蒸發(fā)到空中變成云,,一朵朵小云又變成更大的云,,更大的云和更大的云之間又會匯聚在一起,這個(gè)過程是非??植赖?。 換句話說,機(jī)器智力進(jìn)化的速度是遠(yuǎn)遠(yuǎn)超乎人的,??赡茉趲啄旰蟮哪骋惶欤瑱C(jī)器翻譯突然就成熟了,。原來我們出國,,不懂外語是最讓我們自卑,最讓我們畏手畏腳的,,而以后出國時(shí)候的第一焦慮就不存在了。在這種情況下,,人類的文明將會出現(xiàn)一種什么樣的結(jié)果,,我們今天還不可預(yù)測。 當(dāng)語言的障礙被超越,,甚至機(jī)器將比人的翻譯還要準(zhǔn)確,,不僅能解讀你的語言,甚至根據(jù)每個(gè)人的性格,、語言習(xí)慣,,過去說話和寫作方式,像偵探一樣解讀你話里背后的意思,,然后以一種你自己都感到心驚膽戰(zhàn)的方式把它解讀出來之后,,讓我們感到“懵圈”的將不僅僅是翻譯們要失業(yè)的問題,它真的會帶來我們今天還不能清晰想象的一種文明的巨變,,真正稱得上會是一個(gè)數(shù)字化文藝復(fù)興時(shí)代,。 |
|