>科學(xué)范式和科學(xué)革命
我先給你介紹科學(xué)哲學(xué)史上的一個重要人物——托馬斯·庫恩(Thomas Kuhn, 1922—1996),。大約 60 多年前,美國人庫恩提出了一個重要的科學(xué)哲學(xué)概念,,可以簡稱為科學(xué)范式和科學(xué)革命,。
庫恩發(fā)現(xiàn)科學(xué)與其他學(xué)問,比如文學(xué),、藝術(shù),、宗教、哲學(xué),、道德,、法律、政治等有一個很大的不同,??茖W(xué)的特殊之處就在于:全世界做科研的人都用數(shù)學(xué)語言做橋梁,采用同樣的一套標(biāo)準(zhǔn)來做研究或者判定理論的好壞,,而且這套標(biāo)準(zhǔn)隨著時間的推移,,越是接近現(xiàn)代,就越趨同,。這就是所謂的科學(xué)范式,。
托馬斯·庫恩(Thomas Kuhn, 1922—1996)
"Thomas-kuhn-portrait" by Davi.trip is licensed under CC BY-SA 4.0.
庫恩還發(fā)現(xiàn),科學(xué)的發(fā)展并不是一種平滑的線性發(fā)展模式,,而是會像走臺階一樣,,隔一個階段上一個臺階,這種情況就被庫恩叫做“范式轉(zhuǎn)換”,。后來,,他寫書的時候,就用了一個更加有沖擊力的詞——科學(xué)革命,。他想表達(dá)的是,,科學(xué)的發(fā)展每隔一個時期,就會迎來一場革命,,很多舊有的范式會被新的范式所取代,,每當(dāng)革命之后,科學(xué)又會取得新一輪突飛猛進(jìn)的發(fā)展,。
說實話,,以前我對庫恩的這套理論并不是十分認(rèn)同。我認(rèn)為,總結(jié)過去,,不代表就能預(yù)測未來?,F(xiàn)代的科研活動已經(jīng)發(fā)展得相當(dāng)成熟,科學(xué)方法也差不多都定型,,我實在想不出還能有什么可以取代現(xiàn)代科學(xué)方法,,簡言之就是“理論推理+系統(tǒng)實驗”這一套方法。
> 未來范式或?qū)⒁I(lǐng)科學(xué)革命 <
但是最近這一年以來,,看到 GPT 這個人工智能模型的快速迭代發(fā)展,,我突然發(fā)現(xiàn),庫恩所說的科學(xué)革命,,很可能就在不遠(yuǎn)的將來,,再次到來。人類社會又將迎來一次史無前例的深刻變革,,這場變革的劇烈程度,,很可能不亞于工業(yè)革命對社會的沖擊。
為了讓你感受到最近一段時間我內(nèi)心受到的那種沖擊和震撼,,我需要一層層展開跟你講,。為了敘述的方便,我把目前最成熟的科學(xué)研究范式稱為“現(xiàn)代范式”,,而這一場科學(xué)革命后的范式稱為“未來范式”,。
現(xiàn)代范式遵循這樣的過程:不論我們做什么樣的科研項目,總是先要找到一套指導(dǎo)性的理論,,這個理論未必成熟,,也不一定完全正確,但總是先要有理論,。然后,,根據(jù)這套理論做出一些假設(shè)或者猜想,然后再設(shè)計實驗來證實或者證偽,,如此循環(huán)往復(fù),,直到找到滿意的答案為止。
我舉個例子,。用現(xiàn)代范式來研發(fā)一款靶向新藥,,科學(xué)家們要怎么做呢?大概可以分成這樣幾個步驟:
【 第一步:發(fā)現(xiàn)新靶點 】
所謂的靶點,,即藥物會攻擊的點,,比如癌細(xì)胞的某個位置。怎么找到它們呢,?就要通過現(xiàn)有的理論,,比如生物信息學(xué),、分子生物學(xué)等,找出可能與某種疾病相關(guān)的蛋白質(zhì)分子上的靶點,。
【 第二步:藥物設(shè)計 】
在現(xiàn)有理論的指導(dǎo)下,,設(shè)計出一種有可能成功攻擊靶點的分子結(jié)構(gòu)。
【 第三步:合成 】
通過化學(xué)方法合成出想要的分子結(jié)構(gòu),。
【 第四步:實驗 】
包括動物實驗,、臨床試驗等。
實驗有可能成功也有可能失敗,,如果失敗就跳回第一步,,如此循環(huán)往復(fù),花上個十多年找到一款新藥就已經(jīng)非常幸運了,。但是,當(dāng) AI 出現(xiàn)后,,尤其是用神經(jīng)網(wǎng)絡(luò)構(gòu)建的機(jī)器學(xué)習(xí)模型出現(xiàn)后,,這種現(xiàn)代范式開始面臨挑戰(zhàn)。
第一個讓科學(xué)界感到震驚的例子出現(xiàn)在 2020 年,,當(dāng)時麻省理工學(xué)院的科研團(tuán)隊研發(fā)出了一種新的抗生素,,叫 Halicin。稍微了解一些抗生素研發(fā)歷史的人都知道,,要找到一種新型的有效的抗生素是極其困難的,。但是,令科學(xué)界震驚的并不是這種抗生素的效果,,它的效果當(dāng)然也很不錯,,真正令科學(xué)家們震驚的是 Halicin 的研發(fā)過程,可以說,,它已經(jīng)半跳出了現(xiàn)代范式,。
Halicin(第一行)阻止了大腸桿菌中抗生素的耐藥性,而環(huán)丙沙星(第二行)則沒有,。
Image: courtesy of the Collins Lab at MIT
我們來看一下這次研究人員是怎么做的,。
【 第一步:AI 學(xué)習(xí) 】
他們先讓 AI 去學(xué)習(xí)大約 2000 個分子結(jié)構(gòu),這些分子結(jié)構(gòu)和作用都是已知的,,它們有的無效,,有的有效。
【 第二步:總結(jié)規(guī)律 】
通過神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí),,AI 自己會去總結(jié)這些分子結(jié)構(gòu)是不是有效的規(guī)律,。
但是請你注意,AI 總結(jié)出來的規(guī)律是無法用我們?nèi)祟惉F(xiàn)有的自然語言描述的,。AI 并不會總結(jié)出一套我們?nèi)丝梢宰x懂的公式,,只要套用這個公式就會知道,哪個分子結(jié)構(gòu)有效,哪個無效,。AI 有它自己的一套連開發(fā)者也搞不懂到底是怎么運作的判定規(guī)則,。對于人類來說,AI 就是個黑盒,,我們只知道,,給它一個輸入值,它能返回一個輸出值,,至于過程是怎樣的,,對不起,人類語言無法描述,。
【 第三步:打分 】
有了這個 AI 之后,,研究者把另外 61000 個已知的可能會有效的分子結(jié)構(gòu)一個個輸進(jìn)去,讓 AI 按照有效性,、副作用等,,對這些分子結(jié)構(gòu)進(jìn)行打分,得分最高的那個分子就是 Halicin,。
【 第四步:實驗 】
最后,,研究者們再用 Halicin 做動物實驗和人體臨床試驗,發(fā)現(xiàn)它的效果果然非常好,。一款新的抗生素就這樣被研發(fā)出來,。
你發(fā)現(xiàn)沒,這是一種非常不同于現(xiàn)代范式的研究方法,。假如按照現(xiàn)代范式,,我們只能老老實實地做實驗去測試這 61000 種分子結(jié)構(gòu),就好像屠呦呦當(dāng)年尋找有效的抗瘧藥物一樣,,這需要花費的時間和金錢成本都極其巨大,。
聽完這個例子,我不知道你有什么樣的感想,,但我受到的震撼是巨大的,。它讓我突然意識到,AI 可以發(fā)現(xiàn)人不能理解的規(guī)律,,但那又的的確確是一種規(guī)律,,因為它真的在 61000 種分子中找到了唯一一個有效的分子,這肯定不能用運氣來解釋,。
> 人腦已無法理解黑盒化的 AI <
黃金時代的科學(xué)家們有一種理想,,用數(shù)學(xué)模型去總結(jié)或者模擬這個世界上的所有規(guī)律。但是,,現(xiàn)在 AI 告訴我們,,至少它們掌握了一種不是用一個或一組數(shù)學(xué)公式,,而是用一套通用的算法加海量的參數(shù)來描繪的自然規(guī)律。換句話說,,我們?nèi)祟惱斫庾匀灰?guī)律是一一對應(yīng)的,,一個規(guī)則對應(yīng)一個數(shù)學(xué)模型,而 AI 則是以不變應(yīng)萬變,。它只有一個數(shù)學(xué)模型(假如神經(jīng)網(wǎng)絡(luò)算法也看成是一個數(shù)學(xué)模型的話),,這個數(shù)學(xué)模型似乎可以描述所有的自然規(guī)律。但人類卻無法理解它到底是怎么找到答案的,。這套算法只有 AI 能用,,人腦用不了。
現(xiàn)在用戶量已經(jīng)突破 1 億,、人人都在談?wù)摰?ChatGPT,,其實只是 GPT-3.5 這個 AI 模型的一個應(yīng)用而已。它的參數(shù)已經(jīng)突破 1750 億個,,相當(dāng)于銀河系中恒星的數(shù)量,。它是一個人類的大腦永遠(yuǎn)也無法真正理解的“小宇宙”。
剛才說的 Halicin 只是用 AI 做新藥研發(fā)的一個例子,。AI 能做的科研還遠(yuǎn)遠(yuǎn)不止這些。比如說,,還可以用 AI 來預(yù)測新材料的性能,,用 AI 來解讀基因的功能等等。
所有這些 AI 做科研的模式,,都已經(jīng)不再是現(xiàn)代范式,,至少不完全是現(xiàn)代范式了。它們的一個共同特征就是:AI 相對于人類科學(xué)家來說,,是一個黑盒,,我們無法理解黑盒內(nèi)的原理,或者說,,黑盒內(nèi)的原理是一種只有 AI 能理解的形式,。人類大腦的生理結(jié)構(gòu)決定了,這種形式我們無法真正理解,。這并不是我的過度夸張,,事實上,OpenAI 和 ChatGPT 的開發(fā)者也搞不清 ChatGPT 為什么能表現(xiàn)成現(xiàn)在這樣子,。
是不是有些細(xì)思極恐,?說實話,講到這里,,我的背脊已經(jīng)有一絲絲涼意,。但這還沒有完,,更令我感到震驚的還在后面。
> OpenAI 的終極目標(biāo) <
2023 年 2 月 24 日,,ChatGPT 的開發(fā)公司 OpenAI 在官網(wǎng)上發(fā)布了一則聲明,,英文標(biāo)題是 Planning for AGI and Beyond。你可能不知道 AGI 是什么意思,,它是 Artificial General Intelligence 的首字母縮寫,,翻譯成中文就是“通用型人工智能”或者“強人工智能”。所以,,那則聲明的標(biāo)題可以翻譯為《強人工智能及超人工智能的路線圖》,。我們可以這么理解 AGI :只要是人類用智力能完成的任務(wù),AGI 就能完成,。過去,,我們的 AI 都是專用型的,翻譯的管翻譯,,畫圖的管畫圖,,人臉識別的管人臉識別。但 AGI 將是通用型的,,它什么都能干,,一個算法加上幾千億個參數(shù),就能完成一切通過智力能完成的任務(wù),,甚至是超越人類智力的任務(wù),。
這則聲明寫得很長。說實話,,當(dāng)我讀完這則聲明全文,,我產(chǎn)生了一種強烈的不真實感。我要揉揉眼睛才敢相信這真的是 OpenAI 的官方聲明,,而不是某個科幻小說中的選段,。這則幾千字的聲明分成兩部分,第一部分叫“短期來看”,,這部分內(nèi)容可以總結(jié)為一句話:
"隨著系統(tǒng)越來越接近 AGI,,我們對模型的創(chuàng)建和部署也越來越謹(jǐn)慎。"
第二部分叫“長遠(yuǎn)來看”,,讓我擦汗和產(chǎn)生不真實感的正是這一部分,,我給你選讀其中的幾段,你來體會一下:
“
我們認(rèn)為,,人類的未來應(yīng)該由人類自己決定,,與公眾分享有關(guān) AI 進(jìn)步的信息至關(guān)重要。所有建立 AGI 的嘗試都應(yīng)該受到嚴(yán)格審查,,這方面的重大決策應(yīng)當(dāng)接受公眾咨詢,。
第一個 AGI 不過是人工智能連續(xù)發(fā)展過程中的一個點,。我們認(rèn)為,AGI 依然會繼續(xù)進(jìn)化,,速度與過去十年相同,。如果真如所料,世界可能會變得截然不同,,這其中也隱藏著巨大的風(fēng)險,。因為一個立場錯位的超級智能可能會對世界造成嚴(yán)重的傷害,想象一下一個果敢的超級智能領(lǐng)導(dǎo)的獨裁政權(quán)帶來的后果吧,。
人工智能加速科學(xué)進(jìn)步的能力是一個值得深思的特例,,它的影響力或許超過其他所有事物之和。AGI 有足夠的能力來加速自己的進(jìn)程,,這可能導(dǎo)致世界以驚人的速度發(fā)生重大變化(即使轉(zhuǎn)變并沒有如預(yù)料的那么快,,但我們預(yù)計它會在最后階段迅速發(fā)生)。我們認(rèn)為,,開始得慢一些更容易守護(hù)住安全,,并且通過協(xié)調(diào),努力讓 AGI 在關(guān)鍵時刻減速發(fā)展也很重要,。即使我們的世界不需要就它的定位去解決技術(shù)問題,,慢速發(fā)展也很重要,因為需要留給社會足夠的時間去適應(yīng),。
成功過渡到一個擁有超級智能的世界,,可能是人類歷史上最重要、最有前途,、同時也是最可怕的項目。成功絕非一蹴而就,,賭注,,即天堂還是地獄,有望將我們所有人團(tuán)結(jié)起來,。
一個人類繁榮到我們都無法想象的世界,,或許不再是天方夜譚,因為我們?yōu)槭澜缣峁┝艘粋€與之匹配的 AGI,。
”
不知你看完后什么感覺,?OpenAI 竟然要刻意減慢強人工智能的研發(fā)速度。這可能是歷史上第一次有科技公司認(rèn)為自己的研發(fā)進(jìn)度太快了,,需要人為減慢,,否則人類社會將猝不及防。
> 你必須學(xué)會與 AGI 溝通 <
我不知道你有沒有看過或者聽過我 2020 年寫的一部科幻小說《哪》,。在那部小說中,,我描寫了一個在云中覺醒的人工智能,。寫小說的時候,我認(rèn)為這是一個遠(yuǎn)未來的科幻小說,。哪里想的到,,僅僅過去了3 年,這就已經(jīng)不再是科幻,,而是正在發(fā)生中的事實了,。就像崔健在一首歌中唱的:不是我不明白,這世界變化快,。
有消息說,,OpenAI 的下一代模型 GPT-4 已經(jīng)訓(xùn)練完成,現(xiàn)在正在訓(xùn)練的是 GPT-5,,它或許就是人類歷史上的第一個 AGI,,即第一個真正意義上能通過圖靈測試的 AI。我的天哪,,未來真的已來,。
現(xiàn)在,我們已經(jīng)幾乎可以肯定,,一個智力遠(yuǎn)勝于人類的超級智能體在技術(shù)上已經(jīng)不再是障礙,,它唯一的障礙是法律和倫理。
在不遠(yuǎn)的未來,,科學(xué)的現(xiàn)代范式將成為低效的代名詞,。未來范式的科研將會變成什么樣子?我的想法是,,一個材料科學(xué)家的研發(fā)過程很可能變成這樣:第一步,,科學(xué)家向 AGI 詳細(xì)描述自己需要的材料的各種性質(zhì),比如密度,、導(dǎo)電性,、導(dǎo)熱性、是否透明等等,。這種描述本身也需要專業(yè)知識,,否則很可能你描述的材料要么已經(jīng)存在,要么根本不可能制造出來,。第二步,,AGI 會告訴你什么樣的分子結(jié)構(gòu)或者混合物能達(dá)成目標(biāo)。第三步,,科學(xué)家與 AGI 進(jìn)一步探討制造工藝,,不斷地修正需求,降低制造成本,。第四步,,AGI 設(shè)計出最優(yōu)化的量產(chǎn)方案,。第五步,科學(xué)家按照 AGI 給出的方案去找工廠實現(xiàn),。
在這個過程中,,科學(xué)家更像是一個魔法師,科研的過程有點像是一種文字游戲,。網(wǎng)上現(xiàn)在把 AI 畫師就稱為“魔法師”,,把輸入的過程叫做“念咒”,說實話,,還挺形象的,。我現(xiàn)在不知道什么樣的人可以更好地掌握未來范式,我只知道,,問出一個好問題或者說掌握與 AGI 溝通的能力,,才是最重要的。這將是一場摧枯拉朽式的科學(xué)革命,。
> AI 給你的最大驚喜是什么,?<
當(dāng)這場革命來臨時,世界的科技,、政治,、經(jīng)濟(jì)格局很可能面臨重新洗牌。舉個例子,,人類目前所能制造的最復(fù)雜的機(jī)器是用來生產(chǎn)芯片的光刻機(jī),。一臺荷蘭 ASML 公司生產(chǎn)的最先進(jìn)的極紫外光刻機(jī),有幾十萬個零部件,,依賴全球 300 多個供應(yīng)商提供零部件,。這個世界上沒有任何一個國家能完全靠自己制造出一臺光刻機(jī),因為它實在是太復(fù)雜了,。
ASML 最先進(jìn)的極紫外光刻機(jī)
Source: IMEC
但未來有一天,,你對著 AGI 說一句話:請幫我設(shè)計一臺極紫外光刻機(jī),要用盡可能少的零部件,,而且你需要寫出每一個零部件的詳細(xì)制造工藝,畫出所有用于生產(chǎn)零部件的機(jī)器的設(shè)計圖,。幾天之后,,AGI 真的設(shè)計出了一臺全新原理的極紫外光刻機(jī)。所需要的零部件是人類設(shè)計的光刻機(jī)的十分之一,,并且每一個零部件的詳細(xì)制造工藝都寫得清清楚楚,,并且它還告訴你,這臺機(jī)器生產(chǎn)出的芯片的所有的性能指標(biāo),,都將超過現(xiàn)有最好的芯片,。
像這樣的超人工智能一旦出現(xiàn),,我難以想象人類的社會形態(tài)將發(fā)生怎樣的巨變。這意味著,,AI 真的可以完成從軟件到硬件的自我進(jìn)化,,成為神一樣的存在。第一個擁有這種超級人工智能的組織,,會迅速獲得別人無法匹敵,,可以用降維打擊來形容的能力。而從 OpenAI 的這則最新聲明來看,,超人工智能的技術(shù)障礙似乎已經(jīng)被掃清了,。
聽到這里,我很想知道你對強人工智能和超人工智能的看法,。我想請你注意一點,,你要思考的已經(jīng)不再是不知道能不能實現(xiàn)的科幻,而是正在向我們走來的未來,。
最后再說點兒題外話,,這是我第一次嘗試在 ChatGPT 的幫助下來完成的文稿。在我動筆前,,我只是看到這樣一句話:2020 年,,麻省理工的科研團(tuán)隊利用人工智能研發(fā)出了一種新的抗生素 Halicin。
然后,,我開始連續(xù)向 ChatGPT 提問:
- 麻省理工宣布發(fā)現(xiàn)了一種新的抗生素,,叫Halicin。這件事情你知道嗎,?
- 還有沒有類似的例子,,靠 AI 幫助完成科研?
- 我需要一個像 Halicin 一樣非常具體的例子,。
- 你剛才說研究人員可以利用機(jī)器學(xué)習(xí)算法來分析大規(guī)模的基因數(shù)據(jù),,以識別與特定疾病相關(guān)的基因突變和表達(dá)模式。這種方法在癌癥研究等領(lǐng)域有著重要的應(yīng)用,。這個有具體的案例嗎,?
- 現(xiàn)代新藥研發(fā)一般有哪些步驟?
- OpenAI 自己怎么看待 AI 的未來?
- AGI 何時會出現(xiàn),?
- 你知道 OpenAI 的 AGI 計劃嗎,?
- 請幫我全文翻譯 Planning for AGI and beyond 這篇文章。
- 荷蘭 ASML 的極紫外光刻機(jī)有多少個零部件,?依賴多少個供應(yīng)商,?
上面這些問題并不是我全部的提問,只是我選取的最重要的幾個。我基本上用中英文雙語都問了一遍,,很有意思的是,,有些問題的中英文回答甚至是截然相反的。比如某一種抗癌新藥,,中文版說這是通過 AI 研發(fā)出的,,但英文版說不是。ChatGPT 目前一本正經(jīng)胡說八道的本事是非常強悍的,,尤其是用中文回答時?,F(xiàn)在,我還不能相信它給出的任何一個答案,,只能把它看成是一個參考和線索,。真正要寫進(jìn)文章中,還得通過傳統(tǒng)方法去核實,。但即便這樣,,它依然大大提高了我的寫作效率。這篇 5000 字左右的文章,,我差不多只用了一個晚上就完成,,而在過去,同樣的選題,,我大概需要 1 天 1 夜的時間才能完成,。ChatGPT 帶給我的驚喜和震撼已經(jīng)足夠大。