海歸學(xué)者發(fā)起的公益學(xué)術(shù)平臺 交流學(xué)術(shù),偶爾風(fēng)月最近,,《自然》雜志發(fā)起一項(xiàng)關(guān)于“科學(xué)與AI”的研究調(diào)查,。全球1600名研究人員參與調(diào)查的結(jié)果顯示了他們對于AI的看法:人工智能工具(AI)在科研中的應(yīng)用越來越普遍,甚至未來有可能發(fā)展成為研究的主導(dǎo),。對于這一結(jié)果,,科學(xué)家們所持的態(tài)度很復(fù)雜,可謂亦喜亦憂,。 首先,,科學(xué)家們對于AI作為科研工具的使用基本持積極態(tài)度。在調(diào)查中,,大多數(shù)人肯定了其價(jià)值,。面對“未來十年,AI對科研的重要性”的選項(xiàng)時(shí),,超過一半的受訪者認(rèn)為,,人工智能工具“非常重要”、“必不可少”,。21世紀(jì)前十年,,機(jī)器學(xué)習(xí)算法的蓬勃發(fā)展,建立起了龐大復(fù)雜的科學(xué)數(shù)據(jù)集,。而在此基礎(chǔ)上,,20世紀(jì)第二個(gè)十年,人們開發(fā)出了通過學(xué)習(xí)大規(guī)模數(shù)據(jù)集生成新的原創(chuàng)內(nèi)容的新型生成式人工智能,。自此,,大模型的時(shí)代到來了。時(shí)代的印記在科研成果中的具體體現(xiàn)為,,使用AI的研究論文在各個(gè)領(lǐng)域的比例都有所上升,。Scopus數(shù)據(jù)庫中在標(biāo)題或摘要中提到人工智能相關(guān)關(guān)鍵詞的論文比例從十年前的2%提高到了目前的8%。伴隨著生成式人工智能的快速發(fā)展,,大語言模型(LLM)可以根據(jù)訓(xùn)練數(shù)據(jù)中的模式產(chǎn)生流暢的輸出,,包括文本、圖像和代碼,。這些都能為科研工作提供便利,。為了滿足更多領(lǐng)域的科研需求,一些團(tuán)隊(duì)專注于不斷測試提升AI的性能,,拓展可應(yīng)用的場景,,讓它可以幫助更多科學(xué)家完成工作,比如產(chǎn)生新的蛋白質(zhì)結(jié)構(gòu),、精準(zhǔn)預(yù)報(bào)天氣,、給出醫(yī)學(xué)診斷建議等。AI系統(tǒng)不斷擴(kuò)展的能力讓開發(fā)者們感到非常興奮。在機(jī)器學(xué)習(xí)方面,,三分之二的人認(rèn)為AI提供了更快的數(shù)據(jù)處理方式,;58%的人表示,其提高了復(fù)雜運(yùn)算的效率,;55%的人表示,AI有助節(jié)省時(shí)間和資金,。此外,,受訪者認(rèn)為,AI最明顯的好處是,,幫助研究人員改進(jìn)研究論文的語法和風(fēng)格,,或總結(jié)或翻譯其他工作,幫助母語非英語的研究人員展示自己的研究,。此外,,大家最喜歡AI的是它帶來的、與研究無關(guān)的創(chuàng)造性樂趣,,比如擬一份健康食譜,。雖然,在科研中玩轉(zhuǎn)AI給科學(xué)家們帶來了不少便利和樂趣,。但事實(shí)上,,經(jīng)常在工作中使用文本生成AI的研究人員仍是少數(shù)。開發(fā)AI的研究人員中,,每周用一次以上的人約占28%,;不參與開發(fā)但是使用AI的研究人員中,13%的人曾經(jīng)用過此類工具,;不使用AI做科研的人中,,有1%也曾經(jīng)用過AI工具。雖然AI工具為科研工作帶來了種種好處,但研究人員普遍擔(dān)心其對科研產(chǎn)生負(fù)面的影響,,特別是對未來長期,、更深遠(yuǎn)的影響。由于AI的“黑匣子”運(yùn)行系統(tǒng)并不透明,,大多數(shù)人根本不知道AI究竟是如何得出的最終結(jié)果,。在可能產(chǎn)生的負(fù)面影響選項(xiàng)中,69%的人認(rèn)為,,人工智能工具會讓人產(chǎn)生依賴性,;58%的人認(rèn)為會加深數(shù)據(jù)中的偏見或歧視;55%的人覺得使用這些工具會讓欺詐變得更容易;53%的人認(rèn)為,,考慮不周的使用會導(dǎo)致研究結(jié)果無法復(fù)制,。這樣的擔(dān)憂尤其體現(xiàn)在對大型語言模型的使用上。聊天機(jī)器人ChatGPT和LLM是研究人員印象最深,、最常用到的AI工具,,同時(shí)它們也是最令科學(xué)家感到擔(dān)憂的。緊隨其后的是蛋白質(zhì)折疊人工智能工具,,如AlphaFold,,它可以根據(jù)氨基酸序列創(chuàng)建蛋白質(zhì)的3D模型。在可能產(chǎn)生的負(fù)面影響選項(xiàng)中,,68%的研究人員擔(dān)心使用不當(dāng)會導(dǎo)致錯誤信息的擴(kuò)散,;另有68%的人認(rèn)為使用AI會使抄襲變得更容易,更難被發(fā)現(xiàn),;66%的人則擔(dān)心論文會因此而出問題,。受訪者補(bǔ)充說,如果醫(yī)療診斷的人工智能工具是基于錯誤的數(shù)據(jù)進(jìn)行訓(xùn)練的,,那么則會產(chǎn)生更為長期,、深遠(yuǎn)的影響。比如美國的一個(gè)團(tuán)隊(duì)報(bào)告稱,,當(dāng)他們要求LLM GPT-4為一系列臨床病例研究提出診斷和治療建議時(shí),,給出的方案卻因患者的種族或性別產(chǎn)生了差異。軟件工程師伊莎貝拉·德根(Isabella Degen)正在英國布里斯托爾大學(xué)攻讀醫(yī)學(xué)AI博士學(xué)位,。她說:“大型語言模型的濫用常導(dǎo)致不準(zhǔn)確,、空洞的結(jié)果。在我看來,,很難界定'濫用’和'用好’之間的界限,。”一位使用LLM編輯論文的研究人員表示,,AI復(fù)制了人類的不良寫作習(xí)慣——描述很多但表達(dá)很少,;還有人認(rèn)為,廣泛依靠AI來做科研,,科學(xué)將從“以人為中心”轉(zhuǎn)變?yōu)椤耙詸C(jī)器為中心”,。科學(xué)家們的擔(dān)心并非杞人憂天。如果AI最終動搖了我們對原始科學(xué)文獻(xiàn)的信任,,那么,,我們將最終失去全人類共同 知識庫的基礎(chǔ)。此次調(diào)查中,,約有一半的科學(xué)家表示,,目前尚不能隨心所欲地使用或者開發(fā)人工智能,。開發(fā)者擔(dān)心缺乏計(jì)算資源、工作資金和運(yùn)行人工智能的高質(zhì)量數(shù)據(jù),;使用者怕不能得到專業(yè)的訓(xùn)練,,同時(shí)對于安全和隱私方面的問題抱有懷疑。此次調(diào)查提出了人們廣泛認(rèn)為的七種人工智能對社會的潛在影響,。其中,,人工智能被用來傳播錯誤信息是研究人員最擔(dān)心的。有科學(xué)家一再警告說,,在科研中濫用人工智能工具可能會導(dǎo)致錯誤,、誤報(bào)、不可復(fù)制的發(fā)現(xiàn),,不但不能提高工作效率,,反而會浪費(fèi)時(shí)間和精力,。曼哈頓堪薩斯州立大學(xué)的計(jì)算機(jī)科學(xué)家Lior Shamir認(rèn)為,,人工智能造成的損失大于幫助,。如果科學(xué)家沒有搞清楚自己需要什么就貿(mào)然使用AI,,無疑會導(dǎo)致錯誤的發(fā)現(xiàn)。在審查期刊論文方面,編輯和同行評審員能否用“火眼金睛”把關(guān),?受訪者對此存在意見分歧。在使用者中,,約一半的人直言“不知道”,;四分之一的人認(rèn)為審查得出來,;另外四分一的人認(rèn)為查不出來。其實(shí),,能不能審查出來,關(guān)鍵在于能否找到既熟悉機(jī)器學(xué)習(xí)方法又熟悉其應(yīng)用的人來擔(dān)任編輯工作,。這樣的專業(yè)人員并不好找。還有一個(gè)繞不開的問題是,商業(yè)公司主導(dǎo)著人工智能的計(jì)算資源和人工智能工具的所有權(quán)。在大模型時(shí)代,,掌握了數(shù)據(jù)便掌握了新時(shí)代的生產(chǎn)資料,。當(dāng)關(guān)鍵生產(chǎn)資料被商業(yè)公司所壟斷,,他們將擁有比想象中更為龐大的權(quán)力,。在此次調(diào)查中,一半的受訪者表示,在工作中無法避免與這些公司展開合作,。研究人員需要訪問數(shù)據(jù),、代碼和元數(shù)據(jù),就必須與商業(yè)公司打交道,。這意味著監(jiān)管機(jī)構(gòu)亟須迎頭趕上,。總之,,雖然目前人工智能工具尚存在著這樣或那樣的問題,,但是,,仍然有許多研究人員肯定了人工智能工具有其繼續(xù)存在的價(jià)值。最重要的是,,現(xiàn)在是時(shí)候把人工智能的開發(fā)和使用納入監(jiān)管系統(tǒng),,讓它可以安全地被運(yùn)用到科研領(lǐng)域中,造福人類社會,,而不是成為“潘多拉的魔盒”助長虛假,、欺詐和謬誤之風(fēng),蛀蝕科學(xué)的根基,。只要人工智能能被正確地使用,,科學(xué)和人類都將從中受益。1. AI and science: what 1,600 researchers think. Nature 621, 672-675 (2023).doi: https:///10.1038/d41586-023-02980-02.AI will transform science — now researchers must tame it. Nature 621, 658 (2023). doi: https:///10.1038/d41586-023-02988-6
|