2022年底,,openAI發(fā)布基于新一代大語言模型的通用人工智能對話系統(tǒng)ChatGPT,瞬時引爆全球AI新浪潮,,發(fā)布幾個月來,,熱度持續(xù)升溫,不斷火出圈,,似乎無處不在,,無所不能。使用過的用戶無不感嘆它的 ”全知全能“:“只有你想不到,,沒有 ChatGPT 辦不到,!”,它可以在美國大學入學“SAT”考試中拿到1410分高分,,超過絕大多數(shù)人類,,沖刺哈佛不是夢;它可以通過谷歌 Level 3 的工程師面試拿到18 萬美元年薪;它甚至可以變身蘇格拉底,,在你提問時不直接告訴你答案,,而是一步步引導你自己得到答案。ChatGPT所代表的新一代生成式人工智能技術(shù)也被稱為繼蒸汽機,、電氣革命,、信息革命之后的第四次工業(yè)革命標志性技術(shù),代表著人類科技文明又進入了一個全新時代,。短短幾個月,,ChatGPT已經(jīng)改變了很多人的生活,它可以寫作,,繪畫,,作曲,,推理,編程,,算數(shù)無所不能,,學生用它做作業(yè),老師用它批改作業(yè),;程序員用它寫程序,,一個人頂一個團隊;文員用它生成文案,,幾秒鐘可以干完過去幾小時甚或幾天的活,;有人用他寫的論文順利博士畢業(yè);有人用它一個月寫了20部小說全部發(fā)表,;一些游戲公司開始用它繪圖并裁員60%以上美工...而這一切突如其來的變化,,讓人們在驚喜之余又有些不知所措。政府,、科學家和精英們在思考繼續(xù)發(fā)展人工智能是否導致人類對文明失去控制,;大企業(yè)們會擔心在變革中被淘汰而爭相上車研發(fā)自己的大模型;普通人在擔憂自己的工作會不會被AI取代而失業(yè),。還有因此衍生一系列的倫理問題,,法律道德問題等等,都讓人們對這個新事物是又愛又怕,。縱觀人類史上幾次類似的重大的生產(chǎn)力革命,,科技會超越和取代一部分人類的能力,確實會導致一部分人引以為傲生存技能突然沒了用武之地,,但是同樣為人類文明打開新的篇章,,從而養(yǎng)活更多的人類,創(chuàng)造更多的職業(yè),,讓人類生活的更加精彩,。唯一不同的是,過往的科技革命都是替代的人類的體力或者機械的重復(fù)腦力勞動和記憶力等,,而本次的升級則開始觸及人類深層次的思維和智力,沖擊必然會有的,,造成一部分的人失業(yè)也是必然會發(fā)生的,。但是潘多拉的盒子已經(jīng)打開,擔心已然是多余的,,我們更多要思考的是如何去擁抱新事物,,如何去投身這場變革。首先取代肯定是不可能的,,因為中醫(yī)不僅僅是門醫(yī)學,更是一種文化,一種基于宇宙和人體整體觀念的生命智慧哲學,。如果有一天人工智能已經(jīng)達到可以全面取代中醫(yī)師的程度,那么只有一種可能,,那就是人類已經(jīng)被人工智能取代了,,中醫(yī)也就沒意義了。從這個角度而言,,中醫(yī)的根本是以人為本的,,絕不是一個冰涼機器能取代的。不過從另一個角度看,,一個人工智能通過學習中醫(yī)知識能不能成為一個優(yōu)秀的中醫(yī)師呢,?也就是成為一個黃帝內(nèi)經(jīng)描述的“問而知之謂之工”,拋開由醫(yī)入道成神成圣的范疇,,專心做一個不知疲倦療效穩(wěn)定的醫(yī)工呢,?這種可能是存在的,但是目前還有三個難題: 1)中醫(yī)流派眾多,,法無定法 相對來說,,人工智能成為一個優(yōu)秀的西醫(yī)師比成為一個中醫(yī)師要容易的多,因為西醫(yī)是完全標準化的,,所有規(guī)則都是固定的,。就算是上一代人工智能技術(shù),都可以很好的駕馭西醫(yī)的知識和規(guī)則,,比如十幾年前的IBM醫(yī)療AI沃森就已經(jīng)超過大多數(shù)醫(yī)生的診斷能力,。但是對于中醫(yī)而言,傳承幾千年下來,,有真?zhèn)鞯?,假傳的,失傳的,;也有守舊的,,創(chuàng)新的,編造的,??v然有如四大經(jīng)典這樣的指路明燈,但是也不妨礙歷代醫(yī)家從各個角度的個人解讀與發(fā)揮,,數(shù)萬本中醫(yī)古籍,,足以迷亂后人,逐漸形成各種風格各種流派的,,有殊途同歸,,也有漸行漸遠,甚至于針鋒相對,,格格不入,。但是卻有一個共同點,,能流傳下來的,一定是有療效能治病的,。是的,,同一個人同一個病,可以有很多種種方案,,還能都有效,,而且每個醫(yī)師都認為自己方案才是最正確,別人的都是歧途,,這就是中醫(yī)的現(xiàn)狀,。每一次中醫(yī)治病就是患者個體和醫(yī)師個體兩個量場之間的一次獨一無二的交互,對于以人為本的中醫(yī)來說,,貌似本就該如此,。但是對于機器學習,那就是一路坑,,你讓AI單學一個傷寒雜病論,,會是個不錯的醫(yī)工;但是如果讓AI機械學習古今數(shù)十萬醫(yī)書后,,你覺得它還能會看病嗎,?2)AI具有很大的不確定性 現(xiàn)階段的AI,包括最先進的GPT-4,,回答問題都具有很大的不確定性,。這種不確定性來自多個方面,一是來自訓練的海量數(shù)據(jù)中的錯誤數(shù)據(jù),,AI自身是很難甄別的,;二是AIGC的模式下,可能同一個問題,,AI每次的回答都會有所不同,,輸出很不穩(wěn)定。技術(shù)強如谷歌,,年初在其大模型聊天機器人首秀也翻車,,回答錯誤問題導致當天市值蒸發(fā)7172億。而其后各大廠商發(fā)布各自大模型,,不約而同的都是放錄像,,而不敢現(xiàn)場演示,被網(wǎng)友戲稱發(fā)布了個ChatPPT,。不過ChatGPT更智能一些,,似乎覺得這個答案不太合理,,于是發(fā)揮了其一本正經(jīng)的胡說八道的特長,,硬是生編了一套符合邏輯的虛假信息來圓,。這也是生成類AI的另一個不靠譜之處,遇到不太確定的問題,,它也會言之灼灼的胡編亂造信息給你,,當你發(fā)出質(zhì)疑后,它會迅速認錯然后另編一個,,讓你哭笑不得,。所以這樣的這樣的AI醫(yī)生來開藥給你,你敢吃嗎,?3)診斷數(shù)據(jù)采集難以標準化 中醫(yī)診斷要求是望聞問切四診合參,,對于AI而言就是現(xiàn)在流行的多模態(tài)。但是這個信息采集是無標準的,,目前最普遍的做法就是問診信息,,也就是通過癥狀匹配治療方案,因為癥狀是可以做到相對標準,。如果加入醫(yī)師的舌診和脈診輸入,,那就千差萬別了,對醫(yī)師要求也很高,。輸入千差萬別,,指望AI能穩(wěn)定輸出,那就是天方夜譚了,。所以即便有些AI接收舌像和脈象,,也只能做輔助參考,不敢用于決定性診斷,。當然也有一些自動分析舌照,,或是自動采集脈象的,這個數(shù)據(jù)就能標準很多,,雖然同樣受光線,,角度,以及設(shè)備敏感度制約,,但是比靠醫(yī)師輸入來采集信息,,還是要靠譜的多。所以這個難題,,說難也不難,,技術(shù)上其實很容易實現(xiàn)。但是讓中醫(yī)師接受標準化診斷數(shù)據(jù),,代替自身的四診合參,,這個不是一般的難,甚至是無解的難,。接下來我們聊聊,,這三大難題有沒有可能被突破?要搞清這個,,我們就需要深入了解下AI的技術(shù)原理,,如果你從網(wǎng)上搜ChatGPT的實現(xiàn)原理,能找到的大概都是一堆數(shù)學公式,。但是我們是搞中醫(yī),,不是搞算法的。所以這里我盡量拋開數(shù)學,,嘗試在邏輯和哲學層面與大家探討一下AI的發(fā)展和原理,。人類對于人工智能的向往源遠流長,無論是西周的偃師造人還是古希臘神話的黃金機器人,,都是基于人類模擬自身的樸素夢想,。而早在計算機誕生之前,阿西莫夫就提出了機器人三定律,,把神話變成了科幻,。1946年第一臺計算機誕生后,人工智能終于有了實質(zhì)性的研究和實踐,。從十九世紀五十年代起,,掀起了第一波人工智能熱潮,奠定了人工智能的研究路線和算法,。70多年過去了,,不但路線沒有偏離,算法其實進步也不大,,唯一突飛猛進的大概就是算力了,。當時的研究路線有三派:邏輯學派(符號主義),仿生學派(連接主義)和進化學派(行為主義),。這三個方向其實也代表著人類認識世界的三種思想,。邏輯學派基本代表了現(xiàn)在科學的普遍世界觀,,這個世界是規(guī)則是世界,,主宰世界運行的是一系列的真理和定律,一切行為現(xiàn)象背后都有其規(guī)律可循,,把人類認知和思維的基本單元稱為符號,,認知過程就是在符號表示上的一種運算,所以叫符號主義,。符號主義人工智能正是秉承這一世界觀,,為人工智能設(shè)計一條條基礎(chǔ)邏輯和規(guī)則,讓人工智能在其框架內(nèi)運行。因為符合科學界的主流世界觀,,且有清晰的邏輯規(guī)則及可控性,,可解釋性,從人工智能誕生以來,,符號主義就一直是絕對的正統(tǒng)學派,長期在人工智能研究中處于主導地位,。目前市面上的商業(yè)人工智能系統(tǒng),,絕大多數(shù)的是這一類。仿生學派則認為無論世間多么復(fù)雜的的事物,,都是由最簡單的單元相互連接和傳遞的結(jié)果,世界是如此,,人腦也是如此,,所以叫連接主義。連接主義立足于人腦仿生學研究,,創(chuàng)立了神經(jīng)元及神經(jīng)網(wǎng)絡(luò)的數(shù)學模型,,以此模擬人腦的學習和思維過程,開辟了人工智能的另一條道路,。但是受限于算力,,連接主義長期停留在理論階段,少有實質(zhì)性突破,,但是算法和模型也在不斷進步中,,隨著算力的提升,連接主義的人工智能2010年開始逐漸從各方面碾壓上符號主義的人工智能,,并在2016年AlphaGo(阿法狗)對決圍棋世界冠軍李世石一戰(zhàn)成名天下知,,取代符號主義,奠定其當下人工智能研究的主流地位,。如今的ChatGPT的成功則是證明了這條路已經(jīng)走通,,因此也聚焦了全世界的目光和資源。進化學派認為世界源于感知,,而智能源于感知的信息反饋,簡單來說就是世界之所以表現(xiàn)這樣,,是基于人類的眼耳鼻舌身的感知,,而人類的智慧來源,就是對這些感知信息的提取,,處理,,存儲。所以行為主義基于控制論,通過研究生物進化機制,,模擬人在控制過程中的智能行為和作用,,形成了“感知—行動”的智能模擬控制系統(tǒng)。行為主義的研究和發(fā)展遠不如符號主義和連接主義廣泛和深入,,目前主要應(yīng)用在機器人領(lǐng)域,,不是我們今天探討的關(guān)鍵。接下來我們從中醫(yī)AI的角度來深入探討一下,,現(xiàn)在我們知道早期都是符號主義人工智能,,靠的是工程師固化知識點、規(guī)則和邏輯,,人工智能按部就班執(zhí)行,,是否智能取決于設(shè)計者預(yù)判了多少場景固化了多少邏輯,優(yōu)點是邏輯清晰,,輸出可控,,可解釋,可信度高;缺點是現(xiàn)實世界知識無限,,場景無限,,不可能完全固化,也不能自我學習,,導致長期以來人工智能都被成為人工智障,。當然后期也發(fā)展出了隨機森林,知識圖譜等技術(shù),,讓人工智能不再那么死板,,不再完全依賴于工程師的邏輯固化,具備了一定的學習和推理能力,。目前市面上的中醫(yī)AI大都是以知識庫與決策樹為基礎(chǔ)的早期智能,。因為符號主義的智能是沒有理解能力的,醫(yī)書肯定是看不懂的,,所以推理邏輯來源只能來自兩個方面,,一、醫(yī)師經(jīng)驗總結(jié)的格式化邏輯,;二,、海量病歷的機器學習。前者的問題在于沒有人可以把自己的經(jīng)驗做無損的完全格式化總結(jié),;后者的問題在于病歷收集難度以及可信度,,尤其是可信度,正是我們上面提到的第一個難題,,來自不同醫(yī)師,,不同流派的,,記錄不規(guī)范并且療效不明的海量病歷,恐怕只能讓機器越學越糊涂,。在此兩者之外還有一個患者基本信息采集難以規(guī)范標準化的大問題,,就算人工智能的推理能力足夠好了,使用者輸入的信息不標準不能如實反映患者真實情況,,結(jié)果也會是一塌糊涂,。所以經(jīng)常有朋友問我現(xiàn)在有沒有靠譜的中醫(yī)AI?我也只能呵呵了,。幾千年來,,能把自身經(jīng)驗最少損失,最大化療效的格式化邏輯總結(jié),,唯仲景一人。所以,,就目前而言,,一個以傷寒論為準則,以最簡單方證對應(yīng)為邏輯,,只開經(jīng)方的最簡陋中醫(yī)AI,,反倒可能是療效最好的。當然問題也是很多,,比如上一波席卷全國的新冠,,典型的發(fā)熱,惡寒,,身痛癥狀,,在經(jīng)方有多少種可能?不說AI,,全國經(jīng)方醫(yī)家也給出各不相同的答案,,有推薦麻黃類的葛根湯,麻黃加術(shù)湯,,麻杏甘石,,大小青龍等,也有柴胡桂枝湯,,桂枝二越婢一湯,,桂枝加附子湯等等,或是理中四逆輩,,真武湯,,白通湯等。如果采集信息不標準,,輸入癥狀不完全,,AI恐怕也只能聽天由命,。還有一種就是精心調(diào)教的大師專家系統(tǒng),假如你信服和學習某位大師,,用基于該大師經(jīng)驗的專家系統(tǒng)輔助診療,,還是幫助很大的。現(xiàn)階段中醫(yī)AI雖然面臨問題很多,,但是最大的優(yōu)勢是不存在我們上面提出的第二個難題,,一經(jīng)固化的邏輯,具備可以解釋,,可追溯能力,,發(fā)現(xiàn)不可靠回答就可以及時改正,不存在隨機性和不確定性,。如今的人工智能領(lǐng)域連接主義大行其道,,風頭無二,在超強算力和大模型(LLM)的加持下,,已經(jīng)初步具備了學習,,思考,理解,,創(chuàng)造和多模態(tài)(文字,,圖片,聲音,,視頻等通通掌握)能力,。如果讓大模型來學習中醫(yī),能做到什么程度,?這條路還沒有人探索過(也許現(xiàn)在已經(jīng)有人在做,,但是我不了解,如果有朋友同道已經(jīng)在做,,希望可以聯(lián)系我,,我們多多學習交流,互通有無),。我們這里只能從原理上分析一下,,那么這新一代人工智能是如何推理的呢?微軟報告里是這樣描述的“我們過去幾年,,人工智能研究中最顯著的突破是大型語言模型(LLMs)在自然語言處理方面取得的進展,。這些神經(jīng)網(wǎng)絡(luò)模型基于Transformer架構(gòu),并在大規(guī)模的網(wǎng)絡(luò)文本數(shù)據(jù)體上進行訓練,,其核心是使用一個自我監(jiān)督的目標來預(yù)測部分句子中的下一個單詞,。”這話有點難懂,,我們這里也不是探討算法和數(shù)學原理,。簡單而言,,這個新一代智能還是秉承著連接主義的基礎(chǔ)世界觀,復(fù)雜事物都是由最簡單的單元相互連接和傳遞的結(jié)果,,它認識世界只有一個維度——概率,。以文字處理為例,它通過海量的現(xiàn)實世界文字分析,,得出在各種場景,,各種語境下,每一個詞可能出現(xiàn)的概率,。在智能問答或者生成文案時,,根據(jù)你的提問或者文案要求,然后根據(jù)每個詞的概率組合成一句話或一篇文章,。應(yīng)用在中醫(yī)領(lǐng)域,,它可能是通過學習所有的中醫(yī)知識,建立各種維度的概率,,如方,,藥,穴位,,療法等等,,在接受一個患者信息后,,通過概率給出各種治療方案,。這個東西已經(jīng)很難理解,而且也遠不是我描述這么簡單,,大模型會在某個時刻突然變聰明,,其變化如同神話里的注靈般,讓傀儡瞬間具備靈性。就連其創(chuàng)作者也說“我們沒有解決為什么以及如何實現(xiàn)如此卓越的智能的基本問題,。它是如何推理,、計劃和創(chuàng)造的?”這就是大模型的不可解釋性,。這種通過海量訓練后,,突然暴增的智能性,行業(yè)里稱為涌現(xiàn)(emergence ),。是否具備涌現(xiàn)能力,,以及具備多少涌現(xiàn)能力,已經(jīng)是人工智能的分水嶺,。同行的朋友見面第一句話,,往往是“你的模型涌現(xiàn)了嗎?“,,但是目前還沒有人知道人工智能的涌現(xiàn)是如何發(fā)生的,,只知道在足夠大的模型,,足夠多的數(shù)據(jù)訓練下才有可能發(fā)生。既然無法從邏輯上理解,,我們就嘗試從哲學上理解一下,。上面我們提到人工智能的三種路線代表了三種世界觀,世界的本源是什么樣子,,這個問題本就無解,,人類的目前的探索可能甚至未能揭開億萬分之一。在量子理論問世之前,,科學界是決定論一統(tǒng)天下,,牛頓用經(jīng)典物理學塑造了決定論的巍峨宮殿,幾乎無懈可擊——“這個世界就是我們可以理解的樣子,,宇宙里沒有任何巧合,,一切都是嚴格遵循規(guī)則,而人類已經(jīng)完全掌握了這些規(guī)則”,。后來愛因斯坦舉起相對論的鋤頭挖倒了這座宮殿,,但是他仍然是決定論的擁躉,堅信“上帝從不擲骰子”,。但是由于決定論的宮殿已經(jīng)被他親手挖倒,,最終他還是在與玻爾等人論戰(zhàn)30年后敗下陣來。后世隨著量子理論的完善以及量子糾纏的發(fā)現(xiàn),,現(xiàn)在的科學界已經(jīng)普遍認同,,這個世界就是一個充滿了不確定性和隨機的世界,無論你是否理解或承認,。在最前沿猜想中,,概率和關(guān)系就是整個世界的基石,宏觀世界的物質(zhì)存在,,也不過的是微觀世界概率與關(guān)系的表象,,概率波+薛定諤方程,就是宇宙的最終表達,。是的,,物質(zhì)不存在,空間不存在,,一切像極了電腦虛擬世界中的一切事物,,無論多么龐雜繁瑣,最終都歸結(jié)于數(shù)字0和1的表達,。當然,,這也只是科學猜想。說到這里,,你是否發(fā)現(xiàn)了什么,?大模型的訓練過程,,就是把一切數(shù)據(jù),知識這些可表現(xiàn)形式拆解為概率和關(guān)系,;而大模型的推理過程,,就是用概率和關(guān)系生成文字,圖片或其他可表現(xiàn)形式,,像不像量子物理學的宏觀與微觀,?從這個角度來看,大模型類的人工智能,,似乎發(fā)現(xiàn)了人類尚未發(fā)現(xiàn)的領(lǐng)域,,正在從另一個維度去認識和理解這個世界。概率作用在于大樣本,,知道有50%概率,,對于扔一次硬幣得到是頭還是字毫無意義,但是你扔一萬次甚至一億次,,這個概率就成了定律,,結(jié)果就是可預(yù)測的。所以大模型的根基就是要大,,只有足夠多的數(shù)據(jù),,足夠多的參數(shù),訓練出來的大模型才有可能把概率變成定律,。才有可能解決我們上面的前兩大難題,,讓人工智能在學習中可以自我甄別,在輸出時可以穩(wěn)定不翻車,,通過海量醫(yī)書的學習和實踐中的反饋,,從另一個維度理解中醫(yī),,發(fā)現(xiàn)隱藏在概率中的一切理法方藥,,成為最強中醫(yī)師,這種可能是存在的,。不過這要依賴于將來的算力和算法的進一步升級,。所以目前看來,人工智能不僅無法取代中醫(yī),,就連做一個輸出穩(wěn)定療效不錯的醫(yī)工也是很難的,。說了半天,,結(jié)論似乎是在目前的技術(shù)下,,中醫(yī)AI是無法解決上面三個難題的,搞中醫(yī)AI是不是就沒意義了,?當然不是,!上面提到的很多思想和算法是在計算機發(fā)明之前就已經(jīng)被提出的,,技術(shù)不成熟,不代表不能去探索,。不邁出步子,,永遠也到不了終點?;谀壳暗募夹g(shù)條件,,這個三個難題也是可以規(guī)避和解決的。第一個問題其實很好解決,,縮小范圍,,不做通用中醫(yī)AI,做單一流派中醫(yī)AI,,在深度學習之前,,人工篩選所有的知識,書本和醫(yī)案,,只選某一派甚至某一個人或者一批理念相近一脈相傳的醫(yī)師著作,。比如我們可以找出歷代所有經(jīng)方醫(yī)家的傷寒論著作和醫(yī)案,再配合黃帝內(nèi)經(jīng),,輔行決等基礎(chǔ)醫(yī)理,,讓大模型去學習和總結(jié)。相信一定能訓練出一個出色的經(jīng)方醫(yī)家,,甚至它還能幫我們找出傷寒論所有的錯簡漏條,。第二個問題在模型和數(shù)據(jù)量不夠大的現(xiàn)在,只能規(guī)避,,也就是不使用AIGC技術(shù)來生成治療方案,,但是并不代表我們就回到上一代人工智能,只能在老路上奔波,。我們完全可以用大模型來學習上一步篩選出來的知識和數(shù)據(jù),,用以生成完善的知識圖譜。這種學習的效率和規(guī)模絕對是過去不可想象的,。然后我們通過人工和實踐中逐步微調(diào)這個知識圖譜,,讓其準確性越來越高。第三個問題其實不是技術(shù)問題,,是個理念的問題,。初期我們可以拋開,但是在實踐中配備標準化的舌像采集和脈象采集或者經(jīng)絡(luò)采集設(shè)備,,積累一定數(shù)量的病歷數(shù)據(jù)后,,再次用標準化數(shù)據(jù)重新訓練模型,這樣新的智能就不會受到信息采集者的主觀干擾,實現(xiàn)穩(wěn)定的輸入輸出,。另外,,通用AI不容易實現(xiàn),但是做專家專病的AI就相對容易的多,??傊S著ChatGPT的問世,,一扇新的大門已經(jīng)打開,,新的生產(chǎn)力已經(jīng)上線,對于各行各業(yè)而言,,終究要投身其中擁抱變化,,這是早晚的事情。中醫(yī)診療AI不一定成熟,,但是在客戶服務(wù),,患者關(guān)懷,醫(yī)患溝通這些方面,,現(xiàn)有AI技術(shù)已經(jīng)很成熟,,大家還是要多多關(guān)注。 |
|