新智元報道 【新智元導(dǎo)讀】醫(yī)療AI的門檻如此高,如何克服關(guān)鍵痛點(diǎn),?這家互聯(lián)網(wǎng)醫(yī)療公司深耕9年,,終于推出國內(nèi)首個醫(yī)療領(lǐng)域大語言模型MedGPT。ChatGPT帶火了大模型之后,,全世界大廠都卷了起來,。 強(qiáng)大的語言理解能力、生成能力,、邏輯推理能力,,讓大模型在醫(yī)療領(lǐng)域大有可為。 是的,,硅谷巨頭們早已意識到,,GPT在醫(yī)療領(lǐng)域的無限潛力。 早在今年2月,,ChatGPT在美國醫(yī)學(xué)執(zhí)照考試中,,以60%準(zhǔn)確度的回答,已經(jīng)接近真人醫(yī)生,。 話雖如此,,但只要深入調(diào)查這個行業(yè)就會發(fā)現(xiàn),目前市面上真正能夠投入使用的醫(yī)療大模型,,還寥寥無幾,。 原因就在于,醫(yī)療AI的門檻相當(dāng)之高,,在這個交叉領(lǐng)域要想成功做出產(chǎn)品,,既要懂醫(yī)療,又要懂技術(shù),。 國內(nèi)的醫(yī)療大模型之路該如何走,?讓我們先看看國外大廠的發(fā)展路線。 硅谷巨頭,,紛紛入局醫(yī)療GPT 當(dāng)前,,大型語言模型的發(fā)展,已經(jīng)有足夠的潛力給醫(yī)療保健整個行業(yè)帶去更加深遠(yuǎn),、廣泛的變革,。 比如,,遠(yuǎn)程問診效率、準(zhǔn)確度提升,,簡化醫(yī)療文檔,,甚至還可以幫助醫(yī)療人員減少工作量提高效率。 GPT-4,、PALM 2作為當(dāng)前最先進(jìn)的語言模型,,微軟、谷歌等硅谷巨頭必然將它的能力拓展到醫(yī)療領(lǐng)域,。 上個月,,微軟和Epic Systems宣布,將GPT-4引入醫(yī)療保健領(lǐng)域,,用于醫(yī)護(hù)人員對患者的消息回復(fù),,分析醫(yī)療記錄,以及尋找新的趨勢,。 另外,今年夏天,,微軟和Nuance將把GPT-4引入醫(yī)療保健文檔技術(shù),。微軟稱,整合后GPT-4提?了AI模型的整體準(zhǔn)確性,,但沒有透露準(zhǔn)確率,。 此外,谷歌過去幾年里也一直在探索如何用AI來改善醫(yī)療保健,,比如幫助早期發(fā)現(xiàn)疾病,,擴(kuò)大醫(yī)療服務(wù)范圍等等。 剛剛過去的谷歌I/O大會上,,谷歌在醫(yī)療領(lǐng)域的微調(diào)模型Med-PaLM也升級到了第二代,。 值得一提的是,Med-PaLM 2一出手,,就成為首個在USMLE(美國醫(yī)師執(zhí)照考試)上達(dá)到「專家」水平的模型,,得分為85.4%。 甚至,,它比迭代之前的Med-PaLM性能提高了18%,,遠(yuǎn)超同類AI模型。 那么,,現(xiàn)在通用的大語言模型,,在回答醫(yī)學(xué)問題方面表現(xiàn)怎樣呢?我們來實(shí)測一下,。 MedPaLM的表現(xiàn)很專業(yè),,然而,,如果從應(yīng)用場景看,MedPaLM還沒有那么高的實(shí)用性,,因?yàn)樗饕€是以做題為主,。 要說回答問題,那當(dāng)然少不了當(dāng)紅大模型ChatGPT,。 可以看到,,它的回答就比較中規(guī)中矩,沒有太多驚喜,。 而一旦給它上點(diǎn)難度,,問一道國家執(zhí)業(yè)醫(yī)師資格考試真題,它就寄了…… 可見,,類似ChatGPT這樣的通用類LLM,,高度依賴文本統(tǒng)計(jì)概率生成答案,因此回答的準(zhǔn)確性無法保證,。 但是,,在醫(yī)療應(yīng)用場景中,準(zhǔn)確性和一致性是底線,,絕不能出錯,。 垂直醫(yī)療大模型,難在哪? 從谷歌和微軟做醫(yī)療大模型的發(fā)展路線,,可以看到,,要想讓LLM在醫(yī)療領(lǐng)域充分發(fā)揮能力,有一些關(guān)鍵的難點(diǎn),。 1. 數(shù)據(jù)孤島 首先,,最致命的難點(diǎn)就是,垂直領(lǐng)域的大模型,,如何突破數(shù)據(jù)「卡點(diǎn)」,? 而垂直醫(yī)療領(lǐng)域AI大模型,只關(guān)注醫(yī)療這個特定的領(lǐng)域或者場景,。它能夠利用醫(yī)療的數(shù)據(jù)和知識,,提供更精準(zhǔn)和高效的解決方案。 然而現(xiàn)實(shí)是,,整個醫(yī)療服務(wù)的數(shù)據(jù)信息碎片化,,還有的被嚴(yán)重分割,醫(yī)療數(shù)據(jù)異構(gòu)性,、難流通,。 一方面,不同醫(yī)療機(jī)構(gòu)采用不同的系統(tǒng),,每個系統(tǒng)標(biāo)準(zhǔn)不一,,因此缺乏統(tǒng)一化的數(shù)據(jù)格式,,或交互界面。 另一方面,,醫(yī)療數(shù)據(jù)較為敏感與特殊,。為更好的保護(hù)病人隱私,大多數(shù)醫(yī)院不會為利益交出數(shù)據(jù),,甚至將數(shù)據(jù)庫只接入局域網(wǎng),。 再加上,患者差異,、疾病繁多,、醫(yī)護(hù)人員經(jīng)驗(yàn)識別差異,都導(dǎo)致數(shù)據(jù)的不完整,、不統(tǒng)一,。 由此可見,醫(yī)療數(shù)據(jù)具有一定的門檻,,而且業(yè)內(nèi)沒有統(tǒng)一的的數(shù)據(jù)標(biāo)準(zhǔn),,都將是訓(xùn)練更專的垂類模型的絆腳石。 2. 復(fù)合型人才稀缺 值得注意的是,,對于「AI+醫(yī)療」這一專業(yè)性極強(qiáng)的交叉領(lǐng)域,,對復(fù)合型人才的需求極大。 醫(yī)療專業(yè)的知識本身非常精細(xì),,再加上與算法的深度融合,AI醫(yī)療這一高精尖技術(shù),,對人才綜合能力要求甚高,。 3. 行業(yè)標(biāo)準(zhǔn)難統(tǒng)一 除了以上兩點(diǎn),在大量涌入AI醫(yī)療的企業(yè)中,,AI+醫(yī)療標(biāo)準(zhǔn)缺失也是一大痛點(diǎn),。 而在醫(yī)療領(lǐng)域中,最重要的就是準(zhǔn)確度,,否則可能會給數(shù)百萬患者帶來風(fēng)險,。 目前,還沒有統(tǒng)一的行業(yè)標(biāo)準(zhǔn)能證明AI醫(yī)療的有效性,,如何保證真正的對患者結(jié)果負(fù)責(zé)就成為了行業(yè)中的難點(diǎn),。 總而言之,在醫(yī)療這一特殊領(lǐng)域,,如果沒有打通這些痛點(diǎn),,并不是每個大模型的玩家都能玩轉(zhuǎn)的。 國內(nèi)首款醫(yī)療大模型MedGPT 據(jù)媒體報道,,昨日醫(yī)聯(lián)正式發(fā)布了國內(nèi)首個醫(yī)療領(lǐng)域自研大語言模型——MedGPT,。 具體來說,,MedGPT基于Transformer架構(gòu),目前參數(shù)規(guī)模為1000億,,可支持醫(yī)療場景下的多模態(tài)輸入和輸出,。 其中,預(yù)訓(xùn)練階段使?了超過20億的醫(yī)學(xué)文本數(shù)據(jù),,微調(diào)訓(xùn)練階段使?了800萬條的高質(zhì)量結(jié)構(gòu)化臨床診療數(shù)據(jù),,并投入超過100名醫(yī)?參與??反饋監(jiān)督微調(diào)訓(xùn)練。 還記得ChatGPT一上來「翻車」了的問題嗎,? MedGPT秒秒鐘就給出了正確答案,,并且還配上了每個選項(xiàng)的詳盡分析。 在經(jīng)典的醫(yī)學(xué)應(yīng)試能力評測上,,MedGPT順利過關(guān),。 不僅如此,MedGTP的創(chuàng)新之處在于,,它不再是簡單的AI問答,,而是以「治愈」為目的實(shí)現(xiàn)有效問診。 值得注意的是,,MedGTP不僅整合了1000+多模態(tài)能力,,具備強(qiáng)大的技術(shù)路徑,而且還成功實(shí)現(xiàn)了眾多首次突破,。 - 首次突破了AI醫(yī)生無法與真實(shí)患者連續(xù)自由對話的難點(diǎn),。 缺少行業(yè)標(biāo)準(zhǔn),,何以壯大并持續(xù)發(fā)展 9年深耕,終獲突破 |
|