1 新智元原創(chuàng) 作者:趙以文
有些事,只靠人力就是沒法做到,。
由此,,MSKCC (凱特琳癌癥中心)跟 IBM 合作,利用超級(jí)計(jì)算機(jī)IBM Watson 吸收知識(shí)的能力,,擴(kuò)展人類的極限:IBM Watson 每秒能夠掃描上萬億字節(jié)的醫(yī)療數(shù)據(jù),,而且“過目不忘”,再結(jié)合強(qiáng)大的機(jī)器學(xué)習(xí)算法,,從大量結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)中得出洞察,,進(jìn)而助力醫(yī)生做出更加個(gè)性化的的治療方案。
在福布斯的報(bào)道中,,與IBM Watson 合作的醫(yī)療機(jī)構(gòu)Wellpoint的醫(yī)生表示,,試驗(yàn)中IBM Watson 對(duì)肺癌診斷正確的幾率為 90%,而人類醫(yī)生只有 50%,。使用IBM Watson 參與臨床教學(xué)的醫(yī)院 Cleveland Clinic 的醫(yī)生都經(jīng)常為IBM Watson 給出的建議治療方案感到驚嘆:“為什么我(們)當(dāng)初就沒有想到那一點(diǎn),?!” 雖然“科學(xué)和技術(shù)飛速發(fā)展”已成了老生常談,,而癌癥診療還是一個(gè)充滿迷思的領(lǐng)域,。目前,人們經(jīng)常提及并感到恐懼的癌癥包含:“肺癌”“乳腺癌”等,。
借助基因檢測(cè)等生物信息技術(shù),,我們知道,所謂的“肺癌”“腎癌”“乳腺癌”,,實(shí)際上是對(duì)成千上萬種不同的細(xì)胞突變模式或錯(cuò)誤排列的總稱,。根據(jù) 2015 年一篇研究腎癌的論文,正如世界上沒有兩片一模一樣的樹葉,,地球上也沒有兩個(gè)一模一樣的腫瘤,;還有研究發(fā)現(xiàn),就連同一個(gè)人的同一個(gè)腫瘤里面,,也沒有兩個(gè)細(xì)胞在遺傳基因上是一樣的,。
了解這一點(diǎn),對(duì)癌癥診療十分關(guān)鍵,。目前,,癌癥診斷幾乎全都是靠“看”:人類醫(yī)生在顯微鏡下觀看細(xì)胞或組織樣本,有時(shí)候?qū)?xì)胞DNA、RNA 或者蛋白質(zhì)的一些測(cè)試結(jié)果可以幫助醫(yī)生做出判斷——但歸根結(jié)底,,還是靠“看”。據(jù)媒體報(bào)道,,2014 年,,美國肺癌、乳腺癌和皮膚癌的死亡率將近 40%,,所以對(duì)于癌癥而言,,早發(fā)現(xiàn)早治療非常關(guān)鍵。 靶向藥物及療法的出現(xiàn),,使癌癥醫(yī)療情形大為改觀,。所謂“靶向治療”,就是針對(duì)含有某種癌癥有關(guān)的基因突變的細(xì)胞,,開發(fā)“靶向藥物”,,要么殺死這些細(xì)胞,要么使其不能復(fù)制,。然而,,據(jù)統(tǒng)計(jì),目前癌癥藥物治療有效——即腫瘤體積顯著縮小——比例只有 22%,。也就是說,,再怎么“靶向”,當(dāng)靶子的數(shù)量太多時(shí),,治療也鞭長莫及,。
很容易想到的方法是,,借助機(jī)器的計(jì)算力分析并預(yù)測(cè)醫(yī)療數(shù)據(jù),。1991年,用于醫(yī)學(xué)診斷的簡單貝葉斯方法 QMR 模型被提出,。1994 年,,《美國醫(yī)學(xué)信息學(xué)會(huì)》(JAMIA)發(fā)表了題為《醫(yī)療診斷決策支持系統(tǒng):過去、現(xiàn)在和未來》的調(diào)查文章,。2005 年,,《英國醫(yī)學(xué)雜志》(BMJ)發(fā)表了題為《用臨床決策支持系統(tǒng)提高臨床實(shí)踐》的論文。
近年來,,隨著計(jì)算能力的提升和相關(guān)醫(yī)療大數(shù)據(jù)的發(fā)展,,越來越多的醫(yī)生開始使用機(jī)器學(xué)習(xí)幫助癌癥診斷。機(jī)器學(xué)習(xí)算法使用各種統(tǒng)計(jì),、概率和優(yōu)化方法讓計(jì)算機(jī)從輸入中“學(xué)習(xí)”,,從海量非結(jié)構(gòu)化的數(shù)據(jù)中識(shí)別出人類難以識(shí)別的模式。除了癌癥診斷,機(jī)器學(xué)習(xí)也可以用于癌癥預(yù)后及復(fù)發(fā)的判斷,。
在癌癥診斷中使用的機(jī)器學(xué)習(xí)算法主要有三種:監(jiān)督學(xué)習(xí),、無監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。在監(jiān)督學(xué)習(xí)的情況下,,癌癥診斷可以簡化為“分類”:模型根據(jù)訓(xùn)練結(jié)果,,將輸入的數(shù)據(jù)分為幾類。假設(shè)采集了與乳腺癌有關(guān)的數(shù)據(jù),,根據(jù)腫瘤的大小判斷該腫瘤是良性還是惡性,,那么機(jī)器學(xué)習(xí)模型要問答的問題,就成了估計(jì)這個(gè)腫瘤是良性(或惡性)的概率,,如下圖,。
還一種廣泛使用的機(jī)器學(xué)習(xí)方法是半監(jiān)督學(xué)習(xí),也就是監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)的結(jié)合,。采用半監(jiān)督學(xué)習(xí)時(shí),,輸入的數(shù)據(jù)有的打了標(biāo)簽,有的則沒有標(biāo)簽,,通常沒有標(biāo)簽的數(shù)據(jù)會(huì)更多,。完善標(biāo)簽的質(zhì)量后,機(jī)器學(xué)習(xí)算法相比一般的預(yù)測(cè)模型,,正確率會(huì)有大幅提升,。
2016 年1月,,羅氏制藥收購了名不見經(jīng)傳的Foundation Medicine,,獲得了 3.5 萬份癌癥基因測(cè)序及其推薦治療方案。2016 年 4 月,,由原華大基因CEO王俊創(chuàng)辦的碳云智能對(duì)外公布 A 輪接受融資,,估值 10 億美元,要構(gòu)建健康大數(shù)據(jù)平臺(tái),,整合遺傳,、醫(yī)療、營養(yǎng)乃至美容健身等各類健康數(shù)據(jù)資源,。像這樣的例子還有很多很多,奧巴馬政府去年初提出的“精準(zhǔn)醫(yī)療計(jì)劃”,、“Cancer Moonshot”,,也都是想利用大數(shù)據(jù)和人工智能幫助人類醫(yī)生,提升癌癥的治愈率,。
目前,,對(duì)于某些疾病,算法的準(zhǔn)確度已經(jīng)足夠高,,遠(yuǎn)遠(yuǎn)超過人類醫(yī)生,。越來越多的人類醫(yī)生開始意識(shí)到,借助機(jī)器學(xué)習(xí),,他們能夠快速精準(zhǔn)地獲得臨床有用的醫(yī)療信息,。 目前,每年花費(fèi)在抗癌藥物研發(fā)的大量資源中,,有很多都浪費(fèi)在了所謂的“試錯(cuò)”上面,。近年來計(jì)算機(jī)科學(xué)的發(fā)展,讓很多醫(yī)療機(jī)構(gòu)都將認(rèn)知計(jì)算和大數(shù)據(jù)用于癌癥診療,,IBM 算是較早就開始嘗試這一點(diǎn),;截止 2015 年底,IBM Watson 閱讀了 1967 年到 2000 年的 470 萬份專利和 1100 萬份醫(yī)藥期刊,,并從中生成了 250 多萬種新的化合物,,構(gòu)建了一個(gè)強(qiáng)大的數(shù)據(jù)庫(Strategic IP Insight Platform)——就像計(jì)算材料科學(xué)家使用機(jī)器學(xué)習(xí)算法加速新材料的發(fā)現(xiàn),此舉也將有望大舉加速抗癌新藥的研發(fā),。 不僅如此,,機(jī)器算法還能提升現(xiàn)有癌癥藥物的使用率。UCSF 研究人員開發(fā)了一種能夠系統(tǒng)性篩選現(xiàn)有癌癥藥物的程序,,并檢測(cè)了 90 種現(xiàn)有抗癌藥各自針對(duì) 51 種基因突變的治療效果,。根據(jù)去年在 Cancer Discovery 發(fā)表的論文,該團(tuán)隊(duì)已經(jīng)發(fā)現(xiàn)了超過 10 種有望進(jìn)入臨床試驗(yàn)的藥物,,其中包括一些此前根本沒人想到的方案,,比如原本為了 AA 基因突變研發(fā)的 aa 藥,實(shí)際上對(duì) BB 基因突的治療結(jié)果更好,乃至可以進(jìn)入臨床試驗(yàn),。
不單藥物研發(fā)理論,,人工智能在實(shí)際藥物生產(chǎn)過程中也起到了很大的加速作用。前不久,,MIT的 3 名教授在 Science 發(fā)表論文,,宣布團(tuán)隊(duì)成功將制藥工廠裝進(jìn)了“電冰箱”。研究人員在論文中描述了一款電冰箱大小的一體化制藥機(jī)原型,。 據(jù)介紹,,這臺(tái)制藥機(jī)一天之內(nèi)可以生產(chǎn) 1000 劑量的藥片,將制藥速度提升了 10 倍,,目前已經(jīng)可以生產(chǎn)Benadryl,、lidocaine、Valium和Prozac 這 4 種常用藥,。這款制藥機(jī)獨(dú)特的地方在于,,它將傳統(tǒng)制藥過程中的電路、加熱器,、混合器,、反應(yīng)器等設(shè)備,集成為一個(gè)電冰箱大小的封閉工作站,。一般而言,,合成藥物所需要的溫度、壓強(qiáng)等參數(shù)都可以事先設(shè)置好,,只有個(gè)別步驟需要技術(shù)人員控制或者加入原料,。這臺(tái)機(jī)器可以根據(jù)藥物的特點(diǎn),調(diào)整參數(shù)和配件,,以往需要多個(gè)工廠聯(lián)合生產(chǎn)的藥物,,只用這一臺(tái)機(jī)器就能夠完成。
最后,,從藥物研發(fā)出來到經(jīng)過批準(zhǔn)上市,,一般也需要長達(dá)幾年甚至幾十年的時(shí)間,這對(duì)癌癥患者而言,,恐怕比金錢更加難以承受,。新智元智庫專家王飛躍教授在《虛擬現(xiàn)實(shí):平行也可以相交》一文中指出:“現(xiàn)在制定和實(shí)施一項(xiàng)社會(huì)政策,往往需要多年才能檢驗(yàn)到實(shí)際效果,。如果有虛擬現(xiàn)實(shí)構(gòu)造的人工社會(huì)模型,,政策制定后,拿虛擬人做試驗(yàn)品,,在‘計(jì)算’試驗(yàn)中發(fā)現(xiàn)政策中的可能漏洞,,推理中的可能局限甚至偏見,,再通過虛擬現(xiàn)實(shí)把邏輯上的錯(cuò)誤和個(gè)人的私利盡可能剔除出來加以修正。通過智能系統(tǒng)選擇最優(yōu)化的方案,,而不是拿實(shí)際的人力,、資源、財(cái)政來試錯(cuò),。 此外,,還可以在虛擬和物理社會(huì)中同時(shí)實(shí)施政策,比較兩者的結(jié)果,,如果兩者不一樣,,之間的差別就變成了修正政策的反饋信號(hào)。是不是當(dāng)時(shí)的假設(shè)錯(cuò)了,?如果假設(shè)沒錯(cuò)是不是現(xiàn)實(shí)社會(huì)中有人搞了鬼,?通過虛擬現(xiàn)實(shí),形成閉環(huán)的,、有反饋的虛實(shí)互動(dòng),最后走向虛實(shí)一體,、知行合一,。不單是社會(huì)政策,未來甚至每個(gè)人每做一件事之前都應(yīng)該先虛擬化,,模擬每一步有什么目標(biāo),,怎樣實(shí)現(xiàn),這就是知識(shí)自動(dòng)化的第一步,,由于效率提高節(jié)省出來的時(shí)間將被用到事前虛擬中去,,不難設(shè)想,事前虛擬將減少許多社會(huì)矛盾和資源浪費(fèi),?!蓖瑯樱覀円材軙诚?,未來將虛擬現(xiàn)實(shí)應(yīng)用于藥物臨床試驗(yàn),,必將極大縮短藥物從研發(fā)到上市的時(shí)間,此外還能解決樣本少,、減輕臨床試驗(yàn)者痛苦等其他問題,。
目前,有幾百個(gè)基因療法正在研發(fā)之中,,對(duì)于大約5000種由單一基因錯(cuò)誤導(dǎo)致的罕見疾病來說,,很多療法都將是百分百治愈的。 或許上面說的這些看起來都很遙遠(yuǎn),,實(shí)際上機(jī)器學(xué)習(xí)已經(jīng)投入實(shí)用,,在美國有很多醫(yī)生和護(hù)士都會(huì)利用機(jī)器進(jìn)行決策,。
醫(yī)療公司輝瑞和IBM合作,利用認(rèn)知計(jì)算解析復(fù)雜數(shù)據(jù)的能力,,整合可擴(kuò)展的測(cè)量和分析系統(tǒng),,預(yù)計(jì)推行 24 小時(shí)全天候的病患監(jiān)測(cè),為患者提供更好的治療,。
在中國,,以房顫病人需接受干預(yù)為例,借助IBM認(rèn)知醫(yī)療數(shù)據(jù)模型的確認(rèn)和精準(zhǔn)化分析,,某些城市的醫(yī)院已經(jīng)實(shí)現(xiàn)了卒中(中風(fēng))風(fēng)險(xiǎn)預(yù)測(cè)精度提高,,在高風(fēng)險(xiǎn)病人中精確地找到真正需要干預(yù)的病人,極大降低病人不必要的醫(yī)療花費(fèi),。
就在常用的社交網(wǎng)絡(luò)中,,也埋藏著大量有助于癌癥診療及預(yù)防的信息。由于患者經(jīng)常使用社交網(wǎng)絡(luò)分享就醫(yī)經(jīng)驗(yàn)和治療感想,,因此,,收集并分析社交網(wǎng)絡(luò)上的有關(guān)信息,有望提供能用于癌癥預(yù)防和治療以及完善醫(yī)醫(yī)療體系和政策的輔助信息,。
而確實(shí)也有研究人員使用機(jī)器學(xué)習(xí)算法和自然語言處理,,分析 Twitter 中什么樣的關(guān)鍵詞會(huì)觸發(fā)關(guān)注,哪些醫(yī)療信息更容易得到傳播,,這些信息都有助于健康政策以及疾病預(yù)防,。不僅如此,去年 BMJ 一篇論文描述了一個(gè)由美英科學(xué)家組成的團(tuán)隊(duì),,搜集人們?cè)?Twitter 上發(fā)送的消息,,評(píng)估患者就醫(yī)體驗(yàn),對(duì)于改善醫(yī)療體系也有幫助,。
人工智能能夠改善就醫(yī)體驗(yàn),,提高癌癥診斷正確率,加速新藥研發(fā),。隨著時(shí)間推移,,越來越多的醫(yī)藥研究者與計(jì)算機(jī)科學(xué)家合作,共同完善機(jī)器學(xué)習(xí)等人工智能在醫(yī)藥領(lǐng)域中的應(yīng)用,。不僅如此,,還可以看到一大批綜合性人才的崛起。既擁有醫(yī)藥學(xué)知識(shí),,又具備人工智能洞見的研究者,,將是未來醫(yī)藥界的發(fā)展基礎(chǔ)。
而且,,我們沒有理由不充滿信心——當(dāng)奧巴馬提出精準(zhǔn)醫(yī)療計(jì)劃,,宣稱要“治愈”癌癥時(shí),,很多美國醫(yī)藥界人士的反應(yīng)都比較積極,沒有人會(huì)天真地以為癌癥能被簡單“治愈”,,但他們很高興奧巴馬用了“治愈”這個(gè)詞,,這是人類一直努力的目標(biāo),有了人工智能,,只會(huì)讓我們更快達(dá)到那里,。
參考資料: 1. Watson Oncology,mskcc.org 2. BMJ 2015;351:h4901 3. Methods Inf Med. 1991Oct;30(4):241-55. 4. BMJ 2005;330:765 5. doi:10.1016/j.csbj.2014.11.005 6. CMAJ. 2013 Jun 11; 185(9): E367–E368. doi:10.1503/cmaj.109-444 7. Cruz JA, Wishart DS. Applications of Machine Learning inCancer Prediction and Prognosis. CancerInformatics. 2006;2:59-77. 8. Nature 512, 155–160 (14August 2014) doi:10.1038/nature13600 9. Nature Genetics 46, 225–233 (2014)doi:10.1038/ng.2891 10. Adamo A,, Beingessner RL,, Behnam M, Chen J,, Jamison TF,, et al. 2016. On-demand continuous-flowproduction of pharmaceuticals in a compact,reconfigurable system. Science 352:61-7 12. Cancer Discovery February2015 5:97-99; doi:10.1158/2159-8290.CD-ITI5-2 13. BMJ QualSaf doi:10.1136/bmjqs-2015-004309 14. Understanding Cancer-basedNetworks in Twitter using Social Network Analysis |
|