機(jī)器學(xué)習(xí)改善癌癥診療,，人工智能革新醫(yī)藥產(chǎn)業(yè)

圖靈狗 2016-08-11

展開全文

1 新智元原創(chuàng)

作者：趙以文

HighLights

某些癌癥100% “攻克”已不再是遙不可及的夢(mèng)想，人工智能將革新醫(yī)藥產(chǎn)業(yè)運(yùn)作方式,。
假設(shè)你點(diǎn)擊“確定”,，系統(tǒng)在 5 次中只有 1 次真正確定，剩下 4 次都彈出窗口“請(qǐng)?jiān)僭囈淮巍?，你?huì)是什么感受,？
但就像你不能在路邊攔一個(gè)人就讓他百米跑進(jìn) 7 秒,，醫(yī)生要跟上如今醫(yī)學(xué)發(fā)展的速度，每周至少要花 160 小時(shí)閱讀新發(fā)表的文獻(xiàn),，而一周總共只有 168 小時(shí),。

有些事，只靠人力就是沒法做到,。

由此,，MSKCC （凱特琳癌癥中心）跟 IBM 合作，利用超級(jí)計(jì)算機(jī)IBM Watson 吸收知識(shí)的能力,，擴(kuò)展人類的極限：IBM Watson 每秒能夠掃描上萬億字節(jié)的醫(yī)療數(shù)據(jù),，而且“過目不忘”，再結(jié)合強(qiáng)大的機(jī)器學(xué)習(xí)算法,，從大量結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)中得出洞察,，進(jìn)而助力醫(yī)生做出更加個(gè)性化的的治療方案。

在福布斯的報(bào)道中,，與IBM Watson 合作的醫(yī)療機(jī)構(gòu)Wellpoint的醫(yī)生表示,，試驗(yàn)中IBM Watson 對(duì)肺癌診斷正確的幾率為 90%，而人類醫(yī)生只有 50%,。使用IBM Watson 參與臨床教學(xué)的醫(yī)院 Cleveland Clinic 的醫(yī)生都經(jīng)常為IBM Watson 給出的建議治療方案感到驚嘆：“為什么我（們）當(dāng)初就沒有想到那一點(diǎn),？！”

讓機(jī)器從數(shù)據(jù)中找規(guī)律

雖然“科學(xué)和技術(shù)飛速發(fā)展”已成了老生常談,，而癌癥診療還是一個(gè)充滿迷思的領(lǐng)域,。目前，人們經(jīng)常提及并感到恐懼的癌癥包含：“肺癌”“乳腺癌”等,。

借助基因檢測(cè)等生物信息技術(shù),，我們知道，所謂的“肺癌”“腎癌”“乳腺癌”,，實(shí)際上是對(duì)成千上萬種不同的細(xì)胞突變模式或錯(cuò)誤排列的總稱,。根據(jù) 2015 年一篇研究腎癌的論文，正如世界上沒有兩片一模一樣的樹葉,，地球上也沒有兩個(gè)一模一樣的腫瘤,；還有研究發(fā)現(xiàn)，就連同一個(gè)人的同一個(gè)腫瘤里面,，也沒有兩個(gè)細(xì)胞在遺傳基因上是一樣的,。

了解這一點(diǎn)，對(duì)癌癥診療十分關(guān)鍵,。目前,，癌癥診斷幾乎全都是靠“看”：人類醫(yī)生在顯微鏡下觀看細(xì)胞或組織樣本，有時(shí)候?qū)?xì)胞DNA、RNA 或者蛋白質(zhì)的一些測(cè)試結(jié)果可以幫助醫(yī)生做出判斷——但歸根結(jié)底,，還是靠“看”。據(jù)媒體報(bào)道,，2014 年,，美國肺癌、乳腺癌和皮膚癌的死亡率將近 40%,，所以對(duì)于癌癥而言,，早發(fā)現(xiàn)早治療非常關(guān)鍵。

靶向藥物及療法的出現(xiàn),，使癌癥醫(yī)療情形大為改觀,。所謂“靶向治療”，就是針對(duì)含有某種癌癥有關(guān)的基因突變的細(xì)胞,，開發(fā)“靶向藥物”,，要么殺死這些細(xì)胞，要么使其不能復(fù)制,。然而,，據(jù)統(tǒng)計(jì)，目前癌癥藥物治療有效——即腫瘤體積顯著縮小——比例只有 22%,。也就是說,，再怎么“靶向”，當(dāng)靶子的數(shù)量太多時(shí),，治療也鞭長莫及,。

如何從大量雜亂無章的信息中發(fā)現(xiàn)模式并找出規(guī)律？

很容易想到的方法是,，借助機(jī)器的計(jì)算力分析并預(yù)測(cè)醫(yī)療數(shù)據(jù),。1991年，用于醫(yī)學(xué)診斷的簡單貝葉斯方法 QMR 模型被提出,。1994 年,，《美國醫(yī)學(xué)信息學(xué)會(huì)》（JAMIA）發(fā)表了題為《醫(yī)療診斷決策支持系統(tǒng)：過去、現(xiàn)在和未來》的調(diào)查文章,。2005 年,，《英國醫(yī)學(xué)雜志》（BMJ）發(fā)表了題為《用臨床決策支持系統(tǒng)提高臨床實(shí)踐》的論文。

近年來,，隨著計(jì)算能力的提升和相關(guān)醫(yī)療大數(shù)據(jù)的發(fā)展,，越來越多的醫(yī)生開始使用機(jī)器學(xué)習(xí)幫助癌癥診斷。機(jī)器學(xué)習(xí)算法使用各種統(tǒng)計(jì),、概率和優(yōu)化方法讓計(jì)算機(jī)從輸入中“學(xué)習(xí)”,，從海量非結(jié)構(gòu)化的數(shù)據(jù)中識(shí)別出人類難以識(shí)別的模式。除了癌癥診斷，機(jī)器學(xué)習(xí)也可以用于癌癥預(yù)后及復(fù)發(fā)的判斷,。

在癌癥診斷中使用的機(jī)器學(xué)習(xí)算法主要有三種：監(jiān)督學(xué)習(xí),、無監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。在監(jiān)督學(xué)習(xí)的情況下,，癌癥診斷可以簡化為“分類”：模型根據(jù)訓(xùn)練結(jié)果,，將輸入的數(shù)據(jù)分為幾類。假設(shè)采集了與乳腺癌有關(guān)的數(shù)據(jù),，根據(jù)腫瘤的大小判斷該腫瘤是良性還是惡性,，那么機(jī)器學(xué)習(xí)模型要問答的問題，就成了估計(jì)這個(gè)腫瘤是良性（或惡性）的概率,，如下圖,。

還一種廣泛使用的機(jī)器學(xué)習(xí)方法是半監(jiān)督學(xué)習(xí)，也就是監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)的結(jié)合,。采用半監(jiān)督學(xué)習(xí)時(shí),，輸入的數(shù)據(jù)有的打了標(biāo)簽，有的則沒有標(biāo)簽,，通常沒有標(biāo)簽的數(shù)據(jù)會(huì)更多,。完善標(biāo)簽的質(zhì)量后，機(jī)器學(xué)習(xí)算法相比一般的預(yù)測(cè)模型,，正確率會(huì)有大幅提升,。

機(jī)器學(xué)習(xí)算法	優(yōu)勢(shì)	局限
決策樹	簡單好用、可以通過pruning處理過度擬合問題	各項(xiàng)必須互斥,、最終決策樹取決于選項(xiàng)輸入的順序,，訓(xùn)練集錯(cuò)誤會(huì)影響整個(gè)決策樹
Na?ve Bayes	廣泛適用、效率高,，輸入不分前后	假設(shè)各項(xiàng)獨(dú)立,，假定各屬性正態(tài)分布，選項(xiàng)和分類頻率影響精度
k臨近分類	分類快,、非線性問題,，可接受非結(jié)構(gòu)化輸入	假設(shè)各項(xiàng)同樣重要，輸入項(xiàng)增加計(jì)算量劇增
神經(jīng)網(wǎng)絡(luò)	可用于分類和回歸,，可接受非結(jié)構(gòu)化輸入及無標(biāo)簽輸入	算法黑箱,，難以評(píng)估
SVM	非線性問題,，復(fù)雜度可控	訓(xùn)練數(shù)據(jù)不是線性可分時(shí)很難確定最佳參數(shù),，比貝葉斯和決策樹的訓(xùn)練速度慢
遺傳算法	可用于特征歸類和特征選擇,，主要用于優(yōu)化,，能得出一個(gè)“好”的答案，但并不一定是“最優(yōu)解”	最優(yōu)方法不一定全局性,，輸入/輸出復(fù)雜性與選項(xiàng)表征有關(guān)

2016 年１月,，羅氏制藥收購了名不見經(jīng)傳的Foundation Medicine,，獲得了 3.5 萬份癌癥基因測(cè)序及其推薦治療方案。2016 年 4 月,，由原華大基因CEO王俊創(chuàng)辦的碳云智能對(duì)外公布 A 輪接受融資,，估值 10 億美元，要構(gòu)建健康大數(shù)據(jù)平臺(tái),，整合遺傳,、醫(yī)療、營養(yǎng)乃至美容健身等各類健康數(shù)據(jù)資源,。像這樣的例子還有很多很多，奧巴馬政府去年初提出的“精準(zhǔn)醫(yī)療計(jì)劃”,、“Cancer Moonshot”,，也都是想利用大數(shù)據(jù)和人工智能幫助人類醫(yī)生，提升癌癥的治愈率,。

目前,，對(duì)于某些疾病，算法的準(zhǔn)確度已經(jīng)足夠高,，遠(yuǎn)遠(yuǎn)超過人類醫(yī)生,。越來越多的人類醫(yī)生開始意識(shí)到，借助機(jī)器學(xué)習(xí),，他們能夠快速精準(zhǔn)地獲得臨床有用的醫(yī)療信息,。

醫(yī)藥步入“智能化”

目前，每年花費(fèi)在抗癌藥物研發(fā)的大量資源中,，有很多都浪費(fèi)在了所謂的“試錯(cuò)”上面,。近年來計(jì)算機(jī)科學(xué)的發(fā)展，讓很多醫(yī)療機(jī)構(gòu)都將認(rèn)知計(jì)算和大數(shù)據(jù)用于癌癥診療,，IBM 算是較早就開始嘗試這一點(diǎn),；截止 2015 年底，IBM Watson 閱讀了 1967 年到 2000 年的 470 萬份專利和 1100 萬份醫(yī)藥期刊,，并從中生成了 250 多萬種新的化合物,，構(gòu)建了一個(gè)強(qiáng)大的數(shù)據(jù)庫（Strategic IP Insight Platform）——就像計(jì)算材料科學(xué)家使用機(jī)器學(xué)習(xí)算法加速新材料的發(fā)現(xiàn)，此舉也將有望大舉加速抗癌新藥的研發(fā),。

不僅如此,，機(jī)器算法還能提升現(xiàn)有癌癥藥物的使用率。UCSF 研究人員開發(fā)了一種能夠系統(tǒng)性篩選現(xiàn)有癌癥藥物的程序,，并檢測(cè)了 90 種現(xiàn)有抗癌藥各自針對(duì) 51 種基因突變的治療效果,。根據(jù)去年在 Cancer Discovery 發(fā)表的論文，該團(tuán)隊(duì)已經(jīng)發(fā)現(xiàn)了超過 10 種有望進(jìn)入臨床試驗(yàn)的藥物,，其中包括一些此前根本沒人想到的方案,，比如原本為了 AA 基因突變研發(fā)的 aa 藥，實(shí)際上對(duì) BB 基因突的治療結(jié)果更好，乃至可以進(jìn)入臨床試驗(yàn),。

不單藥物研發(fā)理論,，人工智能在實(shí)際藥物生產(chǎn)過程中也起到了很大的加速作用。前不久,，MIT的 3 名教授在 Science 發(fā)表論文,，宣布團(tuán)隊(duì)成功將制藥工廠裝進(jìn)了“電冰箱”。研究人員在論文中描述了一款電冰箱大小的一體化制藥機(jī)原型,。

據(jù)介紹,，這臺(tái)制藥機(jī)一天之內(nèi)可以生產(chǎn) 1000 劑量的藥片，將制藥速度提升了 10 倍,，目前已經(jīng)可以生產(chǎn)Benadryl,、lidocaine、Valium和Prozac 這 4 種常用藥,。這款制藥機(jī)獨(dú)特的地方在于,，它將傳統(tǒng)制藥過程中的電路、加熱器,、混合器,、反應(yīng)器等設(shè)備，集成為一個(gè)電冰箱大小的封閉工作站,。一般而言,，合成藥物所需要的溫度、壓強(qiáng)等參數(shù)都可以事先設(shè)置好,，只有個(gè)別步驟需要技術(shù)人員控制或者加入原料,。這臺(tái)機(jī)器可以根據(jù)藥物的特點(diǎn)，調(diào)整參數(shù)和配件,，以往需要多個(gè)工廠聯(lián)合生產(chǎn)的藥物,，只用這一臺(tái)機(jī)器就能夠完成。

最后,，從藥物研發(fā)出來到經(jīng)過批準(zhǔn)上市,，一般也需要長達(dá)幾年甚至幾十年的時(shí)間，這對(duì)癌癥患者而言,，恐怕比金錢更加難以承受,。新智元智庫專家王飛躍教授在《虛擬現(xiàn)實(shí)：平行也可以相交》一文中指出：“現(xiàn)在制定和實(shí)施一項(xiàng)社會(huì)政策，往往需要多年才能檢驗(yàn)到實(shí)際效果,。如果有虛擬現(xiàn)實(shí)構(gòu)造的人工社會(huì)模型,，政策制定后，拿虛擬人做試驗(yàn)品,，在‘計(jì)算’試驗(yàn)中發(fā)現(xiàn)政策中的可能漏洞,，推理中的可能局限甚至偏見,，再通過虛擬現(xiàn)實(shí)把邏輯上的錯(cuò)誤和個(gè)人的私利盡可能剔除出來加以修正。通過智能系統(tǒng)選擇最優(yōu)化的方案,，而不是拿實(shí)際的人力,、資源、財(cái)政來試錯(cuò),。

此外,，還可以在虛擬和物理社會(huì)中同時(shí)實(shí)施政策，比較兩者的結(jié)果,，如果兩者不一樣,，之間的差別就變成了修正政策的反饋信號(hào)。是不是當(dāng)時(shí)的假設(shè)錯(cuò)了,？如果假設(shè)沒錯(cuò)是不是現(xiàn)實(shí)社會(huì)中有人搞了鬼,？通過虛擬現(xiàn)實(shí)，形成閉環(huán)的,、有反饋的虛實(shí)互動(dòng)，最后走向虛實(shí)一體,、知行合一,。不單是社會(huì)政策，未來甚至每個(gè)人每做一件事之前都應(yīng)該先虛擬化,，模擬每一步有什么目標(biāo),，怎樣實(shí)現(xiàn)，這就是知識(shí)自動(dòng)化的第一步,，由于效率提高節(jié)省出來的時(shí)間將被用到事前虛擬中去,，不難設(shè)想，事前虛擬將減少許多社會(huì)矛盾和資源浪費(fèi),?！蓖瑯樱覀円材軙诚?，未來將虛擬現(xiàn)實(shí)應(yīng)用于藥物臨床試驗(yàn),，必將極大縮短藥物從研發(fā)到上市的時(shí)間，此外還能解決樣本少,、減輕臨床試驗(yàn)者痛苦等其他問題,。

目前，有幾百個(gè)基因療法正在研發(fā)之中,，對(duì)于大約5000種由單一基因錯(cuò)誤導(dǎo)致的罕見疾病來說,，很多療法都將是百分百治愈的。

沒有理由不充滿信心——AI將真正成為醫(yī)護(hù)人員助手

或許上面說的這些看起來都很遙遠(yuǎn),，實(shí)際上機(jī)器學(xué)習(xí)已經(jīng)投入實(shí)用,，在美國有很多醫(yī)生和護(hù)士都會(huì)利用機(jī)器進(jìn)行決策,。

醫(yī)療公司輝瑞和IBM合作，利用認(rèn)知計(jì)算解析復(fù)雜數(shù)據(jù)的能力,，整合可擴(kuò)展的測(cè)量和分析系統(tǒng),，預(yù)計(jì)推行 24 小時(shí)全天候的病患監(jiān)測(cè)，為患者提供更好的治療,。

在中國,，以房顫病人需接受干預(yù)為例，借助IBM認(rèn)知醫(yī)療數(shù)據(jù)模型的確認(rèn)和精準(zhǔn)化分析,，某些城市的醫(yī)院已經(jīng)實(shí)現(xiàn)了卒中（中風(fēng)）風(fēng)險(xiǎn)預(yù)測(cè)精度提高,，在高風(fēng)險(xiǎn)病人中精確地找到真正需要干預(yù)的病人，極大降低病人不必要的醫(yī)療花費(fèi),。

就在常用的社交網(wǎng)絡(luò)中,，也埋藏著大量有助于癌癥診療及預(yù)防的信息。由于患者經(jīng)常使用社交網(wǎng)絡(luò)分享就醫(yī)經(jīng)驗(yàn)和治療感想,，因此,，收集并分析社交網(wǎng)絡(luò)上的有關(guān)信息，有望提供能用于癌癥預(yù)防和治療以及完善醫(yī)醫(yī)療體系和政策的輔助信息,。

而確實(shí)也有研究人員使用機(jī)器學(xué)習(xí)算法和自然語言處理,，分析 Twitter 中什么樣的關(guān)鍵詞會(huì)觸發(fā)關(guān)注，哪些醫(yī)療信息更容易得到傳播,，這些信息都有助于健康政策以及疾病預(yù)防,。不僅如此，去年 BMJ 一篇論文描述了一個(gè)由美英科學(xué)家組成的團(tuán)隊(duì),，搜集人們?cè)?Twitter 上發(fā)送的消息,，評(píng)估患者就醫(yī)體驗(yàn)，對(duì)于改善醫(yī)療體系也有幫助,。

人工智能能夠改善就醫(yī)體驗(yàn),，提高癌癥診斷正確率，加速新藥研發(fā),。隨著時(shí)間推移,，越來越多的醫(yī)藥研究者與計(jì)算機(jī)科學(xué)家合作，共同完善機(jī)器學(xué)習(xí)等人工智能在醫(yī)藥領(lǐng)域中的應(yīng)用,。不僅如此,，還可以看到一大批綜合性人才的崛起。既擁有醫(yī)藥學(xué)知識(shí),，又具備人工智能洞見的研究者,，將是未來醫(yī)藥界的發(fā)展基礎(chǔ)。

而且,，我們沒有理由不充滿信心——當(dāng)奧巴馬提出精準(zhǔn)醫(yī)療計(jì)劃,，宣稱要“治愈”癌癥時(shí),，很多美國醫(yī)藥界人士的反應(yīng)都比較積極，沒有人會(huì)天真地以為癌癥能被簡單“治愈”,，但他們很高興奧巴馬用了“治愈”這個(gè)詞,，這是人類一直努力的目標(biāo)，有了人工智能,，只會(huì)讓我們更快達(dá)到那里,。

參考資料：

1. Watson Oncology，mskcc.org

2. BMJ 2015;351:h4901

3. Methods Inf Med. 1991Oct;30(4):241-55.

4. BMJ 2005;330:765

5. doi:10.1016/j.csbj.2014.11.005

6. CMAJ. 2013 Jun 11; 185(9): E367–E368. doi:10.1503/cmaj.109-444

7. Cruz JA, Wishart DS. Applications of Machine Learning inCancer Prediction and Prognosis. CancerInformatics. 2006;2:59-77.

8. Nature 512, 155–160 (14August 2014) doi:10.1038/nature13600

9. Nature Genetics 46, 225–233 (2014)doi:10.1038/ng.2891

10. Adamo A,， Beingessner RL,， Behnam M， Chen J,， Jamison TF,， et al. 2016. On-demand continuous-flowproduction of pharmaceuticals in a compact，reconfigurable system. Science 352：61-7

12. Cancer Discovery February2015 5:97-99; doi:10.1158/2159-8290.CD-ITI5-2

13. BMJ QualSaf doi:10.1136/bmjqs-2015-004309

14. Understanding Cancer-basedNetworks in Twitter using Social Network Analysis

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,，所有內(nèi)容均由用戶發(fā)布,，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式,、誘導(dǎo)購買等信息,，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

機(jī)器學(xué)習(xí)改善癌癥診療,，人工智能革新醫(yī)藥產(chǎn)業(yè)