久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

當(dāng)機(jī)器學(xué)習(xí)邂逅基因組學(xué),,下一站遇見未來

 AndLib 2018-07-04

前段時(shí)候網(wǎng)上有段視頻給我留下了很深的印象,,是華大基因董事長(zhǎng)汪健的一個(gè)演講,其中提到了人工智能,,后來網(wǎng)上就有人依據(jù)汪健的這個(gè)演講得出了一個(gè)結(jié)論:人工智能是個(gè)偽命題,,隨之出現(xiàn)了一波不看好人工智能在醫(yī)學(xué)領(lǐng)域應(yīng)用的言論。其實(shí)認(rèn)真看過這個(gè)視頻的話,,就會(huì)發(fā)現(xiàn)這些言論未免有斷章取義的嫌疑,,汪健的本意是說人工智能只是一個(gè)工具,雖然是個(gè)很好用的工具,但醫(yī)學(xué)的進(jìn)步要靠科學(xué),,而不是靠工具,。他這個(gè)話其實(shí)并沒有錯(cuò),但他并沒有在否定人工智能,。


精準(zhǔn)醫(yī)療越來越受重視,,人工智能加上精準(zhǔn)醫(yī)療已經(jīng)成為了新的創(chuàng)業(yè)風(fēng)口,無數(shù)的創(chuàng)業(yè)公司在涌現(xiàn),,但一項(xiàng)新技術(shù)的出現(xiàn)一定會(huì)帶來樂觀的夸大或悲觀的預(yù)期,,由于人工智能的核心是機(jī)器學(xué)習(xí),而基因組學(xué)是筆者團(tuán)隊(duì)比較熟悉的領(lǐng)域,,也是推動(dòng)精準(zhǔn)醫(yī)療不可或缺的一部分,,接下來我們就一起為大家解讀一下機(jī)器學(xué)習(xí)在基因組學(xué)領(lǐng)域的應(yīng)用


文/田雨

編/HLR,,吳穎儀




1


機(jī)器學(xué)習(xí)&基因組學(xué)的概念

 

技術(shù)的進(jìn)步是不可阻擋的,,哪怕這個(gè)技術(shù)是一把雙刃劍,比如核技術(shù),。機(jī)器學(xué)習(xí)作為一個(gè)新技術(shù),,也一樣,它的進(jìn)步誰(shuí)也阻擋不了,,事實(shí)上機(jī)器學(xué)習(xí)早就已經(jīng)滲透到大眾生活的方方面面,,如果說AlphaGo戰(zhàn)勝李世石跟廣大吃瓜群眾并無多大關(guān)系的話,那Siri呢,?Google Assistant呢,?淘寶越來越精準(zhǔn),越來越深得你心的廣告投放呢,?還有前幾天海淀大街上溜達(dá)的那些送貨機(jī)器人呢,?是不是和多數(shù)人都密切相關(guān)了?這背后的核心技術(shù)都是機(jī)器學(xué)習(xí)啊,,汪健不是也說了這是個(gè)很有用的工具嗎,?那我們?yōu)槭裁匆芙^一個(gè)很好用的工具呢?


那我們就好好認(rèn)識(shí)一下這個(gè)工具吧,,先從背景術(shù)語(yǔ)入手,。  

  


機(jī)器學(xué)習(xí)是英文名稱Machine Learning(簡(jiǎn)稱ML)的直譯,在計(jì)算機(jī)界Machine一般是指計(jì)算機(jī),,所以,,機(jī)器學(xué)習(xí)字面上意思就是說讓計(jì)算機(jī)學(xué)習(xí),注意,,是“學(xué)習(xí)”,,不是“工作”,。想讓計(jì)算機(jī)工作,那直接編程就好了,,給它一系列的指令就可以了,,但學(xué)習(xí)就不一樣了,機(jī)器學(xué)習(xí)是希望能夠賦予計(jì)算機(jī)學(xué)習(xí)的能力以此讓它完成直接編程無法完成的功能,,也就是把人類思考?xì)w納經(jīng)驗(yàn)的過程轉(zhuǎn)化為計(jì)算機(jī)通過對(duì)數(shù)據(jù)的處理計(jì)算得出模型的過程,,進(jìn)而能夠以近似于人的方式解決很多靈活而復(fù)雜的問題。因此,,這是一門多領(lǐng)域交叉的學(xué)科,,涉及概率論、統(tǒng)計(jì)學(xué),、逼近論、凸分析,、算法復(fù)雜度理論等多門學(xué)科,。


說完了機(jī)器學(xué)習(xí),我們?cè)俸?jiǎn)單說一下基因組學(xué)genomics,,基因組學(xué)是是分子生物學(xué)的一個(gè)分支,,專注于研究一個(gè)基因組的所有方面,或者研究特定生物體內(nèi)的全套基因,。擁有了對(duì)DNA進(jìn)行測(cè)序的能力,,研究人員就能夠“讀取”指導(dǎo)有機(jī)體活動(dòng)的基因藍(lán)圖。能夠獲得基于4個(gè)基本堿基(A,,C,,G和T)的一份“密碼本”,這些密碼被進(jìn)一步組織成能編碼蛋白質(zhì)的DNA片段,,也就是基因,。人類有大約30億個(gè)堿基和2萬個(gè)基因。有機(jī)體擁有基因的總和被稱為基因組,?;蚪M就像一個(gè)底層的操作系統(tǒng),我們的一切生命過程都是在此基礎(chǔ)上運(yùn)行的,?;虺隽藛栴},上面再花哨的App都得崩潰,。


從上述的概念其實(shí)就不難看出機(jī)器學(xué)習(xí)和基因組學(xué)天生就有很多特質(zhì)是相互契合的,,大家都是要跟大數(shù)據(jù)過不去,你有0101,,我有ATCG,,機(jī)器學(xué)習(xí)靠的是相關(guān)性,而不是因果關(guān)系,無獨(dú)有偶,,關(guān)于基因和疾病的關(guān)系最初始也是最重要的一步就是確定二者的相關(guān)關(guān)系,,才能設(shè)計(jì)更多的實(shí)驗(yàn)去驗(yàn)證因果關(guān)系。那這些前世注定的緣分能否獲得三生三世十里桃花般的繁榮圖景呢,?我們從當(dāng)前的應(yīng)用出發(fā),,窺探一下其中的天機(jī)吧! 

  

▲  圖片來源: HIT consultant

               

基因組學(xué)最終是要為精準(zhǔn)醫(yī)療(Precision Medicine)服務(wù)的,,精準(zhǔn)醫(yī)療是一種將個(gè)人基因,、環(huán)境與生活習(xí)慣差異考慮在內(nèi)的疾病預(yù)防與處置的新興方法,目標(biāo)是實(shí)施患者或特定人群的治療干預(yù)。但是目前,,更大程度上實(shí)施精準(zhǔn)醫(yī)學(xué)存在兩大障礙:成本高和技術(shù)限制,。對(duì)我們做基因領(lǐng)域研究的人而言,幸運(yùn)的是,,基因組測(cè)序的成本在持續(xù)下降,,但是處理和分析收集到的大量患者數(shù)據(jù),依然有不小的成本問題和技術(shù)門檻,,所以許多研究人員正在實(shí)施機(jī)器學(xué)習(xí)技術(shù)來識(shí)別大量遺傳數(shù)據(jù)集中的模式,,然后將這些模式轉(zhuǎn)化為計(jì)算機(jī)模型,這可能有助于預(yù)測(cè)個(gè)體發(fā)展某些疾病的可能性或幫助獲取潛在治療設(shè)計(jì),。與此同時(shí)直接到消費(fèi)者的基因組學(xué)也在蓬勃發(fā)展,,這一類向個(gè)人消費(fèi)者提供的基因組測(cè)序服務(wù)也正在使用機(jī)器學(xué)習(xí)來解讀遺傳信息,探究基因如何影響個(gè)體的方方面面,。概括的說就是我們想要利用機(jī)器學(xué)習(xí)的優(yōu)勢(shì)幫助基因研究人員分析解讀數(shù)據(jù),,幫助臨床醫(yī)生提供患者護(hù)理,并使有興趣了解遺傳差異如何影響健康的人更容易接觸基因組學(xué)[1],。



2


機(jī)器學(xué)習(xí)在基因組學(xué)中的應(yīng)用


接下來,,我們具體看一下機(jī)器學(xué)習(xí)當(dāng)前在基因組學(xué)中的幾個(gè)主要應(yīng)用領(lǐng)域。


(1) - 基因組測(cè)序領(lǐng)域


全基因組測(cè)序(Whole Genome Sequencing,,WGS)已經(jīng)成為醫(yī)學(xué)診斷領(lǐng)域的熱點(diǎn),。新一代測(cè)序技術(shù)已成為一種流行詞,它涵蓋了現(xiàn)代DNA測(cè)序技術(shù),,使研究人員能夠在一天內(nèi)測(cè)序完整的人類基因組,,但是如何解釋這些遺傳變異依然是很大的工作量。于是有了諸如Deep Genomics等公司嘗試使用機(jī)器學(xué)習(xí)來幫助研究人員解釋遺傳變異,。具體來說,,算法是基于大型遺傳數(shù)據(jù)集中確定的模式進(jìn)行設(shè)計(jì)的,然后將其轉(zhuǎn)換為計(jì)算機(jī)模型,,以幫助客戶解釋遺傳變異如何影響關(guān)鍵的細(xì)胞過程比如代謝,,DNA修復(fù)還有細(xì)胞生長(zhǎng)以及破壞這些途徑的正常功能是否可能會(huì)導(dǎo)致癌癥或其他疾病,。這家總部位于多倫多的創(chuàng)業(yè)公司成立于2014年,已獲得來自三家美國(guó)風(fēng)險(xiǎn)投資公司(Bloomberg Beta,,Eleven Two Capital和True Ventures)的370萬美元種子資金,。加拿大政府最近向“泛加拿大人工智能戰(zhàn)略”撥款1.25億美元。截至2017年4月,,Deep Genomics已經(jīng)參與其中7項(xiàng)已公開發(fā)表的研究,,大多數(shù)是預(yù)測(cè)或推斷潛在遺傳變異的。



(2) - 基因編輯領(lǐng)域


基因編輯被定義為在細(xì)胞或生物體水平上對(duì)DNA進(jìn)行特定改變的方法,。CRISPR是一種基因編輯技術(shù),,可以提供更快,更便宜的基因編輯方式,。為了使用CRISPR,,研究人員必須首先選擇合適的靶序列。這可能是一個(gè)艱巨的過程,,涉及許多選擇和不可預(yù)知的結(jié)果,。機(jī)器學(xué)習(xí)擁有可以顯著減少識(shí)別合適目標(biāo)序列所必需的時(shí)間和成本[2]。  



位于倫敦的Desktop Genetics是一家融合了AI和CRISPR的軟件公司,。該公司成立于2012年,已累計(jì)從7家投資公司獲得580萬美元的股權(quán)融資,,其中包括了創(chuàng)業(yè)加速器,,風(fēng)險(xiǎn)投資公司和生物技術(shù)公司以及DNA測(cè)序經(jīng)驗(yàn)豐富的Illumina。

該公司主要的項(xiàng)目流程首先是將實(shí)驗(yàn)數(shù)據(jù)上傳到Google 云平臺(tái)上, 在云平臺(tái)上進(jìn)行數(shù)據(jù)的格式化和處理,然后由公司的生物信息學(xué)和機(jī)器學(xué)習(xí)團(tuán)隊(duì)利用這些數(shù)據(jù),,分析和設(shè)計(jì)CRISPR實(shí)驗(yàn)或訓(xùn)練新模型,。 使得新的CRISPR設(shè)計(jì)可以在實(shí)驗(yàn)室中進(jìn)行測(cè)試,并衍生出FASTQ數(shù)據(jù),,并再次反饋到工作流程中,。

  

  

▲ 圖片來源:DeskGen.com


該公司報(bào)告了最近一項(xiàng)研究的兩項(xiàng)重要發(fā)現(xiàn):1)增加訓(xùn)練數(shù)據(jù)量能提高預(yù)測(cè)CRISPR活性算法的準(zhǔn)確性; 2)當(dāng)應(yīng)用于不同物種時(shí),模型的準(zhǔn)確性降低,,例如人類與老鼠,。這些研究結(jié)果都不是特別令人驚訝,Desktop Genetics承認(rèn),,需要廣泛的研究來繼續(xù)改進(jìn)流程,,并通過推動(dòng)機(jī)器學(xué)習(xí)來影響CRISPR。


(3) - 臨床工作流程


為患者服務(wù)的醫(yī)療團(tuán)隊(duì)的不同成員可以獲得的患者數(shù)據(jù)經(jīng)常存在著空缺,。這一挑戰(zhàn)引發(fā)了人們使用機(jī)器學(xué)習(xí)來提高臨床工作流程效率的興趣,。Intel設(shè)計(jì)了一款將機(jī)器學(xué)習(xí)功能集成到臨床工作流程中的分析工具包。目前英特爾與猶他州鹽湖城Intermountain醫(yī)療保健轉(zhuǎn)型實(shí)驗(yàn)室合作,,嘗試更有效地將遺傳學(xué)數(shù)據(jù)和其它臨床數(shù)據(jù)進(jìn)行整合,用于指導(dǎo)乳腺癌的治療和對(duì)患者護(hù)理[3],。



 雙方合作開發(fā)了一種算法來衡量諸如患者發(fā)展多種癌癥的風(fēng)險(xiǎn)水平等因素,。該工作流模型基于四大前提開發(fā):


1. 與“臨床和患者數(shù)據(jù)”相關(guān)聯(lián)的基因組數(shù)據(jù)集中數(shù)據(jù)庫(kù)

2. 所有臨床醫(yī)生和遺傳咨詢師都可以訪問電子健康記錄(Electronic Health Records EHR)

3. 所有來自基因測(cè)試的數(shù)據(jù)都被整合到電子健康記錄

4. 臨床決策支持工具可操作且可訪問。臨床決策支持的例子包括家庭健康史,,篩查和過去的臨床數(shù)據(jù),。


據(jù)報(bào)道,英特爾的風(fēng)險(xiǎn)投資部門Intel Capital已經(jīng)投資了超過二十多家AI實(shí)體,,與其他專注于某一領(lǐng)域的垂直行業(yè)相比Intel在醫(yī)療領(lǐng)域的投資明顯有著相對(duì)走高的趨勢(shì),。


(4) - 直接對(duì)消費(fèi)者的基因組學(xué)


有人估計(jì)到2025年預(yù)測(cè)性基因測(cè)試和消費(fèi)者基因組市場(chǎng)價(jià)值將達(dá)到46億美元。預(yù)計(jì)市場(chǎng)擴(kuò)張的原因也很簡(jiǎn)單,,生存是生物的本能,,更好的生存是人類的本能,人們會(huì)越來越意識(shí)到基因組測(cè)試的重要性,,通過測(cè)序幫助確定發(fā)生特定疾病的可能性,,并在適當(dāng)?shù)闹笇?dǎo)下進(jìn)行預(yù)防,比如2013年美國(guó)演員安吉麗娜朱莉通過基因檢測(cè),,發(fā)現(xiàn)乳腺癌高風(fēng)險(xiǎn)后切除乳腺,,這事兒當(dāng)年引發(fā)了一大堆的熱議,有人說這是朱莉和麥利亞德基因公司(Myriad Genetics,,Inc.)聯(lián)手的公關(guān)秀,,因?yàn)辂溊麃喌乱恢鄙钕菰V訟之中,這家公司其實(shí)也夠勵(lì)志的,,花17年時(shí)間砸5億美元才開始獲得盈利,,然后最近20年一直在打官司,不過這里面涉及太多法律倫理層面的問題,。


我在這里想說的是:大家有沒有注意到,,朱莉基于基因檢測(cè)的結(jié)果作出切除乳腺的這一決定本身沒有被質(zhì)疑,當(dāng)年華大基因,,健康腫瘤項(xiàng)目的負(fù)責(zé)人劉永強(qiáng)就給出過肯定的回答,。所以盡管監(jiān)管問題以及醫(yī)療專業(yè)人員在幫助個(gè)人解讀其測(cè)試結(jié)果方面的作用目前依然沒有得到解決,但直接面向消費(fèi)者的基因組學(xué)是一個(gè)快速發(fā)展的行業(yè),,23 and Me 和Ancestry等領(lǐng)先的基因檢測(cè)公司公司也正在成為家喻戶曉的名字,。



23 and Me最近將來自600,000名研究參與者的數(shù)據(jù)與機(jī)器學(xué)習(xí)相結(jié)合,為遺傳重量報(bào)告(Genetic Weight Report)開發(fā)了一個(gè)模型,。該報(bào)告旨在提供關(guān)于個(gè)體遺傳基因如何影響體重的個(gè)性化分析,。用于開發(fā)每份報(bào)告的獨(dú)特因素包括“基因型,性別,,年齡和自我鑒定的主要祖先”,。這些因素可以從客戶的遺傳信息中確定,也可以根據(jù)在訪問報(bào)告前進(jìn)行的調(diào)查得出,。


▲ 圖片來源23 and Me


23 and Me迄今為止已擁有超過200萬的客戶,,所做的可不止遺傳體重報(bào)告這么一件事,,F(xiàn)DA已批準(zhǔn)了23 and me用于檢測(cè)阿爾茨海默病、帕金森病,、乳腺癌和卵巢癌等疾病的基因檢測(cè)產(chǎn)品,,隨著測(cè)試樣本數(shù)的增加和機(jī)器學(xué)習(xí)的應(yīng)用,未來應(yīng)當(dāng)可以建立更多疾病模型,。退一步講單純遺傳重量報(bào)告對(duì)其他相關(guān)行業(yè)未來的商業(yè)模式可能產(chǎn)生的影響都不可小覷,。

  


Ancestry.com LLC則是一家位于猶他州的私人在線公司。它是世界上最大的盈利家譜公司,,它運(yùn)營(yíng)著一個(gè)家譜,、歷史記錄和遺傳家譜網(wǎng)站ancestry.com,這是一個(gè)在線族譜社區(qū),,擁有龐大的家族關(guān)系數(shù)據(jù)量,,人們可以進(jìn)行進(jìn)行家族尋根,同時(shí)用戶在網(wǎng)站上的活動(dòng)其實(shí)也在為Ancestry提供線索,。Ancestry LLC的子公司AncestryDNA則提供直接面向消費(fèi)者的系譜DNA測(cè)試,。目前AncestryDNA已經(jīng)擁有超過700萬的客戶。

  


3


結(jié)語(yǔ)


基因組學(xué)中的機(jī)器學(xué)習(xí)目前正在影響著該領(lǐng)域的多個(gè)接觸點(diǎn),。努力實(shí)施機(jī)器學(xué)習(xí)以幫助加快科學(xué)數(shù)據(jù)從實(shí)驗(yàn)室到臨床的應(yīng)用路徑并使精準(zhǔn)醫(yī)學(xué)更為普及,,是智能商業(yè)未來所要面臨的機(jī)遇和挑戰(zhàn),因?yàn)槭袌?chǎng)是不會(huì)放棄人工智能在醫(yī)療保健方面的巨大經(jīng)濟(jì)價(jià)值的,。


我們也將繼續(xù)密切關(guān)注基因組學(xué)領(lǐng)域,,相信該領(lǐng)域會(huì)是近期機(jī)器學(xué)習(xí)應(yīng)用的活躍領(lǐng)域。

  



參考資料:

1.Barriers to Implementation of Precision Medicine for Cancer Treatment in the U.S. Healthcare System

http://www./wp-content/uploads/2016/07/Madhavan.pdf

2.Deep Genomics is using artificial intelligence to build a new universe of life-saving genetic therapies

https://www./organization/deep-genomics#/entity

3. Integrating Genetic Data into Clinical Workflow with Clinical Decision Support Apps

https://www.intel.com/content/dam/www/public/us/en/documents/white-papers/integrating-genetic-data-intermountain-healthcare-paper.pdf


本期作者:田雨
畢業(yè)于北京大學(xué)口腔醫(yī)學(xué)院,,2010年于北京大學(xué)獲得博士學(xué)位。2017年于美國(guó)貝勒牙科學(xué)院訪問學(xué)習(xí),,從事口腔多基因遺傳病研究,,對(duì)行業(yè)分析和相關(guān)技術(shù)前沿有濃厚興趣,長(zhǎng)期關(guān)注基因行業(yè)的市場(chǎng)動(dòng)向?,F(xiàn)任美柏醫(yī)健研究員,。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,,不代表本站觀點(diǎn),。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,,謹(jǐn)防詐騙,。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào),。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多