久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

熱點追蹤 | AI在GWAS功能/轉(zhuǎn)化研究中的應(yīng)用

 尐尐呅 2023-07-03 發(fā)布于湖北

AI & GWAS

解碼疾病易感性是人類遺傳學(xué)和精準(zhǔn)醫(yī)學(xué)的核心問題,。人工智能(AI)技術(shù)已經(jīng)在解讀復(fù)雜的功能數(shù)據(jù)集并為GWAS發(fā)現(xiàn)提供新的生物學(xué)洞見方面展示出了可觀的前景,。近日,《Cell Genomics》發(fā)表perspective文章,,介紹了AI方法應(yīng)用于GWAS功能和轉(zhuǎn)化研究的進(jìn)展,、挑戰(zhàn)及建議,。

雖然GWAS已經(jīng)發(fā)現(xiàn)了數(shù)千個與疾病相關(guān)的位點,,但其中相當(dāng)一部分的分子機(jī)制仍需探究,。GWAS后續(xù)的邏輯步驟是解釋這些遺傳關(guān)聯(lián),以了解疾病的病因(GWAS功能研究),,并將這些知識轉(zhuǎn)化為患者的臨床益處(GWAS轉(zhuǎn)化研究),。盡管使用功能基因組學(xué)的各種數(shù)據(jù)集和方法已經(jīng)被開發(fā)出來以促進(jìn)這些研究,但由于數(shù)據(jù)的異質(zhì)性,、多樣性和高維度,,仍然存在重大的挑戰(zhàn)。人工智能 (AI) 技術(shù)可用于應(yīng)對處理多樣化和異構(gòu)數(shù)據(jù)的這些挑戰(zhàn),。

AI技術(shù)驅(qū)動GWAS功能研究

解碼非編碼變異的影響

早期的AI成果之一包括深度學(xué)習(xí)方法 DeepBind,,它可以預(yù)測DNA和RNA結(jié)合蛋白的序列特異性,與此前利用廣泛生物學(xué)知識開發(fā)的方法相比,,DeepBind可以發(fā)現(xiàn)調(diào)控基序并解釋遺傳變異的影響,。最近基于AI 的開發(fā)使DNA序列能夠映射到整個基因組中可解釋的調(diào)控類別,這個名為Sei的深度學(xué)習(xí)模型,,經(jīng)過訓(xùn)練可以預(yù)測超過20,000個特征,。通過將全基因組預(yù)測聚類并定義為40個調(diào)控類別(例如啟動子、細(xì)胞類型特異性增強(qiáng)子),,Sei可以預(yù)測任何感興趣的序列或變異的影響,,包括之前未在GWAS中研究過的那些。這些示例強(qiáng)調(diào)了基于人工智能的方法有能力使用復(fù)雜和多維的數(shù)據(jù)集,,以更可解釋和可擴(kuò)展的方式預(yù)測非編碼GWAS變異的影響,。

將變異與基因聯(lián)系起來

分子QTL或染色質(zhì)相互作用方法已被用于將變異與它們調(diào)節(jié)的靶基因聯(lián)系起來,但它們通常提供互補(bǔ)或不一致的結(jié)果,,因此準(zhǔn)確權(quán)衡這些復(fù)雜性以達(dá)成共識是具有挑戰(zhàn)性的,。為了解決這個問題,Open Targets的研究人員開發(fā)了一個系統(tǒng)框架,,用于整合GWAS和功能數(shù)據(jù),,并開發(fā)機(jī)器學(xué)習(xí)模型以識別跨GWAS位點的目標(biāo)基因。具體而言,,他們在進(jìn)行精細(xì)定位和共定位分析方面建立了統(tǒng)一的流程,,并將其與GWAS和其他功能數(shù)據(jù)整合,從而在基因座水平上產(chǎn)生了四個主要特征類別:計算機(jī)致病性預(yù)測,、分子QTL的共定位,、染色質(zhì)相互作用,以及通過精細(xì)映射概率加權(quán)的可信集變異的基因距離,。

解碼細(xì)胞類型特異性并預(yù)測下游通路

AI技術(shù)已經(jīng)被用來處理單細(xì)胞數(shù)據(jù)集并解碼GWAS發(fā)現(xiàn)的細(xì)胞類型特異性,。例如,,通過對代表13種人類視網(wǎng)膜細(xì)胞類型的50,000多個細(xì)胞進(jìn)行轉(zhuǎn)座酶可及性染色質(zhì)測序(ATAC-seq)的單細(xì)胞檢測,訓(xùn)練了一個深度學(xué)習(xí)模型,,可以預(yù)測每種細(xì)胞類型特異的參考和替代等位基因之間染色質(zhì)可及性的堿基差異,。

基于機(jī)器學(xué)習(xí)的流程(例如彈性網(wǎng)絡(luò)回歸)被證明可以通過將單細(xì)胞多模式數(shù)據(jù)與GWAS變異相結(jié)合來識別細(xì)胞類型特異性GRN和細(xì)胞類型特異的疾病基因,這改進(jìn)了臨床表型預(yù)測,。深度卷積神經(jīng)網(wǎng)絡(luò)也被用于推斷基因-基因關(guān)系和疾病因果關(guān)系,。這種方法使用來自復(fù)雜單細(xì)胞數(shù)據(jù)的基因表達(dá)水平,將其轉(zhuǎn)換為2D直方圖的圖像,,作為深度學(xué)習(xí)過程的輸入,,這在預(yù)測TF目標(biāo)基因和路徑內(nèi)的因果關(guān)系(方向)方面優(yōu)于以前的方法。這些研究展示了機(jī)器學(xué)習(xí)算法在處理單細(xì)胞數(shù)據(jù)集,、表征GWAS風(fēng)險位點及其相互作用和下游途徑方面的優(yōu)點,。

GWAS轉(zhuǎn)化研究中即將出現(xiàn)的突破性進(jìn)展

藥物再利用的候選靶標(biāo)

PandaOmics是一個使用深度學(xué)習(xí)模型以候選藥物在5年內(nèi)進(jìn)入臨床試驗第一階段可能性的形式預(yù)測藥物靶點潛力的平臺。他們的模型包括“組學(xué)評分”和“文本評分”,。組學(xué)評分考慮了所有可用的遺傳數(shù)據(jù)集,,如GWAS發(fā)現(xiàn)和MR或TWAS確定的基因疾病關(guān)聯(lián)。文本評分基于文獻(xiàn),、授權(quán)和專利搜索,。這些模型已被應(yīng)用于識別肌萎縮側(cè)索硬化癥的候選藥物靶點。Open targets開發(fā)的另一個平臺將來自開放獲取表達(dá)譜的組織特異性,、來自GO的生物學(xué)知識和蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò)集成到機(jī)器學(xué)習(xí)模型中,。這些研究表明,人工智能在將多維知識轉(zhuǎn)化為GWAS知情的藥物優(yōu)先級方面具有價值,。

PRS

PRS的辨別能力受到復(fù)雜疾病的多因素影響,,為了解決這個問題,針對心血管疾病風(fēng)險開發(fā)了一個基于神經(jīng)網(wǎng)絡(luò)的模型,,該模型集成了多基因和臨床預(yù)測因子,。基于神經(jīng)網(wǎng)絡(luò)的模型使用來自不同隊列的29個心血管危險因素和6個PRS的特征作為輸入進(jìn)行訓(xùn)練,。然后使用來自UK Biobank隊列參與者的各個評估中心的空間分離樣本驗證該模型,,以預(yù)測10年內(nèi)主要不良心臟事件的發(fā)生。與在相同數(shù)據(jù)上訓(xùn)練的現(xiàn)有模型和Cox比例風(fēng)險模型相比,,神經(jīng)網(wǎng)絡(luò)模型更好地整合了多基因和臨床預(yù)測因子并提高了預(yù)測性能,。該模型是在UK Biobank隊列,尚未在完全獨(dú)立的隊列中進(jìn)行評估,。

與PRS相關(guān)的第二個挑戰(zhàn)是可轉(zhuǎn)移性差,,可轉(zhuǎn)移性定義為模型對獨(dú)立數(shù)據(jù)集的預(yù)測準(zhǔn)確性。在PRS的背景下,可轉(zhuǎn)移性差是指從一個人群中的GWAS生成的PRS在其他人群中表現(xiàn)不佳的情況,。未來使用人工智能和其他功能數(shù)據(jù)組合的研究有望提高PRS在人群中的可轉(zhuǎn)移性,。

AI 應(yīng)用于GWAS功能/轉(zhuǎn)化研究的挑戰(zhàn)及建議

實際訓(xùn)練數(shù)據(jù)稀缺

GWAS功能和轉(zhuǎn)化研究中的大多數(shù)最先進(jìn)的方法都依賴于受監(jiān)督的AI模型,但這些嘗試因缺乏足夠規(guī)模的用于訓(xùn)練和驗證的實際數(shù)據(jù)集而受到阻礙,。

建議 除了不斷努力改進(jìn)實際數(shù)據(jù)集外,,還可以考慮使用一些基于人工智能的分析方法來緩解這個問題。基于人工智能的工具已經(jīng)顯示出它們在處理越來越多的非結(jié)構(gòu)化信息文獻(xiàn)方面的潛力,。在數(shù)據(jù)搜索方面,,基于自然語言處理算法的工具可以從文獻(xiàn)中自動識別和提取具有相關(guān)實體(例如等位基因)的遺傳變異信息,。該工具呈現(xiàn)出最先進(jìn)的性能,,其變異識別的 F-measure超過90%,現(xiàn)在可用于整個PubMed和PMC數(shù)據(jù)集,。此外,,已經(jīng)開發(fā)了基于AI的工具來改進(jìn)數(shù)據(jù)管理,例如在管理最全面的GWAS數(shù)據(jù)庫NHGRI-EBI GWAS目錄方面,,基于深度學(xué)習(xí)方法的精度是當(dāng)前基于查詢方法的2.99倍,。這種深度學(xué)習(xí)方法可以有效地識別相關(guān)文獻(xiàn),從而顯著減少手動管理過程中需要審查的論文數(shù)量,。

解決實際訓(xùn)練數(shù)據(jù)集不足挑戰(zhàn)的另一種方法是使用無標(biāo)簽策略,。其中一個例子是使用人在環(huán)路人工智能方法,它可以使用相對較小規(guī)模的現(xiàn)有真值標(biāo)簽來訓(xùn)練人工智能模型,,以生成大規(guī)模新標(biāo)簽,。經(jīng)過訓(xùn)練的模型可以通過人工對其新生成的標(biāo)簽進(jìn)行校正過程來進(jìn)一步校準(zhǔn),最終可以生成具有高置信度的標(biāo)簽,。這種human-in-the-loop策略主要應(yīng)用于免疫組化中蘇木精和伊紅染色數(shù)據(jù)的標(biāo)簽生成,。或者,,生成模型可以用于基于相關(guān)資源的先驗知識合成帶有標(biāo)簽的新數(shù)據(jù),。考慮到現(xiàn)有編碼變異致病性標(biāo)簽的稀疏性和異質(zhì)性,,在沒有訓(xùn)練任何現(xiàn)有標(biāo)簽的情況下開發(fā)了一個深度生成模型,。假設(shè)來自自然序列的進(jìn)化約束反映了變異體的致病性傾向,生成模型可以學(xué)習(xí)序列變異在物種間的分布,,從而通過將每個變異體歸入集群(良性,、不確定或致病性)來近似判斷其致病性的可能性。預(yù)計無標(biāo)簽的生成策略可以應(yīng)用于GWAS的功能和轉(zhuǎn)化研究,,以解決基礎(chǔ)真值標(biāo)簽有限的問題,。

透明度和人工智能“黑盒問題”

AI 算法(例如深度神經(jīng)網(wǎng)絡(luò))被認(rèn)為是黑匣子,可以在不考慮內(nèi)部原理(即“端到端”策略)的情況下預(yù)測輸入的輸出,從而為 GWAS功能提供有限的機(jī)制見解和轉(zhuǎn)化研究,。神經(jīng)網(wǎng)絡(luò)中的參數(shù)在訓(xùn)練期間受到廣泛的數(shù)學(xué)優(yōu)化,,導(dǎo)致神經(jīng)連接的密集網(wǎng)絡(luò)既不依賴于實際系統(tǒng)也不基于人類推理。

建議 解決“黑盒問題”的一種方法是使用參數(shù)較少的模型并選擇最少的特征集進(jìn)行預(yù)測,。例如,,Open Targets小組的研究使用帶有二元邏輯學(xué)習(xí)目標(biāo)函數(shù)的XGBoost梯度增強(qiáng)分類器來訓(xùn)練他們的變異到基因預(yù)測模型,通過每次在模型訓(xùn)練中留下一個特征,,進(jìn)行留一進(jìn)/留一出分析,,以確定單個特征對輸出的貢獻(xiàn),從而確定預(yù)測目標(biāo)基因的幾個關(guān)鍵特征,。應(yīng)當(dāng)指出,,這種結(jié)構(gòu)簡單的模型可能無法充分反映人類疾病遺傳易感性的復(fù)雜性,并可能導(dǎo)致信息的丟失,。另一個想法是使用具有層次分辨率的模型,,其內(nèi)部邏輯自然地適合生物系統(tǒng)和深度神經(jīng)網(wǎng)絡(luò),一個值得注意的例子是DCell,,它是一個具有層次結(jié)構(gòu)的可見神經(jīng)網(wǎng)絡(luò),,可根據(jù)基因型預(yù)測真核細(xì)胞(出芽酵母)的細(xì)胞生長。具體來說,,這個神經(jīng)網(wǎng)絡(luò)中的神經(jīng)元被組織成庫,,每個庫都映射到一個已知的細(xì)胞成分。由組合基因破壞(輸入)引起的細(xì)胞生長(輸出)的預(yù)測變化可以通過檢查潛在細(xì)胞成分的功能狀態(tài)(活躍或不活躍)來解釋,,該小組采用了類似的策略來預(yù)測癌細(xì)胞的藥物反應(yīng),,其中使用可解釋的深度學(xué)習(xí)模型將模型的內(nèi)部工作原理與已知的人類細(xì)胞生物學(xué)層次結(jié)構(gòu)相結(jié)合。Nguyen等人引入了一種可解釋的深度學(xué)習(xí)工具Varmole,,該工具將基因型和基因表達(dá)數(shù)據(jù)作為預(yù)測疾病表型的輸入,,將QTL和GRN的先驗生物學(xué)知識嵌入到深度學(xué)習(xí)網(wǎng)絡(luò)中,從而能夠?qū)z傳變異和疾病表型預(yù)測基礎(chǔ)基因進(jìn)行優(yōu)先排序,。Wang等人開發(fā)了深層結(jié)構(gòu)表型網(wǎng)絡(luò)(deep structured phenotype network, DSPN),,在基因型預(yù)測和表型預(yù)測之間增加了一系列中間層,這些中間層可能與特定基因(例如,,表達(dá)水平或染色質(zhì)狀態(tài))或基因群(例如,,共表達(dá)模塊)有關(guān),用于從基因型到性狀的機(jī)制解釋,。值得注意的是,,Varmole和DSPN的發(fā)展都得益于PsychENCODE聯(lián)盟的大規(guī)模和全面的功能基因組學(xué)資源,包括統(tǒng)一處理的大量腦組織轉(zhuǎn)錄組,、染色質(zhì),、基因型、Hi-C和單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)。此外,,具有分層分辨率的模型可能需要大量的計算資源和專業(yè)知識,,并且可能不適用于所有類型的遺傳數(shù)據(jù)。這些研究提供了解釋人工智能模型的有希望的示例,,以提供對人類疾病遺傳易感性的機(jī)制見解,。

倫理問題和偏見

雖然人工智能的應(yīng)用可能會在進(jìn)行GWAS后續(xù)研究時實現(xiàn)更高的準(zhǔn)確性和更好的性能,但隨著該領(lǐng)域的發(fā)展,,它也伴隨著一系列需要解決的倫理問題和偏見,。

建議 為了減少基于人工智能的GWAS后續(xù)研究中的偏見和不公正,應(yīng)該有意識地將代表不同人群的功能基因組學(xué)和臨床數(shù)據(jù)集納入訓(xùn)練深度學(xué)習(xí)模型,。這一過程當(dāng)然應(yīng)該伴隨著生物醫(yī)學(xué)研究界生成更多樣化的基因組學(xué)和醫(yī)學(xué)數(shù)據(jù)庫/研究,,準(zhǔn)確地代表醫(yī)學(xué)應(yīng)該服務(wù)的整個人群。為此,,技術(shù)驅(qū)動的解決方案,,如使用可穿戴設(shè)備的遠(yuǎn)程數(shù)字臨床試驗,,沒有臨床地點,,可能有助于減少以前代表性不足的人群的參與障礙。在算法層面,,已經(jīng)開發(fā)了增強(qiáng)公平性的人工智能方法,。例如,多目標(biāo)學(xué)習(xí)被提出來,,通過同時優(yōu)化和自動平衡準(zhǔn)確性和多種公平性措施來緩解公平性問題,。關(guān)于隱私和數(shù)據(jù)保護(hù)問題,除了實施人工智能特定的健康數(shù)據(jù)保護(hù)政策,,還可以考慮一些技術(shù)解決方案,。例如,聯(lián)合學(xué)習(xí)可以允許在多中心合作的情況下進(jìn)行模型訓(xùn)練而不共享原始數(shù)據(jù),,每個中心進(jìn)行單獨(dú)的訓(xùn)練,,模型的更新通過一個可信的中央服務(wù)器進(jìn)行共享和匯總。也可以考慮其他方法,,如差分隱私(涉及在保持?jǐn)?shù)據(jù)集的全局模式的同時隨機(jī)破壞個人級數(shù)據(jù))和同態(tài)加密(使用加密的輸入數(shù)據(jù)),,也可以考慮并與其他解決方案相結(jié)合。因此,,下一代隱私保護(hù)技術(shù)(如隱私保護(hù)的聯(lián)合學(xué)習(xí)),,備受期待。

在AI模型能夠鞏固其在臨床有效性中的作用之前,,需要努力解決性能,、通用性和可解釋性以及倫理問題方面的若干挑戰(zhàn)。需要注意的是,這些模型大多是最近開發(fā)的,,沒有積累足夠的時間應(yīng)用于不同的場景,,它們的價值需要經(jīng)過時間檢驗。新的人工智能策略,,包括生成模型和可解釋的深度學(xué)習(xí),,可能是釋放GWAS在為復(fù)雜的人類疾病提供生物學(xué)見解和健康益處方面的全部潛力的關(guān)鍵。

//

建議對技術(shù)細(xì)節(jié)感興趣的小伙伴參考文獻(xiàn)原文~

對于文獻(xiàn)整理過程中有翻譯不當(dāng)或錯誤也歡迎大家在評論區(qū)留言指出,,互相交流學(xué)習(xí),!

多優(yōu)質(zhì)內(nèi)容請點擊下方名片,關(guān)注“國家基因庫大數(shù)據(jù)平臺”和“深圳國家基因庫”公眾號,。

參考文獻(xiàn)

Long E, Wan P, Chen Q, et al. From function to translation: Decoding genetic susceptibility to human diseases via artificial intelligence[J]. Cell Genomics, 2023.

    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多