摘要
全基因組關聯(lián)研究(GWAS)確定了數(shù)千種與復雜性狀相關的變異,,但它們的生物學解釋通常仍不清楚。這些變體中的大多數(shù)與表達QTL(eQTL)重疊,,表明它們可能參與基因表達的調(diào)節(jié),。基于此種情況提出了一種先進的基于匯總統(tǒng)計的孟德爾隨機化方法,它同時使用多個SNP作為儀器和多種基因表達特征作為暴露,。當應用于43種人類表型時,,它揭示了2,277個推定基因,其血液表達與至少一種表型因果關聯(lián),,導致5,009種基因 - 性狀關聯(lián); 值得注意的是,,在之前的GWAS分析中,55%的人在附近沒有全基因組顯著的SNP,。 使用獨立關聯(lián)匯總統(tǒng)計(UKBiobank),,由于電力問題,,大多數(shù)這些位點被傳統(tǒng)GWAS遺漏。 這些新穎的聯(lián)系中值得注意的是高度和智力相關的PEX19和CDC42,,分別已知攜帶突變導致身材矮小和Takenouchi-Kosaki綜合征,。這個方法同樣揭示了暗示機械連接的新穎的多效因果效應,例如: TSPAN14在類風濕性關節(jié)炎,,克羅恩病和炎癥性腸病中的共同遺傳效應,。 最后,可以證明因果基因可以是高度組織特異性的,。先進的孟德爾隨機化通過檢測關聯(lián)的更高功率來解鎖已發(fā)表的GWAS的隱藏價值,。 它更好地解釋了多效性,揭示了復雜和臨床特征背后的新生物機制,。 基本信息 Title:Mendelian Randomization integrating GWAS and eQTL data reveals genetic determinants of complex and clinical traits 期刊: BioRxiv 發(fā)表日期:2018.7.25 全基因組關聯(lián)研究(GWAS)已經(jīng)確定了數(shù)以萬計與數(shù)百種復雜性狀相關的常見遺傳變異。 然而,,使用GWAS結果鑒定因果基因是困難的,,因為這種方法僅突出了連鎖不平衡(LD)中相關變異的精細定位區(qū)間與因果標記。 如果沒有額外的數(shù)據(jù),,將這些與基因功能的影響聯(lián)系起來并不簡單,,特別是因為大多數(shù)這些性狀相關變異屬于基因組的非編碼區(qū),對蛋白質(zhì)結構或功能沒有直接影響,。 最近,,已經(jīng)表明,,與性狀相關的SNP與基因表達相關的可能性是三倍,,即表達數(shù)量性狀基因座(eQTL),因此,,了解SNP特性關聯(lián)背后的生物學機制需要專注于研究它們在基因表達調(diào)控中的潛在作用,。 基于此種情況提出整合GWAS和eQTL數(shù)據(jù)的轉錄組范圍關聯(lián)研究(TWAS)來揭示基因 - 性狀關聯(lián)。然而,,雖然這些研究旨在鑒定其(遺傳決定的)表達與復雜性狀顯著相關的基因,,但它們并不旨在估計因果效應的強度,也無法區(qū)分因果關系與多效性(即當遺傳變異影響多個時)表型),。 以此,,作者整合了來自GWAS的總結水平數(shù)據(jù)和孟德爾隨機化(MR)框架中的eQTL研究,以估計基因表達對幾種人類表型的這種因果效應,。由于性狀相關變異通常是多基因的eQTL,,所以采用了一種多儀器,多次暴露MR方法,,估計基因表達水平對結果性狀的聯(lián)合因果效應,。此方法僅需要匯總級數(shù)據(jù)允許來自不同研究的數(shù)據(jù)整合,。 作者將他們的方法應用于最大的公開GWAS匯總統(tǒng)計數(shù)據(jù)(基于樣本大小從20,883到339,224個人)并將它們與來自GTEx(基因組織表達項目)和eQTLGen聯(lián)盟(n = 14,115, 未發(fā)表)為43種復雜的人類特征提供推定的功能相關基因的圖譜,。 孟德爾隨機化依賴于關于這些工具的三個假設:(i)它們必須與暴露有足夠的聯(lián)系; (ii)他們不應與暴露 - 結果關系的任何混淆因素聯(lián)系在一起; (iii)只有通過暴露才能將結果與結果聯(lián)系起來。 通常通過多效性違反任何這些假設會導致對因果效應和潛在誤報的偏倚估計,。 第二個假設是最難以驗證的,,因為混淆因素通常是未知的,而最后的假設只能在相同(大)樣本中獲得SNP,,暴露和結果數(shù)據(jù)時才能得到最佳部分驗證,,這兩個條件不能滿足兩個 -sample MR。 最近,,Zhu等應用基于數(shù)據(jù)的總結MR(SMR)方法來測試遺傳變異對表型的影響是否由基因表達介導,。 由于基于單一遺傳變異的原始方法特別容易受到多效性的影響,因此將其擴展為更一般的形式(GSMR:廣義SMR),,其使用多個獨立的SNP作為工具變量進行MR分析,。 他們設計了異質(zhì)性檢驗(HEIDI)來識別多效性SNP,這可能會使因果估計產(chǎn)生偏差,。 我們注意到許多多效性效應僅通過鄰近基因的表達水平介導,,因為暴露應該減少MR假設違規(guī),同時提高能量,。 此外,,這樣的應用可能能夠更好地區(qū)分基因與相關表達水平的因果效應。出于這個原因,,作者提出了一種多基因方法(圖1a),,它應該特別減少由于多效性引起的偏差 對于一組k基因,使用逆方差加權方法進行匯總統(tǒng)計,,我們估計了一個基因座上幾個基因的表達水平對結果特征的多變量因果效應
其中E是一個n×k矩陣,,其中包含n個SNP對k基因表達的單變量效應大小(這些估計值來自eQTL研究); G是長度為n的載體,,其包含表型上相同n個SNP的單變量效應大?。ㄟ@些估計值來自公開可用的GWAS匯總統(tǒng)計量),C是n個SNP之間的成對相關(LD)矩陣(來自UK10K估計) 面板),。 作者將多儀器,,多次暴露MR方法應用于來自> 14K個體(eQTLGen Consortium,,未發(fā)表數(shù)據(jù))的血液樣本中的eQTL薈萃分析的總結數(shù)據(jù)和最大的公開可用GWAS數(shù)據(jù),以評估基因表達之間的因果關聯(lián) 和43個復雜的特征。 來自eQTLGen Consortium的數(shù)據(jù)包含9,136,405個SNP和20,468個基因的關聯(lián)匯總統(tǒng)計數(shù)據(jù),。 在作者他們的分析中,,僅包括PeQTL <1x10-03的順式-eqtl,產(chǎn)生針對18,732個egenes的3,520,820個eqtl(即其表達水平與至少一個遺傳變體相關的基因),。>1x10-03的順式-eqtl,,產(chǎn)生針對18,732個egenes的3,520,820個eqtl(即其表達水平與至少一個遺傳變體相關的基因)。>他們只使用順式-eQTL數(shù)據(jù),,因為trans-eQTL通常具有較弱的效應大小和較小的直接效應,,因此更容易違反MR假設。 總共,,作者他們發(fā)現(xiàn)2,277個基因與至少一種表型推定因果關聯(lián),,產(chǎn)生5,009個基因 - 性狀關聯(lián)(PMR <5x10-07 =="" 0.05="" 2306="" *="" 43),其中2,306和43對應于有效基因的數(shù)量,。="">5x10-07>作者他們的研究中,,基因組的表達水平和分析的性狀數(shù)量分別為(補充圖1和補充表1和2)。 作者他們展示了單基因分析如何導致有偏見的因果效應估計(補充圖2),。 遺傳變異仍然可以通過其他(非表達相關的)風險因素影響結果。 因此,,作者他們應用異質(zhì)性檢驗(參見方法)來檢測多效性SNP,,即遺傳變異,其對結果的影響與使用它們對暴露的影響和暴露對結果的估計因果效應估計的預期效果顯著不同,。 總體而言,,作者他們檢測到6,137個最初顯著的基因 - 性狀關聯(lián)中的2,072個的異質(zhì)性(PHET <1x10-04)。 在這2,072個關聯(lián)中,,822在去除顯示多效性的snp后通過了異質(zhì)性測試,。="">1x10-04)。>致確定了122個額外的關聯(lián),,給出了最終的5,009個強健關聯(lián),。 ?圖1a,。 多儀器,,多次暴露MR的示意圖,使用多個儀器變量(SNP)估計多次暴露(基因表達)對表型的因果影響,。 b,。驗證MR發(fā)現(xiàn)的基因。 條形圖表示在UKBB的不同大小子集中進行MR分析時發(fā)現(xiàn)的BMI因果的基因數(shù),。 其中,,GWAS在同一樣本中確認的那些(即在GW顯著SNP的500kb內(nèi)),用深藍色標記; 只有在全部380K UKBB樣品中以淺藍色運行GWAS時才能確認; 確認僅在完整的UKBB數(shù)據(jù)集中以灰色運行MR; 而頂部的淺灰色條代表MR發(fā)現(xiàn)的基因數(shù)量,但未在完整的UKBB數(shù)據(jù)集中得到證實,。 作者的方法將eQTL信息納入GWAS分析,有可能增加GWAS識別與復雜性狀相關的基因座的能力,。傳統(tǒng)的基于基因的測試,,通常基于物理距離或LD很少導致新發(fā)現(xiàn)的基因座,。 利用這些方法,,鑒定GWAS遺漏的新基因座是非常困難的,因為基因中/附近的一組有限的(獨立的)相關變體被大量無效SNP稀釋,。 因此,,基因的組合關聯(lián)信號通常弱于該區(qū)域中最強的SNP。此外,,鑒于GWAS SNP落在編碼區(qū)之外,,它們可以從基因中心分析中排除。 作者對來自UKBiobank(UKBB)的幾個個體子集進行了BMI的GWAS和MR分析,。使用完整樣本,,以用來評估他們的方法的表現(xiàn)。作者他們發(fā)現(xiàn)343個與BMI相關的重要MR基因(圖1b),。其中,,108個距離任何GW顯著SNP超過500kb,因此可能代表由于功率問題而被傳統(tǒng)GWAS遺漏的新基因座,。為了評估其他基因是否暗示具有真正相關SNP的區(qū)域,,作者他們對18個UKBB亞群進行了MR和GWAS分析,樣本量增加(從20,000到360,000),。作者他們觀察到,,在小子集中大多數(shù)MR鑒定的基因被確認,即落在使用全樣本在GWAS中作為GW顯著饋送的前導SNP識別的500kb附近,。例如,,在100K個體的子集中,通過MR發(fā)現(xiàn)并且未被GWAS發(fā)現(xiàn)的68個基因(即,,遠離任何GW顯著SNP定位> 500kb)與354個基因作圖顯著重疊(OR = 20,,P = 9.65x10-26)使用完整數(shù)據(jù)集執(zhí)行的GWAS識別的SNP的500kb內(nèi)。作者他們觀察到GWAS遺漏的基因座部分隨著樣本量的增加而減少,,表明飽和效應,。為了支持作者他們的研究結果的一致性,在完整樣本的18個子集中的任何一個中發(fā)現(xiàn)并且在完整數(shù)據(jù)集中被GWAS遺漏的> 74%的MR基因顯示在完整數(shù)據(jù)集中進行的MR分析中的顯著關聯(lián),。 總共作者他們發(fā)現(xiàn)2,277個與至少一種表型有因果關系的推定基因(PMR <5x10-07時5,009種基因 -="" 性狀關聯(lián))(補充圖1,,補充表1和2)。在這些基因="" -="" 性狀關聯(lián)中,,超過一半(2,736)已被先前的gwas遺漏,,因為沒有snp達到基因組內(nèi)基因組顯著性水平+/-="">5x10-07時5,009種基因>括其智力癥狀失能。此外,,在常規(guī)GWAS遺漏的其他區(qū)域中,,我們顯示ALS2(PMR = 1.58x10-07)(圖2b)和ZNF565(PMR = 2.65x10-07)與肌萎縮側索硬化和精神分裂癥[圖25]分別不限于稀有編碼變體。 為了測試推定的因果基因是否與功能相關,,作者他們將與高度顯著相關的基因與參與異常骨骼生長綜合征的基因列表重疊,。作者他們觀察到富集的趨勢為1.3倍(P> 0.05),表明我們的優(yōu)先基因具有額外的支持證據(jù),。 例如,,在VANGL2基因座內(nèi),其中包含由Wood等鑒定的與身高相關的SNP [topSNP:rs6688100 P = 2.30x10-08],,作者他們的結果表明VANGL2不是因果關系(PMR = 0.72)(圖2),。 2c)并顯示NCSTN(PMR = 2.30x10-18),COPA(PMR = 4.48x10-11)和PEX19(PMR = 8.02x10-11)的高表達與高身高因果關聯(lián),。 雖然尚不清楚三個重要的MR基因中哪一個在該區(qū)域中功能最相關,,但已知PEX19突變與身材矮小有關(Zellweger綜合征,OMIM:#614886),,使其成為最強的候選者,。 作者他們還發(fā)現(xiàn)了2,626個區(qū)域,其中MR僅鑒定了一個推定的因果基因,。 在一個高度區(qū)域,,作者他們的分析專門指出DYM(PMR = 3.42x10-44),其高表達與高身高有關,。 已知DYM與Smith-McCort發(fā)育不良(OMIM:#607326)有關,,特別是身材矮小。 在另一個實例中,,對于類風濕性關節(jié)炎,,CTLA4作為其基因座上唯一的致病基因出現(xiàn):其低表達與一般人群中類風濕性關節(jié)炎的風險顯著相關(PMR = 3.04×10-22)。 CTLA4與自身免疫性淋巴增生綜合征(OMIM:#616100)相關,,在其癥狀中呈現(xiàn)自身免疫性關節(jié)炎,。 假設編碼變異可能是給定基因座中的因果變異,我們測試了70個基因,,這些基因在我們的MR結果中含有至少一個與高度相關的編碼變體,,用于因果關聯(lián),。 44個可測試基因中只有4個對高度有顯著影響,,這表明當這種關聯(lián)是由編碼變異驅(qū)動而不是基因表達時,我們的MR方法正確地指出了任何因果基因。 ?圖2 GWAS和MR分析的區(qū)域關聯(lián)圖,。 上圖顯示單SNP關聯(lián)強度(y軸顯示-log10(p值))與基因組位置(在hg19 / GRCh37基因組構建; x軸上)相對于最顯著的SNP,,用紫色點表示。 下圖顯示了基因因果關聯(lián)強度(y軸顯示-log10(p值))與基因組位置,。 以灰色突出顯示的基因未進行測試(即:它們未通過異質(zhì)性測試或未具有顯著的eQTL),。 綠色虛線表示GWAS和MR顯著性閾值。 注意,,對于智力和肌萎縮側索硬化,,最顯著的SNP沒有達到GW顯著性(上圖),而MR指出推定的因果基因(下圖),。 最近的研究表明,最接近GWAS熱門命中的基因通常不是因果關系,。 與這些發(fā)現(xiàn)一致,,在具有至少一個全基因組顯著SNP的1,423個MR重要區(qū)域中,作者他們發(fā)現(xiàn)最接近該區(qū)域中頂部SNP的63%的基因與該表型沒有顯示任何顯著關聯(lián)(補充圖,。4),。 許多這樣的例子之一是教育成就與ERCC8(PMR = 4.82x10-07)之間的重要因果關聯(lián),ERCC8是一個基因,,與ELOVL7地區(qū)的單基因Cockayne綜合征A(OMIM#216400)有關[topSNP: rs61160187,,P = 5.93x10-13) 作者他們研究了多效性的程度并鑒定了與多種表型相關的1,870個基因(補充圖1),。其中,,XKR6和BLK被證明是最多效的,顯示與> 20種表型的因果關聯(lián),,包括自身免疫疾病,,神經(jīng),代謝,,造血和人體測量性狀,。與此結果一致,它們在許多GWAS中被“識別”,。其中一種多效基因是TSPAN14,,與克羅恩病(CD)(PMR = 6.93x10-09),,炎癥性腸?。↖BD)(PMR = 2.78x10-07),類風濕性關節(jié)炎(RA)有顯著相關性(PMR = 8.92) x10-10),,單核細胞(PMR = 2.04x10-08)和網(wǎng)織紅細胞(PMR = 2.80x10-09),。該結果確定了CD,,IBD和RA之間的共享效應(圖3)。值得注意的是,,作者他們觀察到了顯著的因果關聯(lián),,盡管作者他們在三種疾病的MR分析中使用的GWAS遺漏了這一位點(CD:N = 5,956例/ 14,927對照; IBD:N = 12,882 / 21,770 ; RA:N = 14,361 / 43,423)。支持作者他們的研究結果后,,該基因座后來得到了更大的薈萃分析證實,,該分析將GWAS數(shù)據(jù)與ImmunoChip數(shù)據(jù)相結合(CD:N = 20,550 / 41,642; IBD:N = 38,155 / 48,485),導致GW顯著關聯(lián)CD和IBD(補充圖5),。 作者他們還發(fā)現(xiàn)19個基因顯示出對月經(jīng)初潮的BMI和年齡有顯著的因果影響,,證實了這些特征的共同遺傳基礎。 這些基因中的16個與這些性狀之間的負遺傳和表型相關性具有相反的效果,。 在這16個基因中,,兩個(CADM1和ZC3H4)也被先前的GWAS檢測到兩種性狀,而7個(BNIPL,,C17orf89,,GGT7,MAPK3,,PM20D1,,PPM1F和PPP4C)和5個(APOBR,C1QTNF4,, 已知GTF3A,,NUP88和SULT1A1)分別與月經(jīng)初潮年齡或BMI完全相關。有趣的是,,作者他們確定了兩個基因(DCAF12和DNAJA4)作為新推定的因果關系,。 ?圖3與克羅恩病,炎癥性腸病和類風濕性關節(jié)炎相關的TSPAN14基因座的GWAS和MR分析的區(qū)域關聯(lián)圖,。 上圖顯示單SNP關聯(lián)強度(y軸顯示-log10(p值))與最顯著SNP周圍的基因組位置(在hg19 / GRCh37基因組構建; x軸上),,用紫色點表示。 下圖顯示了基因因果關聯(lián)強度(y軸顯示-log10(p值))與基因組位置,。 以灰色突出顯示的基因未進行測試(即:它們未通過異質(zhì)性測試或未具有顯著的eQTL),。 綠色虛線表示GWAS和MR顯著性閾值。 為了評估基因表達對每對性狀的共同因果效應,,作者他們計算了2,203個獨立基因子集中基因表達的因果效應估計值(或等效于MR分析的Z值)之間的相關性(ρE) (包括對任何特征無重要意義的那些;見方法)。在903對特征中,,作者他們發(fā)現(xiàn)了幾個顯著的相關性,,與先前的流行病學觀察結果一致(圖4a)。例如,,對于初潮年齡,,分別觀察到負(ρE= - 0.17 PFDR = 2.25x10-15)和正相關(ρE= 0.11,,PFDR = 1.04x10-06)與BMI和身高。正如預期的那樣,,冠狀動脈疾病與教育程度之間呈負相關(ρE= - 0.10,,PFDR = 1.26x10-05),。在分析中包括的43個特征中,,17個被包括在之前的研究中,該研究報告了通過LD分數(shù)回歸(ρG)估計的性狀之間的遺傳相關性,。比較表達式 - (ρE)與遺傳相關(ρG)估計的136對常見性狀,,發(fā)現(xiàn)了兩個估計之間有顯著的一致性(r = 0.84)。值得注意的是,,表達相關性似乎平均為遺傳相關性的44%,。雖然具有較小方差的遺傳相關性估計可以解釋這種衰減的一部分,但作者認為主要原因是大約一半的觀察到的遺傳相關性在全血中傳播到基因表達水平(圖4b),。特別是觀察到30對特征顯示ρE的顯著性和ρG,而七只對ρE有效,,12只對ρG 87對任何一個都沒有意義。在未通過LD評分回歸確定的顯著相關性中,,發(fā)現(xiàn)精神分裂癥與潰瘍性結腸炎之間存在正相關(ρE= 0.07,,PFDR = 4.45x10-03),與先前研究中報道的遺傳相關性方向一致并支持分子一小部分精神分裂癥病例的自身免疫病因證據(jù),。作者他們還觀察到冠狀動脈疾病與克羅恩病之間呈正相關(ρE= 0.08,,PFDR = 8.09x10-04),證實了最近一項研究的結果,。 ?圖4a,。 來自43個性狀的MR結果的表達相關性。 對于2,203個獨立基因和每對性狀,,計算了Z分數(shù)(與標準化因果效應成比例)之間的Pearson相關性(ρE),。 較暗的顏色表示較高的相關性,藍色和紅色分別對應于正和負關聯(lián),。灣 表達相關性(ρE)與從LD得分回歸得到的遺傳相關性(ρG)之間的線性關系,。 作者選擇了他們的研究和Bulik-Sullivan等分析的特征,并且對于每對特征,,比較了兩個相關性,。 灰色點表示非顯著性狀對,藍色點表示對于兩個相關性都顯著的性狀對,,而紅色和綠色對應于僅在(ρG)或ρE中顯著的性狀,。 虛線表示回歸線。 作者他們使用由GTEx(基因組織表達項目)鑒定的eQTL進行組織特異性MR分析,,其提供了對48種人組織的基因表達的遺傳效應的統(tǒng)一視圖,。 盡管跨組織共享eQTL(在一致的效應方向上)非常常見,但有許多組織特異性eQTLs,。 出于實際原因,,作者他們僅針對關鍵組織眾所周知的四種表型進行組織特異性分析:CAD(動脈),CD(腸),,LDL(肝臟)和T2D(胰腺),。 在作者他們的結果(補充表3-6)中,發(fā)現(xiàn)MRAS和PHACTR1與冠狀動脈疾?。–AD)相關,,在動脈組織中顯示出顯著的相關性,這對該特征的遺傳因果關系貢獻最大(MRAS:PMR = 4.89x10-09在動脈冠狀動脈中,,PMR = 5.28x10-09在動脈脛骨,,PHACTR1:PMR = 4.66x10-38在動脈冠狀動脈,PMR = 1.02x10-36在動脈主動脈和PMR = 3.39x10-30在動脈脛骨) (圖5),。 有趣的是,,使用來自eQTLGen Consortium的大型數(shù)據(jù)集,沒有基因在其他組織中顯示出顯著的因果效應,,包括全血,。 MRAS和PHACTR1在其他組織中具有顯著的eQTL,但這些效應中沒有一個與疾病相關,,證實疾病相關的eQTL是組織特異性的,。 作者還確認SORT1是LDL的原因,與之前的研究結果一致,。 不是LDL原因的組織,,如皮膚,垂體和睪丸,,錯誤地指出PSRC1是最可能推定的因果基因,,只有肝臟指出SORT1是強候選基因(補充圖6和補充表5)。 該結果再次證實了在尋找因果基因之前鑒定所研究的表型的相關組織的重要性,。 ?圖5 MRAS和PHACTR1對冠狀動脈疾病的組織特異性影響,。A-B。 最佳,。 關聯(lián)圖顯示MRAS(a)和PHACTR1(b)基因區(qū)域中冠狀動脈疾病的全基因組顯著基因座,。 表示單SNP關聯(lián)強度(y軸顯示-log10 p值)與最顯著SNP周圍的基因組位置(在hg19 / GRCh37基因組構建; x軸上),用紫色點表示,。 該區(qū)域中的其他SNP被顏色編碼以反映其具有最高SNP的LD(根據(jù)來自1000個基因組項目階段3單倍型的成對r2值),。 底部。 基因和外顯子的位置以及各自的轉錄鏈。 光盤,。 組織特異性的因果效應,。 y軸上列出的基因; 在x軸上列出的組織。 較暗的點對應于更強的關聯(lián),。 以灰色突出顯示的基因未經(jīng)過測試,。 MRAS和PHACTR1僅在動脈組織中顯示出顯著的相關性。 作者他們提出的方法能夠?qū)σ阎蛐路f相關區(qū)域中的基因進行優(yōu)先級排序以及鑒定常規(guī)GWAS遺漏的基因座,。利用UKBB數(shù)據(jù)發(fā)現(xiàn),,在大多數(shù)情況下,這些新基因座都有真實的信號,,最終將由更大的GWAS發(fā)現(xiàn),。 像所有方法一樣,,這個方法也有其局限性,,在解釋結果時需要考慮這些局限性。本研究報告的假定因果關聯(lián)不是確定的,。它們?yōu)槲磥淼暮罄m(xù)研究提供了候選基因的優(yōu)先列表,,并闡明了復雜性狀的可能生物學機制。通過這個的方法,,我們可以評估哪些與性狀相關的SNP可能通過基因表達發(fā)揮作用,。 此方法的另一個缺點是使用當前的eQTL數(shù)據(jù)只有15K的egenes是可測試的,這大大降低了檢測相關途徑和調(diào)控網(wǎng)絡中優(yōu)先基因集富集的能力,。許多基因不是通過改變基因表達導致疾病,,而是通過修飾RNA或蛋白質(zhì)序列,所以這個方法有一定的盲目性,。 這個研究的進一步局限是違反MR假設,。 特別是水平多效性和儀器的間接影響 暴露可以大大偏向因果效應估計。事實上,,隨著GWAS研究規(guī)模的增加,,由于有輕微多效性的證據(jù),將排除更多的SNP,,從而降低MR功率,。 這個方法僅需要來自GWAS的匯總統(tǒng)計數(shù)據(jù)以及與LD估計值相關的任何類型的暴露,再次證明了對現(xiàn)有數(shù)據(jù)的精心組合分析的能力,,以闡明復雜特征的生物機制并幫助設計功能實驗,。 糖炒栗子 撰文 本文為博淼生物原創(chuàng) |
|
來自: 生物_醫(yī)藥_科研 > 《文獻案例》