編者按:公元1082年,,被貶黃州的蘇軾在這一年寫下了有名的《赤壁賦》和《后赤壁賦》。大文豪寬闊的胸懷似乎絲毫不在意人生的窘迫,,剛剛發(fā)出“有客無酒,,有酒無肴,月白風清,,如此良夜何,?”的無奈感慨,須臾就可“于是攜酒與魚,,復游于赤壁之下”,。 后基因組時代,我們攜SNP與表型,,還需要什么才能復游于“赤壁”之上呢,? 這幾年得益于測序技術的進步,我們對生物的研究,,已徹底的進入了基因組時代,。一個個參考基因組測序計劃+群體重測序計劃得以實施,給我們講著一個個作物遺傳變異,、重要性狀遺傳調(diào)控結構的精美故事,,每每發(fā)表于頂級期刊。這里面就不得不提一個重要的技術GWAS,,學術翻譯“全基因組關聯(lián)分析”,,小名也叫“織襪子”。 可是GWAS只是給出和某個性狀關聯(lián)的SNP位置,,究竟是哪個基因影響表型,,我們還需要從近等基因系、導入系這些穩(wěn)扎穩(wěn)住的遺傳學方法去鎖定我們要的基因,。尤其是像小麥這種LD衰減距離超級巨大的物種,,不光我們GWAS定位到的區(qū)間非常巨大,甚至連我們GWAS的底層模型都會被帶偏,,產(chǎn)生更多的假陽性。 相對于動植物可以人為再創(chuàng)建群體,,設計實驗來定位克隆基因,。人類里面因為倫理等各種原因,只能依賴自然群體,。同時如果能在GWAS這一層面上就能解決大部分問題,,那是再好不過了。這幾年GWAS在人類里面又有很多新的進展,,比如利用轉(zhuǎn)錄組測序的方法補充GWAS分析(注意是補充不是替代),,Transcriptome-wide association studies,,簡稱TWAS。 最近一期的NG上面在線了兩篇關于TWAS的文章,,一篇題為《Probabilistic fine-mapping of transcriptome-wide association studies》的研究文章,,提出了一種FOCUS (fine-mapping of causal gene sets)的方法,利用GWAS結果,,群體材料全基因組轉(zhuǎn)錄組結果,,候選位點的LD等這些信息,構建統(tǒng)計模型,,給出了候選位點每個基因的可能性,,為我們尋找關聯(lián)區(qū)域的候選基因提供了新的信息。 圖1. FOCUS基本原理 這種方法其實是直接檢測gene-trait的關聯(lián)性,。如圖1所示,,a圖上是普通的GWAS曼哈頓圖;中間是利用全基因組轉(zhuǎn)錄組數(shù)據(jù),,建立的SNP-gene 表達的影響關系,,G代表基因,G1,、G2,、G3、G4,、G5和G6是這個候選區(qū)間的6個基因,,每一列是一個SNP,顏色深淺代表每個SNP對這6個基因表達量變化的影響大??;下方是這個區(qū)間SNP之間的LD關系。利用這些信息,,進行統(tǒng)計模型的計算,,得到右圖6個基因和性狀的關聯(lián)性。相對于之前利用SNP位置找基因,,提供了一個直接基因和表型關聯(lián)關系,,利于我們更快的找到關鍵基因。 圖2. FOCUS方法模擬結果 是不是這樣呢,? 作者首先進行了模擬分析,,發(fā)現(xiàn)83%的致病基因會都會落在FOCUS 90%的置信區(qū)間里。 這種方法最大的弊端是什么呢,? 就是我們基因影響表型的表達部位,,不在我們轉(zhuǎn)錄組測序的組織里,那這種方法就會有偏差,。舉例來說,,如果表型是雄性不育,,那么目標基因的表達部位可能就是在花藥里,但是我們測的轉(zhuǎn)錄組卻是在葉片里,。那還能得到可靠結果嗎,?作者的分析結果是一定程度上可以的。圖2,,e圖說明,,致病基因只要在測序組織表達量和致病組織表達量(發(fā)揮功能組織)有0.2以上的遺傳力,就可以被相當?shù)墓πz測到,,這在一定程度上緩解了轉(zhuǎn)錄組測序的組織要求嚴格性,。 這種方法是不是真的這么好呢? NG同期在線了另一篇題為《Opportunities and challenges for transcriptome wide association studies》的觀點文章對TWAS這種方法進行更為廣泛的測試和討論,。這篇文章也提出基因表達量之間的關聯(lián)性,,基因間位置的重疊性,測序的組織差異等問題都會帶來假陽性,?但是,,TWAS依然相對于孤零零的只有SNP-trait的GWAS結果而言,是一個很大的進步,。TWAS確實能在一定程度上增大我們找到真正候選基因的可能性,。文章同時也指出在做TWAS時候要尤其注意基因表達的相關性和組織偏好性。 那么,,TWAS會很快在小麥里得以運用嗎,? 讓我們,別持目以待,,早點動手開始吧,!所以,哪位老板那里有群體,,有數(shù)據(jù),,讓我們來玩一次吧。 |
|