前面在GSEA可以做什么中列了GSEA的一些應用場景,這個算其中之一,,也是相對被遺落的一個分析,其實還是比較有用的,,那就是leading edge analysis,。更多GSEA結果解讀。 它可以做什么,?有沒有哪個(些)genes在富集到的GO或kegg里出現(xiàn)次數(shù)最多(意味它可能很關鍵,,連接很多信號通路或生理過程等),這個功能通過leading edge analysis實現(xiàn),。同時它也有弊端,,那就是這其中有富集到的GO結果的冗余性,但是這個是可以解決的,。(具體解決方式,,可先google什么是GO的冗余性,怎么去除,,然后再知道GSEA的分析原理,,就可以了。) 也就是說:LEA可以有助于知道富集到的GO term中哪些gene出現(xiàn)最多,,它很可能很關鍵,,但一定考慮GO term的冗余,而這個是GSEA本身無法通過設置參數(shù)解決的,。
假如已經得到了GSEA的富集分析結果,,就可以進行Leading edge analysis了,LEA可以提供哪些gene(指的是零頭亞基)對給定的gene sets貢獻最大,。(領頭亞基指對Es值貢獻最大的基因集合),,領頭亞集由ES決定。 1 選擇合適的Gene sets,這可以由FDR cut-off設定 2 GSEA軟件會輸出4個圖,,代表1中選出的亞基重疊,,分別為 a:heatmap,顯示領頭亞集clusters或表達值,,并用顏色表示范圍,,low-high b:set to set graph,顯示gene set間的重疊,,用顏色表示set之間共享的gene數(shù)目 c:基因集中的gene列表,,一個具體的gene屬于多少sets,這可以給出一定的信息,,和生物學問題先關的關鍵genes 3 可以生產build HTML Report,,所有LEA細節(jié),組成leading edge subset genes,,與表型相關的表達值間有高相關性,,并且傾向于極端分布而不是隨機分布。通常這些領頭亞集中的gene對ES得分有直接關系,。這些都基于幾個統(tǒng)計學值,。如果tag,list,,signal Tag:領頭亞集中的gene數(shù)目,,而這些gene直接貢獻了+ES. List:給出了這些gene的位置或Rank Signal:genes的強度和strength或intensity GSEA module,一個關鍵應用是看兩個groups之間富集的gene的重疊性,。overlap之間的比較,。可以延伸,,更好理解哪些genes更傾向涉及表型,。
作者:Y大寬 鏈接:https://www.jianshu.com/p/9d6271b55dc7 來源:簡書 著作權歸作者所有。商業(yè)轉載請聯(lián)系作者獲得授權,,非商業(yè)轉載請注明出處,。
|