1 Enrichment score(ES)ES是GSEA最初的結(jié)果,,反應(yīng)全部雜交data排序后,在此序列top或bottom富集的程度,。 2 NES由于ES是根據(jù)分析的數(shù)據(jù)集中的gene是否在一個(gè)功能gene set中出現(xiàn)來(lái)計(jì)算的,,但各個(gè)功能gene set中包含的gene數(shù)目不同,且不同功能gene set與data之間的相關(guān)性也不同,,因此,,比較data set在不同功能gene set中的富集程度要對(duì)ES進(jìn)行標(biāo)準(zhǔn)化處理,,,也就是NES 3 FDRNES確定后,,判斷其中可能包含的錯(cuò)誤陽(yáng)性發(fā)現(xiàn)率。FDR=25%意味著對(duì)此NES的確定,,4次可能錯(cuò) 1次,。GSEA結(jié)果中,高亮顯示FDR<25%的富集set,。因?yàn)閺倪@些功能gene中最可能產(chǎn)生有意義的假設(shè),,促進(jìn)進(jìn)一步研究。大多數(shù)情況下,,選FDR<25%是合適的,,但是,假如分析的芯片data set較少,,選擇的是探針隨機(jī)組合而不是表型組合,,若p不嚴(yán)格,那么應(yīng)該選FDR<5%,。 4 名義p值 nominal p-value描述的是針對(duì)某一功能gene子集得到的富集得分的統(tǒng)計(jì)顯著性,,顯然,,p越小,富集性越好,。 以上4個(gè)參數(shù)中,,只有FDR進(jìn)行了功能gene子集大小和多重假設(shè)檢驗(yàn)矯正,而p值沒(méi)有,,因此,,如果結(jié)果中有一個(gè)高度富集的功能gene子集,而其有很小的名義p-value和大的FDR意味著富集并不顯著,。 我的一個(gè)具體結(jié)果解讀:
在選擇的BP中,,有681個(gè)gene sets,92個(gè)PH中上調(diào),,其中75%的正確率支持0條子集上調(diào),,1個(gè)BP的gene表達(dá)上調(diào)名義p值<0.01??傮w結(jié)果并不理想,。 備注GSEA富集結(jié)果太少說(shuō)明:無(wú)gene set被富集,。 GSEA富集結(jié)果太多說(shuō)明:太多的功能子集被富集了。 |
|
來(lái)自: 小夢(mèng)想在努力 > 《GSEA》