前幾天和大家介紹了一下GEO數(shù)據(jù)庫以及使用GEO2R進行差異表達分析GEO2R差異表達分析軟件。幾乎現(xiàn)在的套路性文章在做完差異表達分析后,,都會去做GO和KEGG富集分析,。那么GO和KEGG都是什么?富集分析又是個什么東西呢,? 01 為什么做富集分析,?在我們進行差異表達分析的時候,我們會得到很多的差異表達基因,。這些基因如果只是按照基因名放到哪里的話,,我們很難找到一個規(guī)律說這些有基因之間有什么關(guān)系的。例如下圖,,我們把這些差異基因平鋪來了之后,,就是這么一個情況。 高通量的數(shù)據(jù)的分析,,可以讓我們得到很多候選的結(jié)果,。但是如果只是把結(jié)果這樣的平鋪開的話,反正不利于我們?nèi)グl(fā)現(xiàn)事情的本質(zhì),。所以為了更情況的看清楚這些基因的功能,,我們就使用了富集分析。我們可以把富集分析理解為在把很零零碎碎的東西,,通過一個整體來反應(yīng)出來,,類似于從微觀到宏觀的變化。 利用富集分析,,我們就可以把很多看著雜亂的差異基因總結(jié)出一個比較整體反應(yīng)事件發(fā)生的概述性的句子,。例如:TP53信號通路和胃癌的發(fā)生有關(guān)。而不是說BAX,、BID,、ABL1,、ATM、BCL2,、BOK,、CDKN1A這7個基因和胃癌的發(fā)生有關(guān)系。 02 GO和KEGG是什么,?就算沒有做過富集分析,,但是也肯定見過公司或者一些文章里面寫到他們做了GO分析和KEGG pathway分析。那么這兩個東西到底是什么,? 對于每個基因而言,,其基本的功能基于他們的蛋白結(jié)構(gòu)域以及研究的文獻已經(jīng)可以大致的知道一個基因具有什么樣子的功能了。GO和KEGG就是基于不同的分類思想而儲存的基因相關(guān)功能的數(shù)據(jù)庫,。
03 GO,、KEGG和富集分析有什么關(guān)系呢,?通過上面的解釋,我們知道,,其實GO和KEGG是兩個數(shù)據(jù)庫,,里面有每個基因相關(guān)的功能信息,而富集分析就是一個把這些功能進行進行整合計算的算法,。 GO和KEGG是基礎(chǔ),,而富集是過程,最后得到的結(jié)果就是整合后的宏觀的結(jié)果,。 對于GO和KEGG基本上就是這些,。但是對于富集分析,,還是有不同的算法的,。明天我們就來簡單的介紹一下基本的一些富集分析的算法,。 |
|