有多項(xiàng)研究表明lncRNA與眾多生物學(xué)過程,,復(fù)雜疾病相關(guān),,為了進(jìn)一步探究lncRNA在這些生命活動(dòng)中的具體作用,,我們需要對(duì)lncRNA的功能進(jìn)行分析,。 在生物信息學(xué)中,對(duì)于基因功能的挖掘,,通常的做法就是利用GO和KEGG等功能數(shù)據(jù)庫,,但是這些數(shù)據(jù)庫中都是蛋白編碼基因的功能,為了利用這些數(shù)據(jù)庫中的信息,,我們需要在lncRNA與mRNA之間建立起聯(lián)系,,常見的思路有以下幾種
從GEO和TCGA中收集了來自28個(gè)組織/細(xì)胞系, 共6500個(gè)樣本的RNA-seq數(shù)據(jù),,然后通過經(jīng)典的 tophat+cufflinks+RSEM策略分別對(duì)mRNA和lncRNA進(jìn)行定量,通過斯皮爾曼相關(guān)性分析和線性回歸,,分析lncRNA與mRNA之間的共表達(dá),,構(gòu)建lncRNA與mRNA的共表達(dá)網(wǎng)絡(luò)。對(duì)于lncRNA, 對(duì)其共表達(dá)的mRNA做GO和KEGG富集分析,,采用的方法是費(fèi)舍爾檢驗(yàn),,將功能富集的結(jié)果當(dāng)做該lncRNA的注釋,完整流程示意如下
選擇數(shù)據(jù)集和共表達(dá)分析的方法,設(shè)置閾值,,通過mRNA或者lncRNA的名字來查找對(duì)應(yīng)的共表達(dá)基因,,點(diǎn)擊 通過 對(duì)于KEGG富集的結(jié)果,,點(diǎn)擊可以查看具體的通路圖,在通路圖上,,會(huì)將共表達(dá)的蛋白編碼基因用紅色標(biāo)記,,示意如下 通過 該網(wǎng)站還支持上傳自己的lncRNA和mRNA表達(dá)譜,,然后進(jìn)行共表達(dá)分析,,界面示意如下 該數(shù)據(jù)庫中的數(shù)據(jù)是免費(fèi)下載的,通過該數(shù)據(jù)庫,,我們不僅可以查找已有的lncRNA與mRNA的共表達(dá)分析結(jié)果,,還可以對(duì)自己的數(shù)據(jù)進(jìn)行共表達(dá)分析。 ·end· |
|