今天和大家分享的是2020年1月發(fā)表在Diabetes, Metabolic Syndrome and Obesity: Targets and Therapy(IF=2.842)上的一篇文章:“Identification of Key Genes Involved in Diabetic Peripheral Neuropathy Progression and Associated with Pancreatic Cancer”,,作者利用GEO數(shù)據(jù)庫(kù) 的數(shù)據(jù)集確定了參與DM(糖尿病),、DPN(糖尿病周?chē)窠?jīng)病變)和PC(胰腺癌)的關(guān)鍵基因和相關(guān)通路,,并發(fā)現(xiàn)了同時(shí)參與DM、DPN,、PC疾病進(jìn)程的關(guān)鍵基因:MMP9,,為DM和PC的診斷與治療提供 了有潛力的生物標(biāo)志物。 Identifification of Key Genes Involved in Diabetic Peripheral Neuropathy Progression and Associated with Pancreatic Cancer 參與糖尿病周?chē)窠?jīng)病變且與胰腺癌有關(guān)的關(guān)鍵基因鑒定 一,、研究背景 糖尿病是世界上最常見(jiàn)的疾病之一,,常伴有多種并發(fā)癥,其中最常見(jiàn)的為糖尿病周?chē)窠?jīng)病變,,其 發(fā)病機(jī)制非常復(fù)雜,;且有先前研究發(fā)現(xiàn),糖尿病與胰腺癌風(fēng)險(xiǎn)增加有關(guān),,但糖尿病和胰腺癌之間的潛在 機(jī)制和聯(lián)系尚未得到完善的分析,。因此作者希望在本文中利用GEO數(shù)據(jù)庫(kù)進(jìn)行生物信息學(xué)分析,探究 DM,、DPN與PC之間的聯(lián)系,,尋找與之相關(guān)的關(guān)鍵基因。 二,、分析流程 三,、結(jié)果解讀 1、差異表達(dá)基因(DEGs)鑒定 作者先利用GSE95849數(shù)據(jù)集鑒定DM與DPN的差異表達(dá)基因,,再利用GSE95849和GSE28735數(shù)據(jù) 集來(lái)鑒定DM和PC的差異表達(dá)基因,。GSE95849數(shù)據(jù)集中包括6個(gè)DPN樣本、6個(gè)DM樣本,、6個(gè)對(duì)照組樣 本,,作者將三類(lèi)樣本兩兩一組做DEGs鑒定;接著作者分別鑒定了GSE95849數(shù)據(jù)集中DM組與對(duì)照組的 DEGs以及GSE28735數(shù)據(jù)集中PC組與對(duì)照組的DEGs 2,、對(duì)GSE95849得到的DEGs做通路分析 對(duì)從GSE95849數(shù)據(jù)集鑒定得到的三組DEGs(DM與對(duì)照組,、DPN與對(duì)照組、DPN與DM)分別做 GO、KEGG分析(結(jié)果分別見(jiàn)表1,、表2),。其中,GO分析結(jié)果提示炎癥反應(yīng)和免疫相關(guān)生物學(xué)過(guò)程可 能與DM和DPN的疾病進(jìn)展有關(guān),;KEGG分析表明,,三組DEGs均在TLR通路、造血細(xì)胞系以及趨化因子 受體相關(guān)通路中較為富集,。 表1.DEGs的KEGG分析結(jié)果 表2.DEGs的KEGG分析結(jié)果 3,、通過(guò)PPI網(wǎng)絡(luò)獲得hub基因 利用STRING數(shù)據(jù)庫(kù)分別對(duì)三組DEGs構(gòu)建PPI網(wǎng)絡(luò),再利用Cytoscape獲取PPI網(wǎng)絡(luò)中的hub基因,。首先,,利用Cytoscape中的cytoHubba插件計(jì)算網(wǎng)絡(luò)中所有基因的degree(連接度),在表3中給出 degree值前30位的基因列表,;接著利用Cytoscape中的MCODE插件獲得三組PPI網(wǎng)絡(luò)的核心功能模塊 (取MCODE得分12為最低標(biāo)準(zhǔn)),,在圖2.A-C中分別給出了三個(gè)PPI網(wǎng)絡(luò)的核心功能模塊。將從三組 DEGs中篩選出的基因繪制Venn圖取交集,,結(jié)果得到3個(gè)hub基因:TLR4,、CCR2、MMP9,,它們具有作 為DM和DPN生物標(biāo)志物的潛力,。 表3.cytoscape計(jì)算degree的mocode_score結(jié)果 圖2.利用cytoscape獲得DEGs中的hub基因 4、鑒定DM與PC的hub基因 采用與鑒定DM和DPN的hub基因完全一致的流程,,作者先對(duì)從GSE95849和GSE28735數(shù)據(jù)集得到 的兩組DEGs取交集(如圖3.A的Venn圖所示),,接著對(duì)二者共有的這59個(gè)DEGs做GO和KEGG分析,,發(fā) 現(xiàn)它們?cè)贓CM受體反應(yīng),、局灶性粘附和腫瘤相關(guān)信號(hào)通路中比較富集。接著,,利用STRING數(shù)據(jù)庫(kù)構(gòu)建 這59個(gè)DEGs的PPI網(wǎng)絡(luò)(圖3.B),。先利用CytoHubba計(jì)算基因的degree,并利用MCODE生成核心功 能模塊(圖3.C),,這15個(gè)基因即為hub基因,。 圖3.利用cytoscape獲得DM與PC的hub基因 4、鑒定DM與PC的hub基因 采用與鑒定DM和DPN的hub基因完全一致的流程,,作者先對(duì)從GSE95849和GSE28735數(shù)據(jù)集得到 的兩組DEGs取交集(如圖3.A的Venn圖所示),,接著對(duì)二者共有的這59個(gè)DEGs做GO和KEGG分析,發(fā) 現(xiàn)它們?cè)贓CM受體反應(yīng),、局灶性粘附和腫瘤相關(guān)信號(hào)通路中比較富集,。接著,利用STRING數(shù)據(jù)庫(kù)構(gòu)建 這59個(gè)DEGs的PPI網(wǎng)絡(luò)(圖3.B)。先利用CytoHubba計(jì)算基因的degree,,并利用MCODE生成核心功 能模塊(圖3.C),,這15個(gè)基因即為hub基因。 為了進(jìn)一步從這15個(gè)hub基因中篩選出有作為生物標(biāo)志物潛力的關(guān)鍵基因,,作者對(duì)15個(gè)hub基因的 表達(dá)水平和預(yù)后價(jià)值進(jìn)行和檢測(cè),。首先作者利用GEPIA在線工具比較了15個(gè)基因在胰腺癌樣本和對(duì)照組 樣本中的表達(dá)差異(圖4.A),發(fā)現(xiàn)PLAU,、MET,、APOL1、MMP9在PC樣本中明顯高表達(dá),;接著進(jìn)行 KM生存分析,,比較了15個(gè)hub基因高低表達(dá)組之間的OS差異,發(fā)現(xiàn)PLAU,、MET,、APOL1、MMP9,、 CLU的高表達(dá)與胰腺癌患者預(yù)后改善有關(guān)(圖4.B-C),。因此證明了這5個(gè)hub基因具有作為DM和PC生 物標(biāo)志物的潛力。 基于先前空腹血糖水平升高會(huì)提高PC患病風(fēng)險(xiǎn)的研究結(jié)論,,作者猜想慢性高血糖(CHG)可能會(huì) 引起上述15個(gè)hub基因的表達(dá)水平改變,。因此作者利用GSE59953數(shù)據(jù)集進(jìn)行驗(yàn)證,分別對(duì)21d治療組 與對(duì)照組,、48h治療組與對(duì)照組,、21d與48h治療組(這里的治療指TGF-β1治療,可以改善細(xì)胞的CHG 水平)進(jìn)行DEGs鑒定,,接著對(duì)三組DEGs做GO和KEGG分析,,發(fā)現(xiàn)它們?cè)贓CM受體反應(yīng)、局灶性粘附和 腫瘤相關(guān)通路中最為富集,。最后利用cytoscape篩選出PPI網(wǎng)絡(luò)中的核心功能模塊,,得到了6個(gè)hub基因(CXCL8, EGR1, FN1, FOS, PPARG ,SPP1)。與預(yù)期不符的是,, 這6個(gè)基因中并不包括從GSE95849和 GSE28735數(shù)據(jù)集中得到的15和hub基因,,因此作者認(rèn)為上述15個(gè)hub基因的表達(dá)水平不會(huì)因?yàn)?CHG(或TGF-β1治療)而發(fā)生明顯變化。 圖4.KM生存分析篩選有生物標(biāo)志物潛力的hub基因 5,、胰腺癌中MMP9的相關(guān)通路富集分析 從上述獲得的DM與DPN,、DM與PC之間的hub基因可以發(fā)現(xiàn),MMP9是唯一一個(gè)同時(shí)與DM,、 DPN,、PC疾病進(jìn)展有關(guān)的關(guān)鍵基因,并且具有一定的預(yù)后價(jià)值,因此作者單獨(dú)研究了MMP9在胰腺癌中 的相關(guān)信號(hào)通路,。首先作者在TCGA中下載了178例PC患者的RNA-seq數(shù)據(jù),,利用LinkedOmics數(shù)據(jù)庫(kù) (http://www./login.php)的LinkFinder模塊分析了與MMP9相關(guān)(spearman相關(guān)) 的差異表達(dá)基因,其中1550個(gè)與MMP9正相關(guān),,729個(gè)與MMP9負(fù)相關(guān),,在圖5.A中利用火山圖進(jìn)行可 視化,并取其中spearman相關(guān)系數(shù)前50位的正相關(guān)基因和負(fù)相關(guān)基因繪制熱圖(圖5.B-C) 接著,,使用LinkedOmics中的LinkInterpreter模塊對(duì)MMP9相關(guān)基因進(jìn)行GSEA富集分析,,結(jié)果表 明與MMP9相關(guān)的基因在細(xì)胞因子-受體相互作用、ECM-受體反應(yīng),、造血細(xì)胞系,、B細(xì)胞受體相關(guān)通 路、局灶性粘附,、三羧酸循環(huán)相關(guān)通路中明顯富集(圖5.D-J),。由于與MMP9相關(guān)的差異表達(dá)基因均與 糖尿病發(fā)生、炎癥反應(yīng)以及腫瘤相關(guān)通路有關(guān),,因此作者認(rèn)為MMP9具有作為胰腺癌診斷和治療的生物 標(biāo)志物的潛力,。 圖5.使用LinkedOmics對(duì)MMP9相關(guān)通路做富集分析 小結(jié) 本篇文章中,作者利用GEO數(shù)據(jù)庫(kù)的數(shù)據(jù)集分析了參與DM,、DPN和PC疾病進(jìn)程的關(guān)鍵基因和相關(guān) 信號(hào)通路,,發(fā)現(xiàn)炎癥反應(yīng)和免疫相關(guān)通路與DM和DPN有關(guān),而ECM受體反應(yīng),、局灶性粘附和腫瘤相關(guān) 通路與DM和PC有關(guān),。同時(shí),作者發(fā)現(xiàn)MMP9同時(shí)與DM,、DPN,、PC的疾病進(jìn)展有關(guān),可以作為三者潛 在的診斷和治療靶點(diǎn),。 本文的研究局限性:1,、GSE95849數(shù)據(jù)集的RNA樣本來(lái)自外周血單核細(xì)胞,,而不是來(lái)自周?chē)?經(jīng),,因此利用該數(shù)據(jù)集獲得的hub基因與DPN進(jìn)展有關(guān)這一結(jié)論說(shuō)服力較差;2,、GSE95849和 GSE28735兩數(shù)據(jù)集是分別由DM和PC的數(shù)據(jù)生成的,,因此沒(méi)有在一個(gè)數(shù)據(jù)集中直接地分析DM和PC之 間的關(guān)系,難以充分地反應(yīng)DM和PC之間的真實(shí)關(guān)聯(lián),;3,、本文的研究全部基于生物信息學(xué)分析,因此 需要進(jìn)一步的生物學(xué)實(shí)驗(yàn)來(lái)加以驗(yàn)證。 |
|
來(lái)自: 科研菌 > 《待分類(lèi)》