生存分析是評(píng)價(jià)疾病預(yù)后的一個(gè)重要分析方法,,尤其是在腫瘤研究中。之前我們介紹過(guò)好幾個(gè)腫瘤生存分析的在線工具,,比如KM plotter,,Onclnc,,GEPIA等等(生存分析,這個(gè)網(wǎng)站還不錯(cuò),!,,懶人怎么做腫瘤病人的生存分析?),。有童鞋反映說(shuō)這幾個(gè)工具分析出來(lái)的結(jié)果咋不一樣呢,? 原因主要有: 1、在線工具的數(shù)據(jù)樣本來(lái)源不同,,大致上是KM plotter(TCGA數(shù)據(jù) GEO數(shù)據(jù))>GEPIA(TCGA數(shù)據(jù))>Onlnc(部分TCGA數(shù)據(jù)) 2,、分析時(shí)樣本剔除的標(biāo)準(zhǔn)有所不同。 此外,,在線工具分析的結(jié)果你無(wú)法得到入選分析樣本的臨床數(shù)據(jù),,也無(wú)法得到下圖這樣分類更加詳細(xì)的生存分析結(jié)果。 (碩士論文:浙江省常見(jiàn)惡性腫瘤生存分析) 所以有的時(shí)候還是得自己親自動(dòng)手做不做生存分析,,今天就給大家介紹一下如何用SPSS分析對(duì)TCGA數(shù)據(jù)庫(kù)中的腫瘤(肺腺癌)數(shù)據(jù)進(jìn)行生存分析,。(SPSS版本是16.0的,還是英文的,,從一個(gè)留學(xué)的同學(xué)那拷來(lái)的,,一直沒(méi)換,大家將就著看吧) 首先是下載TCGA的臨床數(shù)據(jù)和測(cè)序數(shù)據(jù)(FPKM數(shù)據(jù)),,這一步可以用簡(jiǎn)易TCGA下載工具這個(gè)小工具來(lái)處理(這么好用的TCGA數(shù)據(jù)下載工具,?!),。 得到臨床數(shù)據(jù)后,,我們需要得到Over survival(OS)的數(shù)據(jù),如果病人死亡了,,OS就等于days to death,,如果還活著,那就等于days to last followup,。而沒(méi)有數(shù)據(jù)的病例就是我們需要剔除的條目了,。 得到OS的數(shù)據(jù)之后,,我們可以選擇不同的臨床信息進(jìn)行生存分析,,比如TNM分級(jí),吸煙與否,,治療方式等等,。 我們以抽煙為例,Not Availale為不抽煙病例,,其他為抽煙的病例,。 根據(jù)存活與否排序,,得到OS的數(shù)據(jù),再根據(jù)OS排序,,刪除沒(méi)有生存信息的數(shù)據(jù) 再看下吸煙情況,,不吸煙的人似乎有點(diǎn)少,看來(lái)得肺腺癌的還是吸煙的多啊,。,。。 考慮到“節(jié)目效果”,,這里把吸煙史=1的也歸到不吸煙組,。 向SPSS導(dǎo)入數(shù)據(jù)時(shí),個(gè)人習(xí)慣先把EXCEL復(fù)制成TXT文本文件再導(dǎo)入(出錯(cuò)情況較少),。 選擇數(shù)據(jù)包含標(biāo)題 分隔符只選Tab制表符,,Space空格勾掉不選。 其它設(shè)置默認(rèn)即可,。 分析類型選擇生存分析,,使用Kaplan-Meier法 設(shè)置如下 結(jié)果表明,生存分析結(jié)果表明吸煙組和非吸煙組并沒(méi)有什么顯著差異,。 前面我們還下載了基因表達(dá)數(shù)據(jù),,在臨床數(shù)據(jù)中我們將barcode這列數(shù)據(jù)和表達(dá)數(shù)據(jù)中的樣本編號(hào)對(duì)應(yīng)起來(lái)(用vlookup函數(shù)) 注意表達(dá)數(shù)據(jù)中的樣本編號(hào)后面有-01的標(biāo)識(shí),這表示這是癌組織的樣本,,所以作上述對(duì)應(yīng)操作時(shí)把-01都刪掉,。隨后按基因表達(dá)量排序,一半標(biāo)記為up,,一半標(biāo)記為down即可,。 樣本信息處理好之后,依照前面的方法進(jìn)行生存分析即可,。 好了,,今天有關(guān)生存分析的介紹就到這里,遇到數(shù)據(jù)庫(kù)出現(xiàn)分歧的情況,,大家可以自己動(dòng)手做一做,。 數(shù)據(jù)網(wǎng)盤鏈接:https://pan.baidu.com/s/1hsepWnq 密碼:0ldc |
|