軟件簡介在微生態(tài)研究中,,當(dāng)我們做完多樣性測序后,想找出不同處理組之間差異物種或差異基因,,一般常用的組間差異分析metastats(只能用于兩組之間的差異比較)、LEfSe以及STAMP等,。 今天給大家介紹STAMP的安裝及使用: 該軟件2014年發(fā)表于Bioinformatics,,目前已被引用313次。該軟件非常強(qiáng)大,,不僅能夠?qū)山M甚至多組樣本在任何分類水平的物種等進(jìn)行顯著性差異分析,,而且該軟件的操作簡單易學(xué)。 1. 準(zhǔn)備輸入文件在應(yīng)用之前,,首先要整理STAMP文件,,格式如下圖。如果關(guān)心的是不同分類單元差異物種,,那么前面幾列是物種的分類單元等級(jí),,如果有4個(gè)等級(jí)(例如目,科,屬,,種),,那么前面就有4列(Hierachical level列)。接著后面就是每個(gè)樣品的OTU數(shù)目信息,。 文件格式的整理是個(gè)關(guān)鍵步驟,。STAMP有兩種輸入文件方式: 1.自己整理的STAMP格式文件;并且另存為.spf 格式,。 2.轉(zhuǎn)換Mothur,、Picrust等軟件生成的其他格式文件為STAMP格式文件。 下面將介紹第一種自己整理的STAMP格式文件的方法: OTU豐度文件,,每列之間用tab鍵隔開的.spf文件(可在excel表格內(nèi)編輯,,然后保存為spf格式文件,需要注意的是該文件一定要包含表頭) 由于在同一個(gè)表格中選擇不同level 的功能經(jīng)常出現(xiàn)Bug,,所以我們推薦讀者把不同的分類單元分別保存成*.spf文件,。 如圖所示我們按目,科,,屬,,種不同的分類等級(jí)分別保存成.spf的文件,然后在分析的時(shí)候各自單獨(dú)運(yùn)行,。 接著我們還需要準(zhǔn)備一個(gè)分組信息meta文件(格式同豐度表格式,,該文件也需要加入表頭,否則會(huì)默認(rèn)第一行為表頭,,導(dǎo)致樣本缺失,。)如下圖: 準(zhǔn)備好以上文件之后我們就可以開始了 2. 文件導(dǎo)入打開軟件后,點(diǎn)擊左上角的“file”-“l(fā)oad data”,,輸入文件即可,。(方法File-load data,選擇文件導(dǎo)入,,注意文件存放的路徑中不能包含中文字符) 3. 數(shù)據(jù)比較與作圖文件導(dǎo)入成功后,,就可以設(shè)置參數(shù),繪制想要的圖了,。具體的參數(shù)設(shè)置見下圖: 該軟件默認(rèn)打開界面Multiple groups(多組比較),,根據(jù)實(shí)際需要的比較方案進(jìn)行選擇,比如想進(jìn)行兩組之間的比較,,首先點(diǎn)擊Two groups,,然后選擇需要比較兩組的組名以及統(tǒng)計(jì)方法和過濾條件,即可進(jìn)行顯著性差異統(tǒng)計(jì)分析,。 一般常用的多組分析統(tǒng)計(jì)學(xué)方法包括ANOVA和Kruskal-Wallis H-test,。兩組之間比較統(tǒng)計(jì)學(xué)方法包括t-test(equalvariance),,Welch’s t-test和White’snon-parametric t-test。為了確保統(tǒng)計(jì)學(xué)意義和結(jié)果的準(zhǔn)確度,,需要選擇合適的檢驗(yàn)方法,。t-test檢驗(yàn)可以在最少樣本數(shù)為4的時(shí)候保持較高的準(zhǔn)確度和精確度,而且當(dāng)兩個(gè)分組之間具有相同的方差時(shí),,用t-test也更為準(zhǔn)確,。 當(dāng)方差不同時(shí),Welch’s t-test更為準(zhǔn)確,。White’s non-parametrict-test算法計(jì)算時(shí)間較長,,當(dāng)樣本數(shù)目少于8的時(shí)候,可以使用該檢驗(yàn)方法,,當(dāng)樣本數(shù)目過多時(shí),,不宜使用該檢驗(yàn)方法。 4. 作圖類型及導(dǎo)出結(jié)果示例: 注意事項(xiàng)1. 結(jié)果文件存放路徑中不能存在中文字符,,否則在數(shù)據(jù)無法導(dǎo)入到軟件,。 2. 當(dāng)輸入的豐度表文件和分組文件樣本不一致時(shí),remain Unclassiffied reads和use only forcalculating frequency profiles方法會(huì)保留所有的數(shù)據(jù),,而remove Unclassiffied reads僅僅保留有確定分組信息的數(shù)據(jù),。注意的是,分組文件的樣本一定在豐度表文件中存在,,否則會(huì)報(bào)錯(cuò),,反之,是可以的,。 3.目前版本的STAMP存在一些小的bug,,一次分析只能使用一個(gè)數(shù)據(jù)文件,如果要打開新的數(shù)據(jù)文件,,需要關(guān)閉軟件后重新打開,。如果分析完成,一定要記得保存(可以存為PDF格式或圖片格式),,不然需要再重新分析一次,。 測試數(shù)據(jù)下載鏈接:http://pan.baidu.com/s/1hrHRhAG,提取碼:v64x 更多相關(guān)文章閱讀,,請(qǐng)點(diǎn)擊《你想要的宏基因組知識(shí)全在這》
|
|