1. 隨機森林模型
Feature Importance Scores表格-來源于隨機森林結果 記錄了各OTU對組間差異的貢獻值大小,。 注:一般地,,選取Mean_decrease_in_accuracy值大于0.05的OTU,作進一步分析,;對于組間差異較小的樣本,,該值可能會降至0.03。 2. 交叉驗證分析
一般地,,對隨機森林分析篩選出的關鍵OTU,,按照不同組合進行10倍交叉驗證分析,找出能夠最準確區(qū)分組間差異的最少的OTU組合,,再做進一步的分析,,如ROC分析等。 注:圖中橫坐標表示不同數(shù)量的OTU組合,,縱坐標表示該數(shù)量OTU組合下分類的錯誤率,。OTU組合數(shù)越少,且錯誤率越低,,則該OTU組合被認為是能夠區(qū)分組間差異的最少的OTU組合,。 3. ROC曲線
注:圖中橫坐標為假陽性率false positive rate(FPR):Specificity,,縱坐標為真陽性率true positive rate(TPR):Sensetivity,。最靠近左上角的ROC曲線的點是錯誤最少的最好閾值,其假陽性和假陰性的總數(shù)最少,。ROC曲線下的面積值在1.0和0.5之間,。在AUC>0.5的情況下,AUC越接近于1,,說明診斷效果越好,。AUC在 0.5~0.7時有較低準確性,AUC在0.7~0.9時有一定準確性,,AUC在0.9以上時有較高準確性,。AUC=0.5時,說明診斷方法完全不起作用,,無診斷價值,。AUC<0.5不符合真實情況,在實際中極少出現(xiàn),。 4. Wilcoxon秩和檢驗分析 Wilcoxonrank-sum test,,也叫曼-惠特尼U檢驗(Mann–WhitneyU test),是兩組獨立樣本非參數(shù)檢驗的一種方法,。其原假設為兩組獨立樣本來自的兩總體分布無顯著差異,,通過對兩組樣本平均秩的研究來實現(xiàn)判斷兩總體的分布是否存在差異,該分析可以對兩組樣品的物種進行顯著性差異分析,,并對p值計算假發(fā)現(xiàn)率(FDR)q值,。 注:mean分別為兩組樣品物種的平均相對豐度,,sd分別是兩組樣本物種相對豐度的標準差。P值為對兩組檢驗原假設為真的概率值,,p<0.05表示存在差異,,p<0.01表示差異顯著,q值為假發(fā)現(xiàn)率,。 5. 差異菌群Heatmap分析
注:圖中越接近藍色表示物種豐度越低,,越接近橙紅色表示豐度越高。左邊的聚類樹是根據(jù)各物種間的spearman相關性距離進行聚類,;上邊的聚類樹是采用樣本間距離算法中最常用的Bray-Curtis算法進行聚類,。 6. 兩組樣本W(wǎng)elch's t-test分析 兩組不同方差的樣本可使用Welch’st-test進行差異比較分析,通過此分析可獲得在兩組中有顯著性差異的物種[或差異基因豐度—適用于元(宏)基因組],。 注:上圖所示為不同基因豐度(或物種)在兩組樣品中的豐度比例,,中間所示為95%置信度區(qū)間內,,物種豐度的差異比例,,最右邊的值為p值,p值<0.05,,表示差異顯著,。 7. Shannon多樣性指數(shù)比較盒狀圖 將不同分類或環(huán)境的多組樣本的Shannon多樣性指數(shù)進行四分位計算,比較不同樣本組的組間Shannon指數(shù)差異,。同時進行非參數(shù)Mann-Whitney判斷樣本組間的顯著性差異,。 注:橫坐標表示樣本分組,縱坐標表示相對應的Alpha多樣性指數(shù)值,;圖形可以顯示5個統(tǒng)計量(最小值,,第一個四分位,中位數(shù),,第三個中位數(shù)和最大值,,及由下到上5條線),。p<0.05,表示差異顯著,;P<0.01,,表示差異極顯著。 8. 基于距離的箱式圖
注:第一四分位數(shù) (Q1),,又稱“下四分位數(shù)”,,等于該樣本中所有數(shù)值由小到大排列后第25%的數(shù)字。第二四分位數(shù) (Q2),,又稱“中位數(shù)”,,等于該樣本中所有數(shù)值由小到大排列后第50%的數(shù)字。 第三四分位數(shù) (Q3),,又稱“上四分位數(shù)”,,等于該樣本中所有數(shù)值由小到大排列后第75%的數(shù)字。 9. LEfSe分析
說明:左邊的圖為統(tǒng)計兩個組別當中有顯著作用的微生物類群通過LDA分析(線性回歸分析)后獲得的LDA分值。右邊的圖為聚類樹,,節(jié)點大小表示豐度,,默認從門到屬依次向外排列。紅色區(qū)域和綠色區(qū)域表示不同分組,,樹枝中紅色節(jié)點表示在紅色組別中起到重要作用的微生物類群,,綠色節(jié)點表示在綠色組別中起到重要作用的微生物類群,黃色節(jié)點表示的是在兩組中均沒有起到重要作用的微生物類群,。圖中英文字母表示的物種名稱在右側圖例中進行展示,。 10. ANOSIM相似性分析
Table. Anosim analysis 注:理論上,R值范圍為-1到+1,,實際中R值一般從0到1,R值接近1表示組間差異越大于組內差異,,R值接近0則表示組間和組內沒有明顯差異,。P值則反映了分析結果的統(tǒng)計學顯著性,P值越小,,表明各樣本分組之間的差異顯著性越高,,P< 0.05表示統(tǒng)計具有顯著性,;Number of permutation表示置換次數(shù)。 11. Adonis多因素方差分析 Adonis又稱置換多因素方差分析(permutationalMANOSVA)或非參數(shù)多因素方差分析(nonparametricMANOVA),。它利用半度量(如Bray-Curtis)或度量距離矩陣(如Euclidean)對總方差進行分解,,分析不同分組因素對樣品差異的解釋度,并使用置換檢驗對劃分的統(tǒng)計學意義進行顯著性分析,。 Table permutational MANOVA analysis 注: Group:表示分組,; Df:表示自由度; SumsOfSqs:總方差,,又稱離差平方和,; MeanSqs:平均方差,即SumsOfSqs/Df,; F.Model:F檢驗值,; R2:表示不同分組對樣品差異的解釋度,即分組方差與總方差的比值,,即分組所能解釋的原始數(shù)據(jù)中差異的比例,,R2越大表示分組對差異的解釋度越高; Pr(>F):通過置換檢驗獲得的P值,,P值越小,,表明組間差異顯著性越強。 |
|
來自: Mobio_Lab_Sun > 《微生物多樣性》