俗話說得好,方差有三寶:獨立,、正態(tài),、齊性好。什么意思呢,?就是說使用方差分析需要三個前提條件:1,、各樣本須是相互獨立的隨機樣本;2,、各樣本來自正態(tài)分布總體,;3、各總體方差相等,,即方差齊,。 縱然方差分析的用途廣泛,可以不受比較組數(shù)的限制,,進行多組比較,。然而在實際的數(shù)據(jù)分析中,我們辛苦收集的數(shù)據(jù)往往很難符合其使用的條件,。但我們又需要從樣本數(shù)據(jù)中,,獲得盡可能多的信息,此時使用非參數(shù)檢驗就再適合不過了,。 非參數(shù)檢驗類別按照樣本數(shù)量分類,,可以將非參數(shù)檢驗方法分為幾個方面: 單樣本非參數(shù)檢驗方法 卡方檢驗:用于分析定類數(shù)據(jù)與定類數(shù)據(jù)之間的關(guān)系情況,例如不同減肥治療方式對于減肥的幫助情況(膽固醇水平),。卡方檢驗用于研究X和Y之間的關(guān)系,,且X,Y均為定類數(shù)據(jù)。并且卡方檢驗需要使用卡方值和對應(yīng)P值去判斷X與Y之間是否有差異,。通常情況下,,共有三種卡方值,分別是Pearson卡方,,yates校正卡方,,fisher卡方,;優(yōu)先使用Pearson卡方,其次為yates校正卡方,,最后為fisher卡方,。 二項分布檢驗:是指在只會產(chǎn)生兩種可能結(jié)果如陰性、陽性之一的n次獨立重復試驗(常常稱為n重Bernoulli試驗)中,,每次試驗的“陽性”概率保持不變時,,出現(xiàn)“陽性”的次數(shù)X=0,1,2......n的一種概率分布。在醫(yī)學研究中較為常用,。 單樣本K-S檢驗:單樣本K-S檢驗?zāi)軌蚶脴颖緮?shù)據(jù)推斷樣本來自的總體是否服從某一理論分布(正態(tài)分布,,均勻分布,泊松分布,,指數(shù)分布)。適用于探索連續(xù)型隨機變量分布,。 單樣本W(wǎng)ilcoxon檢驗:(也稱單樣本wilcoxon符號秩和檢驗,,符號秩和檢驗,也或者秩和檢驗等),;其被用于檢驗數(shù)據(jù)是否與某數(shù)字有明顯的差異性,。首先需要判斷數(shù)據(jù)是否呈現(xiàn)出正態(tài)性分析特質(zhì),如果數(shù)據(jù)呈現(xiàn)出正態(tài)性特質(zhì),,此時應(yīng)該使用單樣本T檢驗進行檢驗,;如果數(shù)據(jù)沒有呈現(xiàn)出正態(tài)性特質(zhì),此時應(yīng)該使用單樣本W(wǎng)ilcoxon檢驗,。 游程檢驗:游程檢驗用于檢驗數(shù)據(jù)是否具有隨機性,,其原始假設(shè)是數(shù)據(jù)序列不具有隨機性;如果檢驗結(jié)果顯示P值小于0.05,,則說明數(shù)據(jù)不具有隨機性,,反之P值大于等于0.05則說明數(shù)據(jù)具有隨機性。如果數(shù)據(jù)有上升或下降的趨勢,,或有呈周期性變化的規(guī)律等特征時,,均可能表示數(shù)據(jù)與順序是有關(guān)的,或者說序列不是隨機出現(xiàn)的,。通俗來講,,游程檢驗是用于分析數(shù)據(jù)是否為隨機。 兩獨立樣本非參數(shù)檢驗方法 MannWhitney U 檢驗:是用得最廣泛的兩獨立樣本秩和檢驗方法,。用于研究定類數(shù)據(jù)與定量數(shù)據(jù)之間的關(guān)系情況,。例如研究人員想知道不同性別學生的購買意愿是否有顯著差異,如果購買意愿沒有呈現(xiàn)出正態(tài)性特質(zhì),,此時建議可使用MannWhitney U 檢驗,。其原假設(shè)是:兩獨立樣本來自的兩總體的分布無顯著差異,。 W-W游程檢驗:用來檢驗兩獨立樣本來自的兩總體的分布是否存在顯著差異。通過分析游程的大小和數(shù)量實現(xiàn)游程檢驗,,從而判斷兩組樣本在混合序列中的排列是否為隨機的,。若兩組樣本在混合序列中的排列是隨機的,則兩組樣本之間沒有顯著性差異,。 極端反應(yīng)檢驗:從另一角度檢驗兩獨立樣本所來自的量總體分布是否存在顯著性差異,。其基本思想是:將一組樣本作為控制樣本,另一組樣本作為實驗樣本,。以控制樣本作為對照,,檢驗試驗樣本相對于控制樣本是否出現(xiàn)了極端反應(yīng)。如實驗樣本沒有出現(xiàn)極端反應(yīng),,則認為兩總體分布無顯著差異,,相反則認為存在顯著差異。 兩配對樣本的非參數(shù)檢驗方法 McNemar檢驗:用于兩配對樣本的分析,,其將研究對象自身作為對照者檢驗其“前后”變化是否有顯著差異,,例如比較同一批觀測對象用藥前后或?qū)嶒炃昂蟮慕Y(jié)果有無差異。該檢驗只適用于二分變量,,即只有兩種可能“是”或“否”,,“陽性”或“陰性”,“有反應(yīng)”或“無反應(yīng)”等,,對于非二分變量,,應(yīng)在分析前進行數(shù)據(jù)變換。 符號檢驗:也是用來檢驗配對樣本所來自的總體的分布是否存在顯著性差異的非參數(shù)方法,。符號檢驗法是通過兩個相關(guān)樣本的每對數(shù)據(jù)之差的符號進行檢驗,,從而比較兩個樣本的顯著性。由于這種方法只考慮符號,,不考察差數(shù)的大小,,因而失去樣本所提供的一部分信息,準確度不高,。因此除了小樣本,,一般不使用符號檢驗。 配對樣本W(wǎng)ilcoxon檢驗:配對樣本W(wǎng)ilcoxon檢驗用于檢驗配對數(shù)據(jù)是否具有顯著性差異,,比如實驗組和對照組的成績差異性,,手術(shù)前和手術(shù)后的體重差異性。從功能上講,,配對樣本W(wǎng)ilcoxon檢驗與配對樣本T檢驗完全一致,,區(qū)別僅在于數(shù)據(jù)是否正態(tài)。 多獨立樣本的非參數(shù)檢驗方法 中位數(shù)檢驗:用來檢驗多個獨立樣本來自的總體的中位數(shù)是否存在顯著差異。其基本思路:先求取混合后數(shù)據(jù)的中位數(shù),,然后利用卡方分布統(tǒng)計量來計算每個樣本組內(nèi)中位數(shù)兩側(cè)個案數(shù)的差異性,。 K-W檢驗:用于檢驗多個總體的分布是否存在顯著差異。SPSSAU會自動選擇MannWhitney或者Kruskal-Wallis統(tǒng)計量,。如果X的組別為兩組,,比如男和女共兩組,則應(yīng)該使用MannWhitney統(tǒng)計量,,如果組別超過兩組,,則應(yīng)該使用Kruskal-Wallis統(tǒng)計量結(jié)果。 多個配對樣本非參數(shù)檢驗方法 如果是多相關(guān)樣本,,并且目的在于研究差異性,,則有Friedeman檢驗和CochranQ檢驗兩項可用,但特別提示一點,,CochranQ檢驗涉及的數(shù)據(jù)一定是二分類(即1和0這樣的數(shù)據(jù)),;如果是研究多相關(guān)樣本的一致性情況,則可使用Kendall協(xié)調(diào)系數(shù),。 參數(shù)或非參數(shù)的正確選擇選擇參數(shù)檢驗或非參數(shù)檢驗需要結(jié)合專業(yè)情況以及數(shù)據(jù)類型數(shù)據(jù)形態(tài),,綜合參數(shù)檢驗和非參數(shù)檢驗的優(yōu)缺點進行考量,方法的選擇沒有絕對意義上的標準答案,。 參數(shù)檢驗假定總體分布服從正態(tài)或近似正態(tài),如果數(shù)據(jù)服從正態(tài)分布,,參數(shù)檢驗是最好的選擇,。如果不滿足這些條件的情況下,依然使用參數(shù)檢驗分析,,很可能讓檢驗結(jié)果產(chǎn)生錯誤,。而非參數(shù)檢驗不受數(shù)據(jù)分布的限制,檢驗條件比較寬松,,對于總體未知的樣本都可以適用,。但非參數(shù)檢驗也存在不足,非參數(shù)檢驗對總體假定不多,,因而會缺乏針對性,,功效不如參數(shù)檢驗。 同時樣本的數(shù)量也影響著選擇何種方法,。一般來說小樣本用非參數(shù)檢驗,,大樣本采用參數(shù)檢驗。原因是參數(shù)檢驗假定了服從某種分布,,當樣本量過小時,,無法識別數(shù)據(jù)分布狀態(tài),而非參數(shù)檢驗對樣本量沒有要求,因此可選擇非參數(shù)檢驗,。 |
|