1,、為什么要進(jìn)行正態(tài)性檢驗(yàn),? 正態(tài)性檢驗(yàn)主要用于判斷計(jì)量資料是否服從或近似服從正態(tài)分布,。因?yàn)楹芏喑R?jiàn)的統(tǒng)計(jì)學(xué)方法都要求數(shù)據(jù)滿足正態(tài)性,如常見(jiàn)的t檢驗(yàn),、單因素方差分析等,。在考慮采用上述方法時(shí),要對(duì)數(shù)據(jù)進(jìn)行正態(tài)性檢驗(yàn),。 如果數(shù)據(jù)明顯不服從正態(tài)分布,,但由于我們沒(méi)有正態(tài)性檢驗(yàn)的結(jié)果,直接使用了t檢驗(yàn),、單因素方差分析等參數(shù)檢驗(yàn)的方法,,有可能導(dǎo)致統(tǒng)計(jì)效能下降,導(dǎo)致假陰性風(fēng)險(xiǎn)增加,。 2,、怎么進(jìn)行正態(tài)性檢驗(yàn)? 一般可通過(guò)圖示法或統(tǒng)計(jì)學(xué)檢驗(yàn)法進(jìn)行正態(tài)性檢驗(yàn),。常見(jiàn)的統(tǒng)計(jì)學(xué)檢驗(yàn)有Kolmogorov-Smirnov檢驗(yàn)(KS檢驗(yàn))和Shapiro-Wilk檢驗(yàn)(SW檢驗(yàn)),,當(dāng)檢驗(yàn)結(jié)果的p值小于0.05,則認(rèn)為數(shù)據(jù)不滿足正態(tài)性,;反之,,則認(rèn)為數(shù)據(jù)滿足正態(tài)性。但需要注意的是,,上述檢驗(yàn)方法存在一定局限性,。 因此,我們常建議研究者通過(guò)繪制直方圖,、QQ圖等來(lái)判斷數(shù)據(jù)的正態(tài)性,。在直方圖中數(shù)據(jù)呈現(xiàn)鐘型分布,中間高,兩端逐漸下降左右兩側(cè)呈現(xiàn)對(duì)稱(chēng)或近似對(duì)稱(chēng),,或者在QQ圖中的數(shù)據(jù)點(diǎn)和理論直線基本重合,,則可認(rèn)為數(shù)據(jù)滿足正態(tài)性。但圖示法存在主觀性的問(wèn)題,,遇到一些不確定的情況,,大家可以咨詢統(tǒng)計(jì)學(xué)專(zhuān)家。 需要提醒大家一點(diǎn),,如果是多組間的比較,,我們需要分組考察正態(tài)性,只要其中一組不滿足正態(tài)性,,就不適合用參數(shù)檢驗(yàn)了,。 3、樣本量足夠大,是不是就可以不做正態(tài)性檢驗(yàn)了,? 有些讀者說(shuō),,不用這么麻煩,只要樣本量足夠大,,就可以默認(rèn)數(shù)據(jù)滿足正態(tài)性了,。這種認(rèn)識(shí)當(dāng)然是不對(duì)的。這種觀點(diǎn)的起源是因?yàn)閷?duì)中心極限定理的誤解,。事實(shí)上,,中心極限定理說(shuō)的是:不管總體數(shù)據(jù)的分布是什么樣的(可能是正態(tài),也可能偏態(tài)),,如果從總體中多次抽樣,,對(duì)于每個(gè)抽樣樣本計(jì)算統(tǒng)計(jì)量(如均值,、中位數(shù)),。當(dāng)每次抽樣例數(shù)足夠大,樣本的均值或中位數(shù)近似服從正態(tài)分布,。并不是說(shuō):樣本量足夠大,,這個(gè)樣本就服從正態(tài)分布。 4,、為什么有些人看一眼,,就說(shuō)我的數(shù)據(jù)可能不正態(tài)呢? 上面說(shuō)正態(tài)性檢驗(yàn)的步驟還是有點(diǎn)復(fù)雜的,,但是為什么有些人只看到數(shù)據(jù)的均值和標(biāo)準(zhǔn)差,,就很有信心的懷疑我的數(shù)據(jù)不服從正態(tài)分布呢?這是因?yàn)?,統(tǒng)計(jì)學(xué)家進(jìn)行了很多模擬,,發(fā)現(xiàn)對(duì)于大于零的數(shù)據(jù),如果均值小于標(biāo)準(zhǔn)差,,或小于2倍或3倍的標(biāo)準(zhǔn)差,,這個(gè)數(shù)據(jù)很有可能不服從正態(tài)分布。所以,,有些審稿人看到20±35這樣的數(shù)據(jù),,就會(huì)懷疑數(shù)據(jù)的正態(tài)性問(wèn)題。這樣,,您是不是也學(xué)到一招,,以后看一眼也能大致判斷數(shù)據(jù)的正態(tài)性了。這種經(jīng)驗(yàn)主要用于對(duì)二手?jǐn)?shù)據(jù)的粗略判斷,,對(duì)于原始數(shù)據(jù)還是要通過(guò)圖示法進(jìn)行正態(tài)性檢驗(yàn),。 5、數(shù)據(jù)不滿足正態(tài)性檢驗(yàn),有哪些處理方法,? 正態(tài)性檢驗(yàn)?zāi)敲粗匾?,但是我的?shù)據(jù)就是不服從正態(tài)分布怎么辦呢?這個(gè)問(wèn)題統(tǒng)計(jì)學(xué)專(zhuān)家在很久之前已經(jīng)發(fā)現(xiàn)并提出了行之有效的方法,。比如,,我們可以采用非參數(shù)檢驗(yàn)。如用于兩組獨(dú)立樣本的Mann-Whitney U test,,多組獨(dú)立樣本的Kruskal-Wallis test,。或者,,我們也可以做一些數(shù)據(jù)轉(zhuǎn)換,,如對(duì)數(shù)轉(zhuǎn)換,使得轉(zhuǎn)換后的數(shù)據(jù)服從正態(tài)分布,,從而繼續(xù)采用參數(shù)檢驗(yàn),。 |
|
來(lái)自: 鐘山紫竹林 > 《統(tǒng)計(jì)》