平均值與標(biāo)準(zhǔn)差是描繪正態(tài)分布的重要參數(shù),。 但是,,在現(xiàn)實(shí)世界中,我們往往沒有可能去直接認(rèn)識(shí)這個(gè)傳說(shuō)中的總體,,而是只能通過(guò)抽樣研究,,依靠樣本來(lái)間接認(rèn)識(shí)總體。 并通過(guò)樣本的平均值與標(biāo)準(zhǔn)差間接的了解總體特征: 但抽樣過(guò)程中,,抽樣誤差無(wú)法避免,,顯然僅僅用樣本的均值作為總體均值的代表,雖然已經(jīng)“相對(duì)準(zhǔn)確”了,。但是顯然還沒有“淋漓盡致”,。 如何能夠把誤差的特征給與更準(zhǔn)確的描述呢?讓我們先來(lái)看看樣本均數(shù)和總體的關(guān)系吧,。 假定我們對(duì)同一個(gè)總體完成樣本量為1,,10和100的三種抽樣: 于是可見:每一次抽樣的均值都不會(huì)完全相同: 而且,樣本量越大的時(shí)候樣本平均值的離散程度越小,,也越接近總體平均值: 當(dāng)我們“無(wú)限重復(fù)“抽樣過(guò)程的時(shí)候,,我們可以對(duì)樣本均數(shù)所構(gòu)成的分布函數(shù)進(jìn)行如下描繪: 由此可見樣本均數(shù)同樣服從正態(tài)分布,且與其來(lái)源的總體具有相同的平均值,,只是離散趨勢(shì)會(huì)隨著樣本量的增大而逐漸縮小,。也就是樣本量越大的時(shí)候,我們計(jì)算的樣本均數(shù)越容易接近總體均數(shù)的真值,。 總體分布的離散特征-標(biāo)準(zhǔn)差和樣本均數(shù)分布的離散特征-標(biāo)準(zhǔn)誤之間的關(guān)系如下: 當(dāng)我們通過(guò)一個(gè)樣本來(lái)描述總體特征時(shí),,我們會(huì)用樣本均數(shù)和標(biāo)準(zhǔn)差(SD)描述樣本特征;用樣本均數(shù)和標(biāo)準(zhǔn)誤(SE)描述均值特征,。且在給定標(biāo)準(zhǔn)差的情況下,,樣本量越大標(biāo)準(zhǔn)誤就越小,均值的估算也就越準(zhǔn)確,。
那么可信區(qū)間又是什么呢,?這還要從正態(tài)分布概率密度函數(shù)的特征說(shuō)起。 正態(tài)分布概率密度函數(shù)的曲線下面積代表概率,,總面積為1,,通過(guò)計(jì)算可知,在均值±1.96倍標(biāo)準(zhǔn)差的區(qū)間內(nèi)其曲線下面積為0.95,。也就是說(shuō)數(shù)據(jù)落于在此區(qū)間外的概率僅有0.05,,是小概率事件,。這也構(gòu)成了我們計(jì)算95%可信區(qū)間的依據(jù)。 在針對(duì)某特定總體完成一次抽樣時(shí),,我們會(huì)以所獲得的樣本均數(shù)來(lái)估算總體均值,,這個(gè)樣本均數(shù)被稱為總體均數(shù)的點(diǎn)估計(jì)值。同時(shí)我們可以通過(guò)計(jì)算: (均值-1.96標(biāo)準(zhǔn)誤,,均值+1.96標(biāo)準(zhǔn)誤) 來(lái)完成針對(duì)總體均數(shù)的可信區(qū)間估計(jì),。 從圖中可見,來(lái)自樣本的點(diǎn)估計(jì)值與總體均數(shù)較為接近,,但并不重合,。通過(guò)區(qū)間估計(jì),我們可以看到樣本的均數(shù)落于區(qū)間估計(jì)的范疇之內(nèi) 如果完成了多次抽樣,,我們可以看到,,雖然每一次所獲得樣本均數(shù)都不相同但通過(guò)區(qū)間估計(jì),總體均數(shù)都落在了相應(yīng)的區(qū)間估計(jì)之內(nèi),。 因而,,區(qū)間估計(jì)的意義在于:雖然通過(guò)樣本研究無(wú)法直接知道總體均數(shù)的真值,但借助區(qū)間估計(jì)我們可以推知真值會(huì)處于區(qū)間中的某個(gè)位置,。 那么真值有沒有可能跑到區(qū)間以外呢,?當(dāng)然有可能啊,只是這樣的區(qū)間比較少,,少到僅有5%,,是可以接受的小概率事件。 因此樣本均數(shù)95%可信區(qū)間的含義在于:在特定條件的樣本分析中,,會(huì)有95%的區(qū)間會(huì)包括總體均數(shù)的真值,,而另外5%則未能將真值囊括其中。 計(jì)算舉例: 例如,在針對(duì)100例新生正常女嬰的身高調(diào)查中,發(fā)現(xiàn)女嬰出生時(shí)的身高為: 49.8 ± 1.6(cm) 則平均身高的95%可信區(qū)間上限及下限值分別為: 則針對(duì)新生正常女嬰平均身高的點(diǎn)估計(jì)值及其95%可信區(qū)間可表示為: 49.8(49.5, 50.1 ) |
|