1. 定義在統(tǒng)計學(xué)中,,一個樣本的置信區(qū)間是對總體參數(shù)的一個區(qū)間估計,。置信區(qū)間給出的是,聲稱總體參數(shù)的真實值在測量值的區(qū)間所具有的可信程度或者說是概率,。這個概率又叫做置信水平,。舉例來說:再一次大選中,上帝視角看到某人的支持率是55%,,而置信水平0.95上的置信區(qū)間是(50%,60%),,那么他的真實支持率落在50%到60%之間的概率為95%,如果分布是對稱的,,那么他支持率不足50%的概率只有2.5%,。 對于一個給定的情況,,置信水平越高,置信區(qū)間就會越大,。置信區(qū)間表示具體的某個范圍,,置信水平是一個概率,表示真實值落在這個區(qū)間內(nèi)的概率,。 2. 參數(shù)估計
參數(shù)估計主要包括點估計和區(qū)間估計,。其中點估計包括:一階矩、二階矩估計,、極大似然估計,、最小二乘法估計。而置信區(qū)間屬于區(qū)間估計,。 3. 置信區(qū)間我們通過對人類身高的估計來講解什么是置信區(qū)間,。 3.1 上帝視角對于人類的平均身高,沒有辦法全部統(tǒng)計,,因為人太多,。但是這個數(shù)據(jù)肯定是真實存在的,我們可以說,,上帝知道,。也就是說上帝視角可以看到人類身高的真是分布,假設(shè)滿足正態(tài)分布:均值145,,標準差1.4. 3.2 點估計愚蠢的人類想要統(tǒng)計平均身高,,沒有別的辦法,只能進行抽樣統(tǒng)計 比如在一次抽樣過程中,,我們把算出來的樣本均值畫在圖上,,藍色點表示: 那么這個抽樣的身高均值就是對真是平均身高的一次點估計。通過一次又一次的抽樣,,我們可以得到很多個不同的點估計: 現(xiàn)在,,關(guān)閉上帝視角,根本無法判斷哪個點估計更好: 總結(jié):對于點估計來說,,直接用樣本的均值去估計真實的均值,。看上去好像比區(qū)間估計要精確,。其實不是這樣的,,如果只用點估計,那么估計正確的概率為0.P(u1 = u) = 0 置信區(qū)間雖然依舊不知道哪個估計更好,,但是可以給出一個概率,。 3.3 置信區(qū)間提供的是一種區(qū)間估計的辦法。不再是直接估計參數(shù)的值,而是估計區(qū)間包含真實值的概率,。比如95%置信區(qū)間就是指,,給出的這個置信區(qū)間有95%的可能會包含真實值。(一般不說:參數(shù)的真實值會以95%的概率落在這個區(qū)間中,。因為參數(shù)的真實值不是隨機的,,他就一個值,而我們的區(qū)間才是隨機的變化的),。 用點估計給出的估計是X‘ 而用區(qū)間估計給出的是區(qū)間[X’-1, X’+1],區(qū)間估計估計正確的概率是: 依舊是之前估計人類身高的問題,,假設(shè)我們用一個固定長度的區(qū)間去估計人類身高的均值: 假設(shè)選定這個固定長度后,我們抽取不同的樣本,,得到了不同的估計區(qū)間,。對于某些抽取的樣本來說,估計的區(qū)間包含真實值(比如綠色),,另一些則不包含(比如紅色),。如果在100次的抽取樣本實驗過程中,有95次構(gòu)造的估計區(qū)間都包含了真實值,,那么置信度就為95%,。 3.4 置信區(qū)間的長度和中點是怎么得到的
假設(shè)人群身高符合正態(tài)分布: 其中均值不知道,但是方差已經(jīng)知道了,。目標:估計均值,。 我們不斷的對人群進行采樣,得到了一個大小為n的樣本空間,,樣本的均值為: 那么M也服從于正態(tài)分布: 接下來,,我們算出以u為中心,面積為0.95的一個區(qū)間,。在上帝視角看來是這樣的: 即: 那現(xiàn)在我們沒有辦法得到真實的均值,。那么只能用抽樣樣本的均值進行替換了。但是替換之后也出現(xiàn)了一個問題,,樣本均值和真實值之間存在一定偏差,,所以即時區(qū)間長度相同,得到的區(qū)間也不同,。假設(shè)我們抽樣得到了100個區(qū)間,,如下圖: 可以看到,有的區(qū)間包含了真實值,,有的區(qū)間沒有包含真實值,。那么100個區(qū)間,有多少個包含了真實值那,?答案是95%。換個問法:從這100個區(qū)間中隨機取一個區(qū)間,那么包含真實值的概率是多少那,?答案是95%,。 常見正態(tài)分布的圖還是可以記一哈: 3.5 如何評價區(qū)間估計的好壞
置信度是一個概率,表示估計的區(qū)間包含真實值的概率,。顯然,,置信度越大越好。 置信系數(shù)是置信度在參數(shù)空間上的下邊界,。因為對于不同的參數(shù),,估計出來的置信度不同,顯然,,我們希望最小的置信度也盡可能的大,。所以置信系數(shù)越大越好。 精確度標準很多,,最常用的是隨機區(qū)間的平均長度,,顯然平均長度越小越好。 |
|
來自: 鉞YUE > 《統(tǒng)計學(xué)》