參數(shù)估計的介紹

千里 2006-10-20

展開全文

參數(shù)估計的介紹

一、總體參數(shù)估計概述

　　統(tǒng)計推斷(Statistical inference)就是根據(jù)樣本的實際數(shù)據(jù),，對總體的數(shù)量特征作出具有一定可靠程度的估計和判斷,。統(tǒng)計推斷的基本內(nèi)容有參數(shù)估計和假設(shè)檢驗兩方面,。概括地說，研究一個隨機(jī)變量,，推斷它具有什么樣的數(shù)量特征,，按什么樣的模式來變動，這屬于估計理論的內(nèi)容,，而推測這些隨機(jī)變量的數(shù)量特征和變動模式是否符合我們事先所作的假設(shè),，這屬于檢驗理論的內(nèi)容。參數(shù)估計和假設(shè)檢驗的共同點是它們都對總體無知或不很了解,，都是利用部分觀察值所提供的信息,，對總體的數(shù)量特征作出估計和判斷，但兩者所要解決問題的著重點的所有方法有所不同,。本節(jié)先研究總體參數(shù)估計的問題,。

　　總體參數(shù)估計是以樣本統(tǒng)計量（即樣本數(shù)字特征）作為未知總體參數(shù)（即總體數(shù)字特征）的估計量，并通過對樣本單位的實際觀察取得樣本數(shù)據(jù),，計算樣本統(tǒng)計量的取值作為被估計參數(shù)的估計值,。

不論社會經(jīng)濟(jì)活動還是科學(xué)試驗，人們作出某種決策之前總是要對許多情況進(jìn)行估計,。例如商品推銷人員要估計新式時裝可能為消費者所學(xué)好的程度,，自選商場經(jīng)理要估計附近居民的購買能力，民意調(diào)查機(jī)構(gòu)要估計競選者的得票率,，醫(yī)藥生產(chǎn)部門要推廣某種藥品的新配方,，必須估計新藥療效的提高程度等等。這些估計通常是在信息不完全,、結(jié)果不確定的情況下作出,。參數(shù)估計為我們提供一套在滿足一定精確度要求下根據(jù)部分信息來估計總體參數(shù)的真值，并作出同這個估計相適應(yīng)的誤差說明的科學(xué)方法,。

　　科學(xué)的抽樣估計方法要具備三個基本條件,。

　　首先是要有合適的統(tǒng)計量作為估計量。我們知道統(tǒng)計量是樣本隨機(jī)變量的函數(shù),，根據(jù)樣本隨機(jī)變量可以構(gòu)造許多統(tǒng)計量,，但不是所有的統(tǒng)計量都能夠充當(dāng)良好的估計量。例如,，從一個樣本可以計算平均數(shù),、中位數(shù)、眾數(shù)等等,，現(xiàn)在要用來估計總體平均數(shù),，究竟以哪個樣本統(tǒng)計量作為估計量更合適，如果采用樣本平均數(shù)作為估計量,，這就需要回答樣本平均數(shù)和總體平均數(shù)存在什么樣的內(nèi)在聯(lián)系,，以樣本平均數(shù)作為良好估計量的標(biāo)準(zhǔn)是什么等等,。只有這些問題解決了，才能通過樣本的實際觀察確定估計值,，而估計值是參數(shù)估計的基礎(chǔ),。

　其次，要有合理的允許誤差范圍,。允許誤差范圍又稱抽樣極限誤差,，指樣本統(tǒng)計量與被估計總體參數(shù)離差的絕對值可允許變動的上限或下限。離差的絕對值愈小表明抽樣估計的準(zhǔn)確度愈高,，反之,，就表明準(zhǔn)確度愈差了。由于統(tǒng)計量本身也是隨機(jī)變量,，所以要使所做的估計完全沒有誤差是難以實現(xiàn)的,，但估計誤差也不能太大，估計誤差如果超過了一定限度參數(shù)估計本身也就會失去價值,。當(dāng)然也不見得誤差愈小就是愈好的估計,，因為減少誤差勢必增加費用、時間,，增加人力,、物力、財力的負(fù)擔(dān),，這樣甚至?xí)ソM織抽樣調(diào)查的意義,。所以在做估計的時候應(yīng)該根據(jù)所研究對象的變異程度和分析任務(wù)的要求確定一個合理的允許誤差范圍，凡估計值與被估計值之間的離差不超過允許范圍,，這種估計都算是有效的,。例如估計糧食畝產(chǎn)600公斤，允許誤差范圍6公斤,，這意味著如果實際的糧食畝產(chǎn)在594—606公斤之間都應(yīng)該認(rèn)為估計是有效的,。我們把允許誤差的區(qū)間594—606公斤稱為估計區(qū)間，允許誤差與估計值之比稱為誤差率,，(1–誤差率)稱為估計精度,，上例誤差率為6/600=1%，估計精度為1–1%=99%,。

　　再次,，要有一個可接受的置信度。估計置信度又稱估計推斷的概率保證程度,，這是估計的可靠性問題,。由于抽樣是隨機(jī)抽樣，統(tǒng)計量是隨機(jī)變量，估計值所確定的估計區(qū)間也是隨機(jī)的,，在實際抽樣中并不能做主被估計的參數(shù)真值都落在允許誤差的范圍內(nèi),。這就產(chǎn)生要冒多大風(fēng)險相信所作的估計,。如果一種估計可信度很低,，這就意味著所冒的風(fēng)險很大，這種估計也就沒有什么價值,。例如我們愿意冒10%的風(fēng)險,，這表示如果進(jìn)行多次重復(fù)估計，則平均每100次估計將10次是錯誤,，90次估計正確,。90%就稱為置信度或稱概率保證程度。在抽樣估計中要求達(dá)到100%的置信度是難以做到的,，但置信度小了,，估計結(jié)論的可靠性太低，又會影響估計本身的價值,，所以在做估計的時候,，也應(yīng)該根據(jù)所研究問題的性質(zhì)和工作的需要確定一個可接受的估計置信度。當(dāng)然估計置信度的要求和準(zhǔn)確度的要求應(yīng)該結(jié)合起來考慮,，估計的準(zhǔn)確度很高而置信度很低或準(zhǔn)確很低而置信度很高都是不合適的,。

本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間，所有內(nèi)容均由用戶發(fā)布,，不代表本站觀點,。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,，謹(jǐn)防詐騙,。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點擊一鍵舉報,。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自：千里 > 《數(shù)據(jù)分析》

舉報/認(rèn)領(lǐng)