中心極限定理告訴你為何萬(wàn)千分布獨(dú)愛(ài)正態(tài)分布一個(gè) 通過(guò)前面幾篇關(guān)于正態(tài)分布基礎(chǔ)知識(shí)的鋪墊,,本篇解讀中心極限定理,,圖示原本服從均勻分布的隨機(jī)變量均值以及隨機(jī)變量之和如何近似服從正態(tài)分布。 準(zhǔn)備考綠帶,、黑帶的朋友注意了:中心極限定理是必考題,,尤其是作為綠帶的計(jì)算題,掌握了就是送分題,。 中心極限定理 小王說(shuō):我超愛(ài)抄書(shū),。翻開(kāi)第三版《六西格瑪管理》第158頁(yè),定理2(中心極限定理): 設(shè)X1,,X2,,...,Xn是n個(gè)獨(dú)立同分布的隨機(jī)變量,,且有有限的數(shù)學(xué)期望和方差,,分布均值為μ,方差為σ2,,則當(dāng)n較大時(shí),,有 當(dāng)X的分布對(duì)稱(chēng)時(shí),只要n≥5,,近似效果就比較理想,;當(dāng)Xi的分布不對(duì)稱(chēng)時(shí),要求n值較大,,一般n≥30時(shí)近似效果較理想,。 這個(gè)定理表明:無(wú)論隨機(jī)變量服從何種分布,可能是離散分布,,也可能是連續(xù)分布,,連續(xù)分布可能是正態(tài)分布,也可能是非正態(tài)分布,,只要獨(dú)立同分布隨機(jī)變量的個(gè)數(shù)n較大,,那么,隨機(jī)變量之和的分布,、隨機(jī)變量均值X的分布都可近似為正態(tài)分布,。 小王說(shuō):抄書(shū)完畢。依舊來(lái)燒腦畫(huà)圖理解書(shū)上的內(nèi)容尤其是藍(lán)字部分,,再告訴準(zhǔn)備參加中質(zhì)協(xié)綠帶,、黑帶考試的朋友,一般考中心極限定理的題目怎么考,。 X1,,X2,,...,Xn是n個(gè)獨(dú)立同分布就不用再說(shuō)了,,在《趣說(shuō)正態(tài)分布2》和《趣說(shuō)正態(tài)分布3》都提到過(guò),,下圖圖示就是獨(dú)立同分布的形態(tài)。 舉個(gè)簡(jiǎn)單一點(diǎn)的例子吧,,投骰子: 一個(gè)均勻的骰子投擲6000次,,6個(gè)面出現(xiàn)的概率基本一致,理想的分布是1,,2,,3,4,,5,,6點(diǎn)每個(gè)面出現(xiàn)約1000次,這是離散均勻分布,,投擲次數(shù)一多,,機(jī)會(huì)非常平均,如下圖,,所以呀,,均勻分布還有個(gè)昵稱(chēng)叫矩形分布。 小潘:數(shù)學(xué)怎么還有昵稱(chēng)呢,,你編的吧? 小王:小潘,,你在家的昵稱(chēng)或者小名叫什么呀,? 小潘笑嘻嘻的操起一副京腔:不告兒你,呵呵,。 小王接著說(shuō):不告就不告,。來(lái)了啊,變魔術(shù)的時(shí)刻到了,。 這么四四方方一個(gè)圖,,將兩次抽樣X(jué)1和X2進(jìn)行平均,得到的圖形應(yīng)該長(zhǎng)啥樣呢,?如下圖,。 上面是n=2的情況,前面藍(lán)字部分書(shū)上的內(nèi)容說(shuō)了:可能是離散分布,,也可能是非正態(tài)分布,,只要獨(dú)立同分布隨機(jī)變量的個(gè)數(shù)n較大,那么,,隨機(jī)變量均值X的分布都可近似為正態(tài)分布,。注意是近似哦,,看作是。 我們將5次抽樣X(jué)1,,X2,,...X5進(jìn)行平均,得到的圖形應(yīng)該長(zhǎng)啥樣呢,?如下圖,。 將30次抽樣X(jué)1,X2,,...X30進(jìn)行平均,,得到的圖形應(yīng)該長(zhǎng)啥樣呢?如下圖,。 圖形不是我們的重點(diǎn),,看到有一根紅色的概率密度曲線象正態(tài)分布的樣子能理解就可以了,重點(diǎn)是看看圖中紅圈圈圈著的標(biāo)準(zhǔn)差:當(dāng)n=2的時(shí)候,,標(biāo)準(zhǔn)差=1.207,;當(dāng)n=5的時(shí)候,標(biāo)準(zhǔn)差=0.7792,;當(dāng)n=30的時(shí)候,,標(biāo)準(zhǔn)差=0.3118,均值μ=3.495,、3.494及3.503,,倒是變化不大。這怎么回事呢,? 括號(hào)里面的均值μ沒(méi)變,,方差變了。所以,,無(wú)論n=2,,n=5,還是n=30,,均值μ確實(shí)基本相同,。因?yàn)槭浅闃樱疽恢?,不是完全分毫不差哦?br>我們用計(jì)算器來(lái)算幾個(gè)數(shù)字: 1,、假設(shè)總體就是n=30,我們已知的標(biāo)準(zhǔn)差=0.3118,,現(xiàn)在假設(shè)不知道這個(gè)總體標(biāo)準(zhǔn)差的值,,用樣本來(lái)估算: 反過(guò)來(lái): 2、假設(shè)已知總體n=30,,標(biāo)準(zhǔn)差=0.3118,,計(jì)算樣本標(biāo)準(zhǔn)差: ① 用n=2的樣本來(lái)估算總體,,則: ② 用n=5的樣本來(lái)估算總體的,則: 3,、n=2和n=5之間的換算略,。 考友們注意了,考友們注意了,。 考試一定會(huì)考標(biāo)準(zhǔn)差或方差的換算,,也許是公式,也許是簡(jiǎn)單的數(shù)字計(jì)算,,理解了就好,,不會(huì)有上面的例子數(shù)據(jù)這么難算的。雖說(shuō)可以帶計(jì)算器,,畢竟考試時(shí)間有限,,一般計(jì)算題會(huì)是一眼能算出來(lái)的數(shù)字,比如25,、16,、9、4,、1的開(kāi)平方,,真出了計(jì)算起來(lái)很麻煩的題,可能會(huì)只考公式不會(huì)考計(jì)算結(jié)果,??碱}再怎么翻來(lái)覆去的也逃不過(guò)如來(lái)的五指山,兩個(gè)方向:不論考題說(shuō)總體標(biāo)準(zhǔn)差知道,,計(jì)算樣本標(biāo)準(zhǔn)差,;還是用樣本去估算總體。實(shí)質(zhì)概念不變,,都是為了考對(duì)中心極限定理的理解。 重要事情再說(shuō)一遍: 考試會(huì)比我們這個(gè)例子更簡(jiǎn)單,,因?yàn)榭碱}只有2個(gè)方向: ① 一般會(huì)直接說(shuō)樣本的方差或標(biāo)準(zhǔn)差(沒(méi)我們上面計(jì)算中的根號(hào)2或根號(hào)5什么事),,推算總體方差或標(biāo)準(zhǔn)差; ② 已知總體方差或標(biāo)準(zhǔn)差,,計(jì)算樣本的方差或標(biāo)準(zhǔn)差,。 考友們注意了: ① 把n=幾看清楚; ② 把題目問(wèn)的是方差還是標(biāo)準(zhǔn)差看清楚,,區(qū)別只是要不要開(kāi)根號(hào)而已,,沒(méi)有難度。 理解了中心極限定理本尊,,書(shū)上159頁(yè)再說(shuō)什么標(biāo)準(zhǔn)誤,,就沒(méi)有難度了,,不過(guò)還是把書(shū)抄一下吧: 統(tǒng)計(jì)學(xué)中把均值X的標(biāo)準(zhǔn)差稱(chēng)為均值的標(biāo)準(zhǔn)誤,記為σX或SEM(standard error of the mean),,無(wú)論是正態(tài)還是非正態(tài),,均值的標(biāo)準(zhǔn)誤都有,SEM隨著n的增加而減少,。 是的,,樣本和總體的標(biāo)準(zhǔn)差叫標(biāo)準(zhǔn)差,這個(gè)標(biāo)準(zhǔn)差是正宮娘娘生的,,直接正名,;標(biāo)準(zhǔn)差的名字被用掉了,那隨機(jī)變量均值X生出來(lái)的標(biāo)準(zhǔn)差就不能再直接叫標(biāo)準(zhǔn)差了,,為了體現(xiàn)他們的兄弟情,,叫標(biāo)準(zhǔn)誤,實(shí)際上還是長(zhǎng)成標(biāo)準(zhǔn)差的模樣無(wú)異,,考試的時(shí)候只要看到隨機(jī)變量均值X和方差或標(biāo)準(zhǔn)差,,請(qǐng)馬上聯(lián)想到中心極限定理,而且在考題中不一定會(huì)說(shuō)成標(biāo)準(zhǔn)誤哦,,也許就叫標(biāo)準(zhǔn)差,。 考試考來(lái)考去就考藍(lán)色標(biāo)記的這個(gè)公式,知道中心極限定理,,這個(gè)藍(lán)色標(biāo)記的公式就順理成章了,,不用死記硬背。 以上是隨機(jī)變量均值X的情況,,隨機(jī)變量之和道理也一樣,。 呀,突然發(fā)現(xiàn)有2個(gè)均值,,數(shù)學(xué)君沒(méi)給他們起別名,。為了避免混淆,通篇重新寫(xiě)清楚是隨機(jī)變量均值X還是近似服從正態(tài)分布的樣本或總體的均值μ,。上面圖形圈了紅圈圈的均值是括號(hào)里面的具體數(shù)值均值μ,。 是的,隨機(jī)變量之和的分布與隨機(jī)變量均值的分布,,道理也一樣,。嗚嗚,好想數(shù)學(xué)君也像標(biāo)準(zhǔn)差改成標(biāo)準(zhǔn)誤一樣給和值的均值和標(biāo)準(zhǔn)差也起個(gè)均直直和標(biāo)準(zhǔn)叉叉啥的別名,,這下都不會(huì)寫(xiě)了,,你自己仔細(xì)看括號(hào)里面的均值和方差變化吧,也好 理解,正態(tài)分布就涉及均值和方差兩個(gè)參數(shù),,獨(dú)立同分布的隨機(jī)變量都相加,,括號(hào)里的均值和方差都多了n倍。 近似服從均值為nμ,、方差為nσ2的正態(tài)分布N(nμ,nσ2),,我們也畫(huà)圖瞧瞧唄。 X1+X2的圖形: X1+X2+X3+X4+X5的圖形: X1+X2+...+X30的圖形: 小王嘆了口氣,,說(shuō):本文圖示了均勻分布變成近似正態(tài)分布,,沒(méi)想到還要標(biāo)注此均值非彼均值,好累啊,。等我有空下次再給你舉其他分布比如指數(shù)分布的例子,。只要n夠大,只有柯西分布沒(méi)有樣本均值而不可以,,其他什么指數(shù)分布,、對(duì)數(shù)分布、均勻分布,,統(tǒng)統(tǒng)都可以近似正態(tài)分布,。 小潘急忙說(shuō):你必須有空。要是都這樣了,,那我們可以偷偷懶不去煩心那些復(fù)雜的源數(shù)據(jù)到底是什么分布,,直接抽樣30組或以上數(shù)據(jù),看成正態(tài)分布來(lái)對(duì)待就好啦,。至少現(xiàn)在正態(tài)分布的圖形在我腦海中是清晰的,,其他已經(jīng)早就還給老師了。嗯,,難怪你大書(shū)特書(shū)正態(tài)分布,,又加深認(rèn)識(shí)了。 原文來(lái)源張馳咨詢(xún):未經(jīng)作者同意,,如有轉(zhuǎn)發(fā)需要必須在文章中給出原文鏈接,,否則必究! |
|
來(lái)自: 六西格瑪培訓(xùn) > 《六西格瑪文章》