久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

資源 | 一文學(xué)會(huì)統(tǒng)計(jì)學(xué)中的顯著性概念

 質(zhì)量管理顧問(wèn) 2018-10-12

大數(shù)據(jù)文摘出品

編譯:M.Y.Love,、茶西,、jin、蔣寶尚


這年頭,,你不會(huì)點(diǎn)兒統(tǒng)計(jì)學(xué),,你都不好意思出去闖蕩江湖。

α值,、P值,、假設(shè)檢驗(yàn)這都是些啥?一個(gè)小案例帶你了解的透透的,。


假設(shè)你是一所大學(xué)的院長(zhǎng),,你收到一份相關(guān)報(bào)告顯示你的學(xué)生每晚平均睡眠時(shí)間為6.80小時(shí),而全國(guó)大學(xué)學(xué)生的平均睡眠時(shí)間為7.02小時(shí),。


此時(shí),,學(xué)生會(huì)主席出于對(duì)學(xué)生健康的考慮,宣稱這項(xiàng)研究的結(jié)果證明了減少家庭作業(yè)是必須的,。另一方面,,校長(zhǎng)認(rèn)為這項(xiàng)研究是無(wú)稽之談:“在過(guò)去,我們能夠每晚睡4個(gè)小時(shí)就很好了,?!?/span>


但是,你必須決定這是否應(yīng)該引起重視,,這個(gè)問(wèn)題就可以使用統(tǒng)計(jì)學(xué)的知識(shí)來(lái)解決,。



我們經(jīng)常聽(tīng)到統(tǒng)計(jì)顯著性,但其實(shí)并沒(méi)有真正理解其含義,。如果有人聲稱數(shù)據(jù)可以證明他們的觀點(diǎn),,我們往往會(huì)不假思索的接受,因?yàn)槲覀兡J(rèn)統(tǒng)計(jì)分析員經(jīng)過(guò)了一系列復(fù)雜的數(shù)據(jù)分析后得出了不可置疑的結(jié)果,。


事實(shí)上,,統(tǒng)計(jì)顯著性并不復(fù)雜,也不需要經(jīng)過(guò)多年的學(xué)習(xí)才能掌握,,它是非常直截了當(dāng)?shù)乃悸?,每個(gè)人都可以并且應(yīng)該理解,。與大多數(shù)技術(shù)概念一樣,統(tǒng)計(jì)顯著性建立在一些簡(jiǎn)單的概念基礎(chǔ)上:假設(shè)檢驗(yàn),,正態(tài)分布和p值,。本文將闡述這些概念,并逐步解決上述例子中的問(wèn)題,。


假設(shè)檢驗(yàn)


我們要討論的第一個(gè)概念是假設(shè)檢驗(yàn)(hypothesis testing),,這是一種使用數(shù)據(jù)評(píng)估理論的方法?!凹僭O(shè)”是指研究人員在進(jìn)行研究之前對(duì)情況的初始信念,。這個(gè)初始信念被稱為備擇假設(shè)(alternative hypothesis),而相反的被稱為零假設(shè)(null hypothesis)(也叫原假設(shè)),。具體到例子中就是:


備擇假設(shè):本校學(xué)生的平均睡眠時(shí)間低于大學(xué)生的全國(guó)平均水平,。


零假設(shè):本校學(xué)生的平均睡眠事件不低于大學(xué)生的全國(guó)平均水平。


需要注意的是,,我們必須要謹(jǐn)慎用語(yǔ):因?yàn)槲覀円獧z驗(yàn)一個(gè)非常具體的效應(yīng),,所以需要在假設(shè)中規(guī)范用語(yǔ),才能在事后說(shuō)明我們確實(shí)驗(yàn)證了假設(shè)而非其他,。


假設(shè)檢驗(yàn)是統(tǒng)計(jì)學(xué)的基礎(chǔ)之一,,用于評(píng)估大多數(shù)研究的結(jié)果。適用范圍覆蓋了從評(píng)估藥物有效性的醫(yī)學(xué)試驗(yàn)到評(píng)估運(yùn)動(dòng)計(jì)劃的觀察性研究等各種研究,。


這些研究的共同點(diǎn)是,,他們關(guān)注兩組之間或樣本與整體之間進(jìn)行比較。例如,,在醫(yī)學(xué)中,,我們可以比較服用兩種不同藥物的群體之間得以恢復(fù)的平均時(shí)間。而在我們的問(wèn)題中,,需要比較本校學(xué)生和本國(guó)所有大學(xué)生之間的睡眠時(shí)間,。


有了假設(shè)檢驗(yàn),我們就可以使用證據(jù)來(lái)決定是零假設(shè)還是備擇假設(shè),。假設(shè)檢驗(yàn)有很多種,,這里我們將使用z檢驗(yàn)。但是,,在我們開(kāi)始測(cè)試數(shù)據(jù)之前,,還需要解釋另外兩個(gè)更重要的概念。


正態(tài)分布


第二個(gè)概念是正態(tài)分布(normal distribution),,也稱為高斯(Gaussian)或鐘形曲線(Bell curve),。正態(tài)分布是利用平均數(shù)和標(biāo)準(zhǔn)差來(lái)定義的數(shù)據(jù)分布形態(tài),其中平均數(shù)用希臘字母μ (mu)表示,,決定了分布的位置,,標(biāo)準(zhǔn)差用σ (sigma)表示,,決定了分布的幅度。


正態(tài)分布,,平均數(shù)μ和標(biāo)準(zhǔn)差σ


正態(tài)分布的應(yīng)用原理是根據(jù)標(biāo)準(zhǔn)差來(lái)評(píng)估觀測(cè)值,。我們可以根據(jù)與平均值的標(biāo)準(zhǔn)偏差數(shù)來(lái)確定觀測(cè)值的異常程度。正態(tài)分布具有以下屬性:

  • 68%的數(shù)據(jù)與平均值相差±1標(biāo)準(zhǔn)差

  • 95%的數(shù)據(jù)與平均值相差±2標(biāo)準(zhǔn)差

  • 99.7%的數(shù)據(jù)與平均值相差±3個(gè)標(biāo)準(zhǔn)差


如果我們統(tǒng)計(jì)量呈正態(tài)分布,,我們就可以根據(jù)與均值的標(biāo)準(zhǔn)偏差來(lái)表征任意觀測(cè)點(diǎn),。例如,美國(guó)女性的平均身高是65英寸(5英尺5英寸),,標(biāo)準(zhǔn)差為4英寸。如果我們新認(rèn)識(shí)了73英寸高的女性,,那么我們可以說(shuō)她比平均身高高出兩個(gè)標(biāo)準(zhǔn)差,,屬于2.5%的最高身高的女性(其中有2.5%的女性要矮于μ-2σ(57英寸),2.5%要高于μ 2σ),。


在統(tǒng)計(jì)學(xué)中,,我們不直接說(shuō)我們的數(shù)據(jù)與平均值相差兩個(gè)標(biāo)準(zhǔn)差,而是用z分?jǐn)?shù)來(lái)評(píng)估,,z分?jǐn)?shù)表示觀測(cè)值與平均值之間的標(biāo)準(zhǔn)差的數(shù)量,。我們需要利用公式將數(shù)據(jù)轉(zhuǎn)化為z分?jǐn)?shù):觀測(cè)值減去平均值,除以標(biāo)準(zhǔn)差(見(jiàn)下圖),。在身高的示例中,,我們可以得到朋友的身高的z分?jǐn)?shù)為2。如果我們對(duì)所有觀測(cè)值進(jìn)行z分?jǐn)?shù)轉(zhuǎn)化,,就會(huì)得到一個(gè)新的分布——標(biāo)準(zhǔn)正態(tài)分布,,其平均值為0,標(biāo)準(zhǔn)差為1,,如圖所示:

從正態(tài)分布(右)到標(biāo)準(zhǔn)正態(tài)分布(左)的轉(zhuǎn)換,。


每次我們進(jìn)行假設(shè)檢驗(yàn)時(shí),都需要假定一個(gè)檢驗(yàn)統(tǒng)計(jì)量,,在我們的例子中是學(xué)生的平均睡眠時(shí)間,。在z檢驗(yàn)中,我們通常假定統(tǒng)計(jì)檢驗(yàn)量的分布近似正態(tài)分布,。因?yàn)?,根?jù)中心極限定理(central limit theorem),從總體數(shù)據(jù)中獲得越多的數(shù)據(jù)值,,這些數(shù)據(jù)值的平均數(shù)則越接近于正態(tài)分布,。


然而,這始終是一個(gè)估計(jì),,因?yàn)檎鎸?shí)世界的數(shù)據(jù)永遠(yuǎn)不會(huì)完全遵循正態(tài)分布,。假設(shè)正態(tài)分布能夠讓我們確定在研究中觀察到的結(jié)果有多少意義,,我們可以觀察z分?jǐn)?shù),z分?jǐn)?shù)越高或越低,,結(jié)果越不可能是偶然發(fā)生,,也就越具有意義。為了量化結(jié)果的意義,,我們需要使用另一個(gè)概念,。


P值和α是個(gè)啥!


最后的核心概念是p值,。p值是當(dāng)零假設(shè)為真時(shí)所得觀察到的結(jié)果,,或是更為極端的結(jié)果出現(xiàn)的概念。這有點(diǎn)令人費(fèi)解,,所以讓我們來(lái)看一個(gè)例子,。


假設(shè)我們要比較美國(guó)佛羅里達(dá)州和華盛頓州人民的平均智商。我們的零假設(shè)是華盛頓的平均智商不高于佛羅里達(dá)的平均智商,。


通過(guò)研究發(fā)現(xiàn),,華盛頓州的人民智商比佛羅里達(dá)州人民智商高2.2,其p值為0.346(大于顯著性水平),。這意味著,,零假設(shè)“華盛頓的平均智商不高于佛羅里達(dá)的平均智商”為真,也就是說(shuō),,華盛頓的智商實(shí)際上并沒(méi)有更高,,但是由于隨機(jī)噪聲的影響,仍然有34.6%的概率我們會(huì)測(cè)量到其智商分?jǐn)?shù)會(huì)高出2.2分,。之后隨著p值降低,,結(jié)果就更有意義,因?yàn)樵肼暤挠绊懸矔?huì)越來(lái)越小,。


這個(gè)結(jié)果是否具有統(tǒng)計(jì)意義取決于我們?cè)趯?shí)驗(yàn)開(kāi)始之前設(shè)定的顯著性水平——alpha,。如果觀察到的p值小于α,則結(jié)果在統(tǒng)計(jì)學(xué)上具有意義,。我們需要在實(shí)驗(yàn)前選擇alpha,,因?yàn)槿绻鹊綄?shí)驗(yàn)結(jié)束再選擇的話,我們就可以根據(jù)我們的結(jié)果選一個(gè)數(shù)字來(lái)證明結(jié)果是顯著的,,卻不管數(shù)據(jù)真正顯示了什么,,這是一種數(shù)據(jù)欺騙的行為。



α的選擇取決于實(shí)際情況和研究領(lǐng)域,,但最常用的值是0.05,,相當(dāng)于有5%的可能性結(jié)果是隨機(jī)發(fā)生的。在我的實(shí)驗(yàn)中,從0.1到0.001之間都是比較常用的數(shù)值,。也有較為極端的例子,,發(fā)現(xiàn)希格斯玻色子(Higgs Boson particle)的物理學(xué)家使用的p值為0.0000003,即350萬(wàn)分之一的概率結(jié)果由偶然因素造成,。(現(xiàn)代統(tǒng)計(jì)學(xué)之父R.A.Fischer不知為什么,,隨便選擇了0.05為p值,很多統(tǒng)計(jì)學(xué)家極其不想承認(rèn)這一點(diǎn),,并且這個(gè)值現(xiàn)在讓許多統(tǒng)計(jì)學(xué)家非常困擾與擔(dān)憂),!


要從z值得到p值,我們需要使用像R這樣的表格統(tǒng)計(jì)軟件,,它們會(huì)在結(jié)果中將顯示z值低于計(jì)算值的概率,。例如,z值為2,,p值為0.977,,這意味著我們隨機(jī)觀察到z值高于2的概率只有2.3%。


正態(tài)分布下z值低于2的概率為97.7%


總結(jié)應(yīng)用


我們做個(gè)總結(jié),,截止到目前提到了三個(gè)概念


1.假設(shè)檢驗(yàn):用來(lái)檢驗(yàn)理論的方法。


2.正態(tài)分布:假設(shè)檢驗(yàn)中對(duì)數(shù)據(jù)分布形態(tài)的近似表示,。


3.P值:當(dāng)零假設(shè)為真時(shí)觀察到的或是出現(xiàn)更為極端結(jié)果的概率,。


現(xiàn)在讓我們把這些概念帶入到我們的例子中:


根據(jù)國(guó)家睡眠基金會(huì)(the National Sleep Foundation)的數(shù)據(jù),全國(guó)學(xué)生平均每晚睡眠時(shí)間為7.02小時(shí),。


針對(duì)本校202名學(xué)生進(jìn)行的一項(xiàng)調(diào)查發(fā)現(xiàn),,本校學(xué)生的平均每晚睡眠時(shí)間為6.90小時(shí),標(biāo)準(zhǔn)差為0.84小時(shí),。


我們的備擇假設(shè)是,,本校學(xué)生的平均睡眠時(shí)間少于全國(guó)大學(xué)生的平均睡眠時(shí)間。


我們將選取0.05為α值,,這意味著當(dāng)p值低于0.05時(shí),,結(jié)果是顯著的。


首先,,我們需要把測(cè)量值轉(zhuǎn)換成z分?jǐn)?shù),,用測(cè)量值減去平均值(全國(guó)大學(xué)生平均睡眠時(shí)間),除以標(biāo)準(zhǔn)差與樣本量平方根的商(如下圖),。另外,,隨樣本量的增加,標(biāo)準(zhǔn)差亦隨之減少,,這一點(diǎn)可以用標(biāo)準(zhǔn)差除以樣本量的平方根來(lái)解釋,。

轉(zhuǎn)換為Z值


Z分?jǐn)?shù)就是我們的檢驗(yàn)統(tǒng)計(jì)量。一旦我們有了檢驗(yàn)統(tǒng)計(jì)量,我們就可以使用像R這樣的程序語(yǔ)言來(lái)計(jì)算p值,。這里展示代碼只是為了說(shuō)明使用這些免費(fèi)的分析工具來(lái)進(jìn)行操作是多么的容易,!(#號(hào)是表示備注,加粗字體是輸出值)


# Calculate the results
z_score = (6.90 - 7.02) / (0.84 / sqrt(202))
p_value = pnorm(z_score)

# Print our results
sprintf('The p-value is %0:5f for a z-score of %0.5f.', p_value, z_score)

'The p-value is 0.02116 for a z-score of -2.03038.'


因?yàn)閜值為0.02116,,所以我們可以拒絕零假設(shè)(統(tǒng)計(jì)學(xué)家喜歡說(shuō)拒絕零假設(shè),,而不是接受備擇假設(shè)。) ,。也就是說(shuō),,雖然我們的結(jié)果有2.12%的概率由隨機(jī)噪聲引起,但在顯著性水平為0.05的情況下,,本校學(xué)生平均睡眠時(shí)間比美國(guó)大學(xué)生平均睡眠時(shí)間少,,這一假設(shè)在統(tǒng)計(jì)學(xué)上顯著。因此,,在這場(chǎng)辯論中,,學(xué)生會(huì)主席的觀點(diǎn)得到了支持。


但是,,我們不能太過(guò)相信這一結(jié)果,,而立即叫停所有的家庭作業(yè)。因?yàn)?,如果我們選用0.01為臨界值,,則p值(0.02116)未達(dá)到顯著。所以,,如果有人想要證明相反的觀點(diǎn),,可以簡(jiǎn)單地通過(guò)操縱p值來(lái)實(shí)現(xiàn)。因此,,無(wú)論何時(shí),,當(dāng)我們審查一項(xiàng)研究時(shí),除了結(jié)論外,,我們還應(yīng)該考慮p值和樣本大小,。


本例中,因?yàn)?02是個(gè)相對(duì)較小的樣本數(shù)量,,所以我們的研究結(jié)果不僅有統(tǒng)計(jì)意義,,同時(shí)具有實(shí)際意義。需要說(shuō)明的是,,這是一項(xiàng)觀察性研究,,只有相關(guān)性,而不能得出因果關(guān)系,。我們的結(jié)果表明了本校學(xué)生和平均睡眠不足是有之間的相關(guān)關(guān)系,,但并不是意味著來(lái)我們學(xué)校會(huì)導(dǎo)致睡眠減少,,這其中可能還存在其他因素影響睡眠,只有通過(guò)隨機(jī)對(duì)照研究才能證明其因果關(guān)系,。


與大多數(shù)技術(shù)概念一樣,,統(tǒng)計(jì)顯著性并不那么復(fù)雜,只是許多小概念的集成體,,最主要的麻煩來(lái)自于學(xué)習(xí)那些術(shù)語(yǔ),!但是一旦你掌握了這些小概念,并將其結(jié)合起來(lái),,就可以開(kāi)始應(yīng)用這些統(tǒng)計(jì)概念了,。


你會(huì)發(fā)現(xiàn),當(dāng)掌握了統(tǒng)計(jì)學(xué)的基本知識(shí)后,,你就能夠以一種健康的懷疑態(tài)度來(lái)更好的審視一些研究和信息,,你可以看到數(shù)據(jù)實(shí)際上表達(dá)了什么,而不是別人告訴你數(shù)據(jù)意味著什么,?;蛟S這就是對(duì)付狡猾的政客和公司的最佳策略——通過(guò)統(tǒng)計(jì)知識(shí)的普及與訓(xùn)練來(lái)提高公眾的質(zhì)疑能力。


相關(guān)報(bào)道:

https:///statistical-significance-hypothesis-testing-the-normal-curve-and-p-values-93274fa32687

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,,所有內(nèi)容均由用戶發(fā)布,,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式,、誘導(dǎo)購(gòu)買(mǎi)等信息,,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多