也不知道P值是招誰惹誰了,反正大家都喜歡拿他開刷,!老早就有一篇爭議挺大的公眾號文章說「P值已死」,,立馬就有人反駁「別鬧了,P值沒死」,。其實,, Nature雜志在14年2月份時就刊發(fā)了一篇文章,對統(tǒng)計效度的金標準「P值」提出了質疑,,認為P值并沒有統(tǒng)計學家所認為的那樣可信,。 我們暫且把這個問題擱置一下,替P值君問一句:「為什么受傷的總是我呀,?是我是我還是我」真要說起個問題,,咱們得從統(tǒng)計學的框架說起。 現(xiàn)代統(tǒng)計學的框架 現(xiàn)代統(tǒng)計學兩分天下:一分統(tǒng)計描述,,一分統(tǒng)計推斷,。統(tǒng)計書上經常這樣表述:統(tǒng)計描述和統(tǒng)計推斷是現(xiàn)代統(tǒng)計學的兩個組成部分,兩者相輔相成,、缺一不可,,統(tǒng)計描述是現(xiàn)代統(tǒng)計學的基礎和前提,統(tǒng)計推斷是現(xiàn)代統(tǒng)計學的核心和關鍵,。 統(tǒng)計描述就是給數(shù)據(jù)拍張快照唄,,看看他們長什么樣子。我們熟知的均數(shù),、中位數(shù)就是用來看他們扎堆的位置,,扎在什么地方,;標準差、四分位數(shù)間距等就是用來看他們扎堆的程度,,扎得有多緊,。當然我們也可以用直方圖,箱線圖,,散點圖等統(tǒng)計圖形來更為形象直觀的查看,。 統(tǒng)計推斷是用我們手中的樣本數(shù)據(jù)來推斷其背后的總體特征。統(tǒng)計推斷里有兩大塊內容:參數(shù)估計和假設檢驗,。參數(shù)估計就是我們用樣本的統(tǒng)計量(如樣本均數(shù))去估計總體的參數(shù)(如總體均數(shù)),。此時,我們可以有兩種策略:一種是簡單了事,,直接把樣本統(tǒng)計量當做總體參數(shù),,這就是所謂的點估計;另外一種策略就是考慮到抽樣誤差,,我們用一個范圍,,而不是一個單一的值去估計總體參數(shù),此即所謂的區(qū)間估計,。而假設檢驗則是利用小概率反正法思想,,從問題的對立面(H0,原假設)出發(fā),,假定H0成立的條件下,,去計算檢驗統(tǒng)計量,獲得P值,,再通過P值來在H0,,H1(備擇假設)之間做進一步取舍。
既然統(tǒng)計推斷是現(xiàn)代統(tǒng)計學的核心和關鍵,,看到這里,,你也能體會到作為假設檢驗的黃金判定標準的P值,在統(tǒng)計學中的地位啦,。那具體而言,,什么是P值呢? P值和假設檢驗 什么是P值呢,?按照頻率學派的經典套路:
P值就是在H0為真時,,觀察到的差異來源于抽樣誤差的可能性大小。聽完這個解釋,,或許我們眼前能閃現(xiàn)一絲靈光,。我們以正態(tài)分布的Z檢驗為例簡要說明下,不知道不理解為什么那么多的統(tǒng)計教材竟然要以t檢驗為例來講假設檢驗,。如果你被他們毒害了,不知道什么是Z檢驗,,請看如下公式: 看不懂,?不著急。一步一步來,。依據(jù)「P值就是在H0為真時,,觀察到的差異來源于抽樣誤差的可能性的大小」這一定義,我們假定H0為真,,也就是假定樣本均數(shù)「X Bar」(即X頭上抬根杠,,微信編輯器什么時候能插入公式啊,只好擬音啦) 就等于總體均數(shù)「miu」(擬音),但是實際上,,我們利用手中的樣本數(shù)據(jù)計算的均數(shù) 「X Bar」和總體均數(shù)「miu」總是有差異的,,這個差異就是公式中的分子,但是這個差異缺乏一個統(tǒng)一的度量,,于是 我們除以一個 總體的變異幅度(暫且用標準誤代替,,也就是上圖中的分母), 這樣就得到一個以總體變異幅度來度量的差異,,也就是說這個差異是多個標準誤,,或者說差了多少個標準誤的距離,這個就是我們所說的統(tǒng)計量,,Z值?,F(xiàn)在在看看Z檢驗的公式,是否好容易理解多了,? 統(tǒng)計量Z值其實就是樣本均數(shù)和總體均數(shù)相差的,,以標準誤度量的單位量。
那么P值呢,?別急,。每一個Z值可以對應到一個相應的P值,,比如,Z=1.96表示 差了1.96倍標準誤的距離,,對應的P 值就是0.05,。 但是不同的分布,統(tǒng)計量不同,,因此難以標化統(tǒng)一,,不過P 值卻可以,而且在實際操作中,,由于計算機統(tǒng)計軟件包的發(fā)展,,P值也很容易獲得。 獲得P值后,,比如,,比如啊,P=0.003,,我們可以回過頭來想:既然我們已經假定H0為真了,,也就是(「X Bar」-「miu」)應該沒有差異了,但是現(xiàn)在還有Z倍標準誤的差異??! 那現(xiàn)在這個差異是哪里來的呢?只有一個可能的原因:抽樣誤差,。但是現(xiàn)在可以歸因于抽樣誤差的概率很小,,只有0.003啊(統(tǒng)計軟件計算結果),,0.003的概率,,1000次也才3次,竟然一次就讓我們趕上了,,這不太可能吧,?是的,確實不太可能,。那我們就只能回過頭來懷疑我們的根基,,我們的原假設H0錯了,因此我們否定H0,, 接受H1,。 這才是我們的假設檢驗。這才是我們的P值,。既然P值是假定H0為真的條件下,,我們所觀察到的差異來源于抽樣誤差的概率。這很容易讓我們想到,如果H0真的為真,,我們因P值<> I類錯誤的概率是不是P值呢,?To P or not to P, that's a question。 要說起清楚這個問題,,還得勞神費心另寫一篇:假設檢驗的前世今生,。 P.S.部分圖片來自Google搜索。 按: SAS官方在1月15日,,北上廣三地同時有線下活動,,感興趣的可以去看看。北京這邊某人有一個「醫(yī)學研究里的SAS PROC和SAS 繪圖主題的分享」,,可以去捧場,,或者踢館!報名:http://club./Active.aspx |
|
來自: 智慧之吻 > 《統(tǒng)計學》