假設(shè)檢驗也叫顯著性檢驗,,是以小概率反證法的邏輯推理,判斷假設(shè)是否成立的統(tǒng)計方法,,它首先假設(shè)樣本對應(yīng)的總體參數(shù)(或分布)與某個已知總體參數(shù)(或分布)相同,,然后根據(jù)統(tǒng)計量的分布規(guī)律來分析樣本數(shù)據(jù),利用樣本信息判斷是否支持這種假設(shè),并對檢驗假設(shè)做出取舍抉擇,,做出的結(jié)論是概率性的,,不是絕對的肯定或否定。 https://www.jianshu.com/p/46d9b111dffc
1,、T檢驗的概念
T檢驗是用于兩個樣本(或樣本與群體)平均值差異程度的檢驗方法,。它是用T分布理論來推斷差異發(fā)生的概率,從而判定兩個平均數(shù)的差異是否顯著,。
T檢驗的適用條件為樣本分布符合正態(tài)分布,。
T檢驗的應(yīng)用條件:
- 當(dāng)樣本例數(shù)較小時,要求樣本取自正態(tài)總體,;
- 做兩樣本均數(shù)比較時,,還要求兩樣本的總體方差相
等。
T檢驗的用途:(1)樣本均數(shù)與群體均數(shù)的比較,;(2)兩樣本均數(shù)的比較,。
2、假設(shè)檢驗的步驟
假設(shè)檢驗可以分為三步:(1)建立檢驗假設(shè)和確定檢驗水準(zhǔn),;(2)選定檢驗方法和計算檢驗統(tǒng)計量,;(3)確定P值和做出推斷結(jié)論。
2.1 建立檢驗假設(shè)和確定檢驗水準(zhǔn)
檢驗假設(shè)是針對總體特征而言,,包括相互對立的兩個方面,,即兩種假設(shè):一種是無效假設(shè)或稱原假設(shè)、零假設(shè),,符號為H0,,它是要否定的假設(shè);另一種是備擇假設(shè),,記為H1,,它是H0的對立面。二者是從反證法的思想提出的,, H1和H0是相互聯(lián)系,、又相互對立的假設(shè)。
假設(shè)檢驗還需根據(jù)不同研究目的事先設(shè)置是否拒絕原假設(shè)的判斷標(biāo)準(zhǔn),,即檢驗水準(zhǔn),。檢驗水準(zhǔn)也稱顯著性水準(zhǔn),它指無效假設(shè)H0為真,,但被錯誤地拒絕的一個小概率值,,一般取檢驗水準(zhǔn)α =0.05。
單側(cè)檢驗與雙側(cè)檢驗
· 在進(jìn)行t檢驗時,,如果其目的在于檢驗兩個總體均數(shù)是否相等,,即為雙側(cè)檢驗,。 例如檢驗?zāi)撤N新降壓藥與常用降壓藥效力是否相同?就是說,,新藥效力可能比舊藥好,,也可能比舊藥差,或者力相同,,都有可能,。
· 如果我們已知新藥效力不可能低于舊藥效力,例如磺胺藥+磺胺增效劑從理論上推知其效果不可能低于單用磺胺藥,,這時,,無效假設(shè)為H0:μ1=μ2, 備擇假設(shè)為H1: μ1>μ2 , 統(tǒng)計上稱為單側(cè)檢驗。
2.2 選定檢驗方法和計算檢驗統(tǒng)計量
要根據(jù)研究設(shè)計的類型和統(tǒng)計推斷的目的選用不同的檢驗方法,。如成組設(shè)計的兩樣本均數(shù)的比較用t檢驗,,多個樣本均數(shù)的比較用F檢驗。
檢驗統(tǒng)計量是用于抉擇是否拒絕H0的統(tǒng)計量(因此在我們確定檢驗假設(shè)H0,H1時,檢驗方法和檢驗統(tǒng)計量就已經(jīng)確定了),,其統(tǒng)計分布在統(tǒng)計推斷中是至關(guān)重要的,,不同的檢驗方法要用不同的方式計算現(xiàn)有樣本的檢驗統(tǒng)計量值。
2.3 確定P值和做出推斷結(jié)論
這里的P值是指由H0成立時的檢驗統(tǒng)計量出現(xiàn)在由樣本計算出來的檢驗統(tǒng)計量的末端或更末端處的概率值,。
當(dāng)P≤ α?xí)r,,結(jié)論為按所取檢驗水準(zhǔn)拒絕H0,接受H1,,這樣做出結(jié)論的理由是:在H0成立的條件下,,出現(xiàn)等于及大于現(xiàn)有檢驗統(tǒng)計量值的概率P≤ α ,是小概率事件,,這在一次抽樣中是不大可能發(fā)生的,,即現(xiàn)有樣本信息不支持H0因而拒絕它;若P>α,,即樣本信息支持H0,,就沒有理由拒絕它,,此時只好接受它,。
假設(shè)檢驗的兩類錯誤
Ⅰ型錯誤,第一類錯誤,、假陽性錯誤,就是在假設(shè)檢驗作推斷結(jié)論時,,拒絕了實際上是正確的原假設(shè)H0,其概率用α表示,。(拒絕正確)
Ⅰ型錯誤是針對原假設(shè)而言的,, α就是事先規(guī)定 的 允 許 犯 Ⅰ 型 錯 誤 的 概 率 值 , 如 規(guī) 定α=0.05,,意味著在某特定總體抽樣,, 100次拒絕H0的假設(shè)檢驗中,最多有5次允許發(fā)生第一類錯誤。與此相應(yīng),,推斷正確的可能性為1-α,, 1-α又稱為可信度。
Ⅱ型錯誤,,第二類錯誤,、假陰性錯誤, 即接受實際上是不成立的H0,。就是無效假設(shè)原本是不正確的,,但所算得的統(tǒng)計量不足以拒絕它,錯誤地得出了無差別的結(jié)論,。(接受錯誤)
Ⅱ型錯誤是針對備擇假設(shè)而言的,,其概率值用β表示。β值的大小一般未知,,只有在不
同總體特征已知的基礎(chǔ)上,,按預(yù)定的α和n才能做出估算。
|
H0 |
H0 |
|
True |
False |
Accept |
OK |
II Error |
Reject |
I Error |
OK |
3 T檢驗例子
3.1 樣本與總體均數(shù)的比較
大量檢測已知正常人血漿載脂蛋白E( apo E)總體平均水平為4.15mmol/L,。某醫(yī)師經(jīng)抽樣測得41例陳舊性心機梗死患者的血漿載脂蛋白E平均濃度為5.22mmol/L,,標(biāo)準(zhǔn)差為1.61mmol/L。據(jù)此能否認(rèn)為陳舊性心肌梗死患者的血漿載脂蛋白E平均濃度與正常人的平均濃度不一致,?
(1)建立檢驗假設(shè)和確定檢驗水準(zhǔn),。H0: μ=μ0,H1: μ≠μ0,,α=0.05,,雙側(cè)檢驗;
(2)選定檢驗方法和計算統(tǒng)計量,。用單樣本的t檢驗,,(3) 確定P值和作出推斷結(jié)論。查t分布表,, t0.05/2,40=2.021,, t=4.26>t0.05/2,40,P<0.05,。按α=0.05水準(zhǔn),,拒絕H0,接受H1,,可認(rèn)為陳舊性心肌梗死患者的血漿載脂蛋白E平均濃度與正常人的差別有統(tǒng)計學(xué)意義,,結(jié)合專業(yè)可以認(rèn)為前者平均濃度較高。
3.2 配對設(shè)計定量資料的t 檢驗
· 配對設(shè)計的t檢驗研究的是差值均數(shù)(樣本均數(shù))與理論上的差值總體均數(shù)的比較,。
· 首先計算出各對差值d的均數(shù),。當(dāng)兩種處理結(jié)果無差別或某種處理不起作用時,,理論上差值d的總體均數(shù)μd=0。
· 可將配對設(shè)計資料的假設(shè)檢驗視為樣本均數(shù)與總體均數(shù)μd=0的比較,。據(jù)定理:
將大白鼠配成8對,,每對分別飼以正常飼料和缺乏維生素E飼料,測得兩組大白鼠肝中維生素A的含量,,試比較兩組大白鼠中維生素A的含量有無差別,。
大白鼠配對號 |
正常飼料組 |
維生素E缺乏組 |
差數(shù)d |
1 |
3550 |
2450 |
1100 |
2 |
2000 |
2400 |
-400 |
3 |
3000 |
1800 |
1200 |
4 |
3950 |
3200 |
750 |
5 |
3800 |
3250 |
550 |
6 |
3750 |
2700 |
1050 |
7 |
3450 |
2500 |
950 |
8 |
3050 |
1750 |
1300 |
Mean |
3318.75 |
2506.25 |
812.5 |
(1)建立檢驗假設(shè)和確定檢驗水準(zhǔn)。H0: μd=0,,H1: μd≠0,,α=0.05,雙側(cè)檢驗,;
(2)選定檢驗方法和計算統(tǒng)計量,。(3) 確定P值和作出推斷結(jié)論。查t分布表(雙側(cè)),, t=4.2>t 0.05/2, 7 =2.365,P<0.05,。按 α= 0.05水準(zhǔn),拒絕H0,,接受H1,可以認(rèn)為兩種飼料喂養(yǎng)的兩組大白鼠中維生素A的含
量有差別,。正常飼料組比缺乏維生素E飼料組的含量要高。
4,、T檢驗類型
t檢驗有多種類型,,可以分為只有一組樣本的單體檢驗和有兩組樣本的雙體檢驗。單體檢驗用于檢驗樣本的分布期望是否等于某個值,。雙體檢驗用于檢驗兩組樣本的分布期望是否相等,,又分為配對雙體檢驗和非配對雙體檢驗。配對雙體檢驗的兩組樣本數(shù)據(jù)是一一對應(yīng)的,,而非配對雙體檢驗的兩組數(shù)據(jù)則是獨立的,。比如藥物實驗中,配對雙體檢驗適用于觀察同一組人服用藥物之前和之后,,非配對雙體檢驗適用于一組服用藥物而一組不服用藥物,。
1、單體檢驗
單體檢驗是針對一組樣本的假設(shè)檢驗,。零假設(shè)為H0: μ=μ0,。統(tǒng)計量服從自由度為n-1的 T 分布,。
2,、配對雙體檢驗
配對雙體檢驗針對配對的兩組樣本。配對雙體檢驗假設(shè)兩組樣本之間的差值服從正態(tài)分布,。如果該正態(tài)分布的期望為零,,則說明這兩組樣本不存在顯著差異,。零假設(shè)為 H0:μ=μ0,統(tǒng)計量服從n-1的T分布,,其中d是差值的平均值,,s是差值的樣本標(biāo)準(zhǔn)差。
3,、非配對雙體檢驗
非配對雙體檢驗針對獨立的兩組樣本,。非配對雙體檢驗假設(shè)兩組樣本是從不同的正態(tài)分布采樣出來的。根據(jù)兩個正態(tài)分布的標(biāo)準(zhǔn)差是否相等,,非配對雙體檢驗又可以分兩類,。一種是分布標(biāo)準(zhǔn)差相等的情況。零假設(shè)是兩組樣本的分布期望相等,,統(tǒng)計量 T 服從自由度為 n1+n2-2的T分布,。
其中x1和x2分別是兩組樣本的平均值,n1和n2分別是兩組樣本的大小,,s1和s2分別是兩組樣本的樣本標(biāo)準(zhǔn)差,。
另一種是分布標(biāo)準(zhǔn)差不相等的情況。零假設(shè)也是兩組樣本的分布期望相等,,統(tǒng)計量 T 服從 T 分布,。
思考
由于每次抽樣的樣本平均值都是圍繞著群體期望值分布,因此我們認(rèn)為只要某次抽樣平均值在接受零假設(shè)的區(qū)間內(nèi),,我們便接受零假設(shè)
|