第六部分心理統(tǒng)計學筆記 (1)基本概念 總體:具有某些共同的,、可觀測特征的一類事物的全體,,構成總體的每個基本單元稱為個體 樣本:由于不能或沒必要對整個總體進行研究,我們只能從總體中選擇出一些個體代表總體,,這些個體的集合叫樣本 變量:本身是變化的或者對于不同個體有不同值得特征或條件 常量:本身不變且對不同的個體的值也相同 參數:描述總體的數值,,它可以從一次測量中獲得,也可以從總體的一系列測量中推論得到 比例:全組中取值為X的比例,,p=f/N 插值法:一種求兩個已知數值之間中間值的方法,,其假設所求解點附近數據呈線性變化 統(tǒng)計量:描述樣本的數值,與參數的獲得方式相同 隨機取樣:從總體抽取樣本的一種策略,,要求總體中的每一個個體被抽到的機會均等 取樣誤差:樣本統(tǒng)計量與相應的總體參數之間的差距 偏態(tài)分布:分數堆積在分布的一端,,而另一端成為比較尖細的尾端,其與對稱分布對應 次數分布:一批數據在某一量度的每一個類目所出現的次數情況 離散型變量:由分離的,、不可分割的范疇組成,,臨近范疇之間沒有值存在 連續(xù)型變量:在任何兩個觀測值之間都存在無限多個可能值,它可被分割成無限多個組成部分 (2)學習建議 ①將注意放在概念上,心理統(tǒng)計應該是一門概念性的科學,,而非純數學,。 ②一定要將統(tǒng)計方法與心理學研究的情景結合起來學習。 ③弄懂一個概念再開始學習下一個,,心理統(tǒng)計中的概念應用性較差卻是之后做題的基礎,。 ④做題按照推薦格式能避免出錯幾率。 (3)統(tǒng)計檢驗總表
一,、描述統(tǒng)計描述統(tǒng)計是指用來整理,、概括、簡化數據的統(tǒng)計方法,,側重于描述一組數據的全貌,,表達一件事物的性質。 (一)統(tǒng)計圖表統(tǒng)計表和統(tǒng)計圖簡單明確,、生動直觀地表達數量關系,,具有一目了然、整潔美觀,、容易理解等特點,。它們是對數據進行初步整理,以簡化的形式加以表現的兩種最簡單的方式,。在制定統(tǒng)計圖表之前,,一般首先要對數據進行以下兩種初步整理: ①數據排序:按照某種標準,對收集到的雜亂無章的數據按照一定順序標準進行排列 ②統(tǒng)計分組:根據被研究對象的特征,,將所得到數據劃分到各個組別中去 1.統(tǒng)計圖統(tǒng)計圖:用點,、線、面的位置,、升降或大小來表達統(tǒng)計資料數量關系的一種陳列形式 組成:坐標軸,、圖號、圖題,、圖目,、圖尺、圖形,、圖例,、圖注 分類:條形圖、圓圖,、線性圖,、直方圖、散點圖,、莖葉圖 2.統(tǒng)計表統(tǒng)計表:將要統(tǒng)計分析的事物或指標以表格的形式列出來,,以代替煩瑣文字描述的一種表現形式 組成:隔開線,、表號、名稱,、標目,、數字、表注 分類:簡單表,、分組表,、復合表 (二)集中量數集中量數又叫集中趨勢,是體現一組數據一般水平的統(tǒng)計量,。它能反映頻數分布中大量數據向某一點集中的情況,。 1.算數平均數(1)定義 算數平均數:即所有觀察值的總和與總頻數之商,簡稱為平均數或均數 平均數一般與標準差,、方差相結合使用,。
(2)特點 ①在一組數據中每個變量與平均數之差的總和等于零 ②在一組數據中,每一個數都加上一個常數C,,所得的平均數為原來的平均數加常數C ③在一組數據中,,每一個數都乘以一個常數C,,所得的平均數為原來的平均數乘以常數C (3)意義 算數平均數是應用最普遍的一種集中量數,,它在大多情況下是真值最好的估計值。 (4)優(yōu)缺點 優(yōu)點:反應靈敏,、計算嚴密,、計算簡單、簡明易解,、適合于進一步用代數方法鹽酸,、較少受抽樣變動的影響 缺點:易受極端數據的影響、不能在出現模糊數據時計算 2.中數(1)定義 中數:按順序排列在一起的一組數據中居于中間位置的數,,在這組數據中,,有一半數據比它大,一般數據比它小,,等價于百分位數是50的那個數,。 (2)算法 ①數列總個數為奇數時,第 (n+1)/2 個數就是中數 ②數列總個數為偶數時,,可取位于中間的兩個數的平均數作為中數 ③分布中有相等的數時,,將重復的數字看成一個連續(xù)體,利用中間分數的精確上下限使用插值法 (3)優(yōu)缺點 優(yōu)點:計算簡單,、容易理解,、不受極端值影響、能在有模糊數據情況下使用,、可在順序型數據時使用 缺點:代表性低,、不夠靈敏,、穩(wěn)定性低、需要排序,、不能進一步做代數運算 3.眾數(1)定義 眾數:在次數分布中出現次數最多的那個數的數值 眾數可能不只一個,。在正偏態(tài)分布時,平均數最靠近尾端,,中數位于其與眾數之間,。 (2)優(yōu)缺點 優(yōu)點:能在數據不同質的情況使用,能避免極端值干擾 缺點:不穩(wěn)定,、代表性差,、不夠靈敏、不能做進一步的代數運算 (三)差異量數差異量數就是對一組數據的變異性,,即離中趨勢特點進行度量和描述的統(tǒng)計量,,也稱為離散量數。 1.離差與平均差離差:分布中的某點到均值得距離,,其符號表示了某分屬于均值之間的位置關系而數值表示了它們之間的絕對距離 離差之和始終為零,。
平均差:次數分布中所有原始數據與平均數絕對離差的平均值
2.方差與標準差和方:每一個離差值平房求和 由于離差正負值互相抵消無法代表離中趨勢我們引入和方的概念
(1)總體的方差和標準差 方差:每個數據與該組數據平均數之差乘方后的均值,即離均差平房后的均數 作為樣本統(tǒng)計量用符號s2表示,,作為總體參數用符號σ2表示,,也叫均方。
標準差:方差的平方根 作為樣本統(tǒng)計量用符號s表示,,作為總體參數用符號σ表示,。
(2)樣本的方差和標準差 樣本的變異性往往比它來自的總體的變異性要小。為了校正樣本數據帶來的偏差,,在計算樣本方差時,,我們用自由度來矯正樣本誤差,從而有利于對總體參數更好的無偏差估計:
(3)性質 ①每一個觀測值都加一個相同的常數C之后,,計算得到的標準差等于原來的標準差 ②每一個觀測值都乘以一個相同的常數C,,所得到的標準差等于原標準差乘以這個常數
(4)意義 方差與標準差是表示一組數據離散程度的最好指標,它們是統(tǒng)計描述與統(tǒng)計推斷分析中最常用的差異量數,,它們的優(yōu)點有: 反應靈敏,、計算嚴謹、計算容易,、適合代數運算,、受抽樣變動影響小、意義簡單明了 3.變異系數當遇到下列情況時,,不能用絕對差異量來比較不同樣本的離散程度,,而應當使用相對差異量數,最常用的就是差異系數,。 ①兩個或兩個以上樣本所使用的觀測工具不同,,所測的特質相同 ②兩個或兩個以上樣本使用的是同種觀測工具,,所測的特質相同,但樣本間水平差異較大
差異系數:一種最常用的相對差異量,,為標準差對平均數的百分比
(四)相對量數1.百分位數百分位數:在整個分布中,,在某一值之下或等于該值的分數的百分比,所對應的分數 百分位數和百分等級是同一操作定義的兩端,。當我們求累計次數占總體的百分比是,,所對應的分數和百分比的值分 別為百分位數和百分等級。 2.百分等級百分等級:常模團體中低于該分數的人所占總體的百分比 百分等級一定要對應分數區(qū)間的精確上限,。百分等級和百分位數都可以由已知數據用差值法求解,。 3.標準分數(1)定義 標準分數:以標準差為單位表示一個原始分數在團體中所處位置的相對位置量數,也叫Z分數 離平均數有多遠,,即表示原始分數在平均數以上或以下幾個標準差的位置,。
(2)性質 ①Z分數無實際單位,是以平均數為參照點,,以標準差為單位的一個相對量 ②一組原始分數轉換得到的Z分數可正可負,,所有原始分數的Z分數之和為零 ③原始數據的Z分數的標準差為1 ④若原始分數呈正態(tài)分布,則轉換得到的所有Z分數均值為0,,標準差為1的標準正態(tài)分布
(3)優(yōu)點 ①可比性——不同性質的成績,,一經轉換為標準分數,就可在同一背景下比較 ②可加性——不同性質的原始數據具有相同的參照點,,因此可相加 ③明確性——知道了標準分數,,利用分布寒暑表就能知道其百分等級 ④穩(wěn)定性——轉換成標準分數之后,,規(guī)定了標準差為1,,保證了不同性質分數在總分數中權重一樣
(4)應用 ①比較幾個分屬性質不同的觀測值在各自數據分布中相對位置的高低 ②計算不同質的觀測值得總合或平均值,以表示在團體中的相對位置 ③若標準分數中有小數,、負數等不易被人接受的問題,,可通過 Z'=aZ+b 的線性公式將其轉化成新的分數(如韋氏成人智力量表) (五)相關量數由于實驗法適用范圍的限制,有的時候我們只能對變量間進行相關研究,,也就是看兩者是否有互相跟隨的變化關系,。相關研究所得到的是一種描述統(tǒng)計,我們僅僅能用其描述兩個變量互相跟隨的程度大小,,至于他們之間是否有因果關系或者是共變關系則不可妄下定論,。
相關系數:兩列變量間相關程度的數字表現形式 作為樣本的統(tǒng)計量用r表示,作為總體參數一般用ρ表示,。 正相關:兩列變量變動方向相同 負相關:兩列變量中有一列變量變動時,,另一列變量呈現出與前一列變量方向相反的變動 零相關:兩列變量之間沒有關系,各自按照自己的規(guī)律或無規(guī)律變化 1.積差相關也就是Pearson相關,。
(1)前提 ①數據要成對出現,,即若干個體中每個個體都有兩種不同的觀測值,,并且每隊數據與其它對子相互獨立 ②兩列變量各自總體的分布都是正態(tài)的,至少接近正態(tài) ③兩個相關的變量是連續(xù)變量,,也即兩列數據都是測量數據 ④兩列變量之間的關系應是直線性的
(2)公式
r也就等于X和Y共同變化的程度除以X和Y各自變化的程度。 2.等級相關也就是Spearman相關
(1)適用范圍 ①當研究考察的變量為順序型數據時,若原始數據為等比貨等距,,則先轉化為順序型數據 ②當研究考察的變量為非線性數據時
(2)公式 將原始數據轉化為順序型數據,,仍然用Pearson相關公式計算即可。
3.肯德爾等級相關(1)肯德爾W系數 也叫肯德爾和諧系數,,原始數據資料的獲得一般采用等級評定法,,即讓K個被試對N件實物進行等級評定。其原理是評價者評價的一致性除以最大變異可能性,。
Ri代表評價對象獲得的K個等級之和 N代表等級評定的對象的樹木 K代表等級評定者的數目
(2)肯德爾U系數# 其與肯德爾W系數所處理的問題相同,,但評價者采用對偶比較法,即將N件事物兩兩配對分別進行比較
rij為對偶比較記錄表中i>j格中的擇優(yōu)分數 4.點二列相關與二列相關(1)點二列相關 適用于一列數據為等距正態(tài)變量,,另一列為離散型二分變量,。
是與二分稱名變量的一個值對應的連續(xù)變量的平均數 是與二分稱名變量的另一個值對應的連續(xù)變量的平均數 p與q是二分稱名變量兩個值各自所占的比率 st是連續(xù)變量的標準差
(2)二列相關 適用于兩列變量都是正態(tài)等距變量,但其中一列變量被人為地分成兩類,。
y為標準正態(tài)曲線中p值對應的高度,,查正態(tài)分布表能得到 5.Ф相關適用于兩個變量都是只有兩個點值或只表示某些質的屬性。
其中a,、b,、c、d分別為四格表中左上,、右上,、左下、右下的數據 二,、推斷統(tǒng)計推論統(tǒng)計就是指運用一系列的數學方法,,將從樣本數據中獲得的結果推廣到樣本所在的總體。進行推論統(tǒng)計的關鍵在于所抽取的樣本要能夠盡量接近所要研究的總體,。 (一)推斷統(tǒng)計的數學基礎1.概率概率:表明隨即時間出現可能性大小的客觀指標 概率的定義包含以下兩種,,當觀測次數夠多時他們是相等的。 后驗概率:對隨機事件進行n次觀察,,某一事件A出現的次數m與觀測次數n的比值在n趨近無窮時所穩(wěn)定在的常數p 先驗概率:在滿足試驗可能結果數有限且每一種結果出現的可能性相等的條件下,,隨機事件包含的結果數除以結果總數 2.正態(tài)分布當樣本量足夠大時,我們會發(fā)現生活中許多變量的分布都近似于正態(tài)曲線,,因此有“上帝偏愛正態(tài)分布”一說,。
(1)特點 ①正態(tài)曲線的形狀就像一口掛鐘,呈對稱分布,,其均值,、中數,、眾數實際上對應于同一個數值 ②大部分的原始分數都集中分布在均值附近,極端值相對而言比較少 ③曲線兩端向靠近橫軸處不斷延伸,,但始終不會與橫軸向交 ④正態(tài)分布曲線轉化為z分數后人以z分數與零點對應曲線下面積固定
(2)用法 ①依據Z分數求概率,,即已知標準分數求面積 ②從概率求Z分數,即從面積求標準分數值 ③已知概率或Z值,,求概率密度,,即正態(tài)曲線的高 3.二項分布二項分布:對于一個事件有兩種可能A和B,但我們對這一事件觀察n次,,事件A發(fā)生的總次數的概率分布就是二項分布 二項分布的均值為 方差公式為 標準差的公式為
4.抽樣原理與抽樣方法(1)抽樣原理 抽樣的基本原則是隨機性原則,,所謂隨機性原則,是指在進行抽樣時,,總體中每一個個體是否被抽選的概率完全均等,。由于隨機抽樣使每個個體有同等機會被抽取,因而有相當大的可能使樣本保持和總體有相同的結構,,或者說,,具有最大的可能使總體的某些特征在樣本中得以發(fā)現,從而保證由樣本推論總體,。
(2)抽樣方法 ①簡單隨機取樣法 ②系統(tǒng)隨機取樣法 ③分層隨機取樣法 ④多段隨機取樣法 5.抽樣分布樣本分布:樣本統(tǒng)計量的分布,,是統(tǒng)計推論的重要依據
(1)正態(tài)分布及漸近正態(tài)分布 樣本統(tǒng)計量為正態(tài)分布或者接近正態(tài)分布的情況都可根據正態(tài)分布的概率進行統(tǒng)計推論。
總體分為正態(tài)或接近正態(tài),,方差已知,,樣本平均數和方差的分布為正態(tài)分布 ①樣本平均數分布的平均數和方差與母體的平均數和方差有如下關系:
②樣本的方差及標準差的分布也漸趨于正態(tài)分布,其分布的平均數與標準差和總體有如下關系:
(2)t分布 t分布是一種與方差無關而與自由度有關的分布,,很類似正態(tài)分布,,我們可以將正態(tài)分布看作t分布當自由度為正無窮時的特例。
總體分布為正態(tài),,方差未知時,,樣本平均數的分布為t分布: 其中
(3)χ2分布 χ2分布的構造是從一個服從正態(tài)分布的總體中每次抽去n個隨機變量,,計算其平方和之后標準化的一個分布,。分布曲線下的面積都是1,但伴隨著n取值的不同,,自由度改變,,曲線分布形狀不同,而當自由度趨近于正無窮時χ2分布即為正態(tài)分布,,因此其于t分布一樣都是一族分布,,而正態(tài)分布都是其中的特例。
(4)F分布 如果有兩個正態(tài)分布的總體,,我們從其中各自取出兩個樣本,,各自計算出χ2,,則:
更多情況下,我們所計算的F兩樣本取自相同總體,,此時可將上式化簡為:
(二)參數估計當在研究中從樣本獲得一組數據后,,如何通過這組信息,對總體特征進行估計,,也就是如何從局部結果推論總體的情況,,稱為總體參數估計。總體參數估計問題可以分為點估計與區(qū)間估計,。 1.點估計,、區(qū)間估計與標準誤良好估計量的標準 ①無偏性——用多個樣本的統(tǒng)計量估計總體參數的估計值,其偏差的平均數為零 ②有效性——當總體參數的無偏估計不止一個統(tǒng)計量時,,無偏估計變異小者有效性高,,變異大者有效性低,即方差越小越好 ③一致性——當樣本容量無限增大時,,估計值應能夠越來越接近它所估計的總體參數 ④充分性——樣本的統(tǒng)計量是否充分地反映了全部n個數據所反映總體的信息
點估計:用樣本統(tǒng)計量來估計總體參數,,因為樣本統(tǒng)計量為數軸上某一點值,估計結果也以一個點的數值表示
區(qū)間估計:根據估計量以一定可靠程度推斷總體參數所在的區(qū)間范圍,, 這個區(qū)間就叫做置信區(qū)間,,相應的概率成為置信度,這兩個量是共通變化的,,置信區(qū)間越大,,置信度越高; 區(qū)間估計是用數軸上的一段距離表示未知參數可能落入的范圍及落入該范圍的概率,。
標準誤:樣本平均數分布的標準差 總體方差未知時用估算的總體方差計算標準誤,。
2.總體平均數的估計
當總體方差未知時,則使用t分布對應置信度 3.標準差與方差的區(qū)間估計(1)標準差的區(qū)間估計
(2)方差的區(qū)間估計
(三)假設檢驗可以說,,每一個實驗的存在,,僅僅是為了給事實一個反駁虛無假設的機會。 ——R.A.Fisher 1.假設檢驗的原理假設檢驗:統(tǒng)計學中的一種推論過程,,通過樣本統(tǒng)計量得出的差異作為一般性結論,,判斷總體參數之間是否存在差異 假設檢驗的實質是對可置信性的評價,是對一個不確定問題的決策過程,,其結果在一定概率上正確的,,而不是全部。
(1)兩類假設 對于任何一種研究而言,,其結果無外乎有兩種可能,即是否符合我們預期,。一般來說證偽一件事情比證實一件事容易,在行為科學的研究中,由于我們無法了解總體中除樣本以外的個體情況,,因此嘗試拒絕虛無假設的方法優(yōu)于證明備擇假設,。
備則假設:因變量的變化、差異卻是是由于自變量的作用 往往是我們對研究結果的預期,,用H1表示,。 虛無假設:實際上什么也沒有發(fā)生,我們所預計的改變,、差異,、處理效果都不存在 觀察到的差異只是隨機誤差在起作用,用H0表示,。
(2)小概率原理 小概率原理:小概率事件在一次試驗中幾乎是不可能發(fā)生的
至于什么就算小概率事件,,那就是我們在計算前明確的決策標準,也就是顯著性水平α,。在檢驗過程中,,我們假設虛無假設是真實的,同時計算出觀測到的差異完全是由于隨機誤差所致的概率,。之后將其與我們實現界定好的顯著性水平比較,,從而考慮是否依據小概率原理來拒絕虛無假設。
(3)兩類錯誤 (本部分內容請參照實心信號檢測論對照來看,。 ——MJ注) Ⅰ型錯誤:當虛無假設正確時,,我們拒絕了它所犯的錯誤,也叫α錯誤 研究者得出了處理有效果的結論,,而實際上并沒有效果,,即所謂“無中生有” Ⅱ型錯誤:當虛無假設是錯誤的時候,我們沒有拒絕所犯的錯誤,,也叫β錯誤 假設檢驗未能偵查到實際存在的處理效應,,即所謂“失之交臂”
兩類檢驗的關系 ①α+β不一定等于1 ②在其他條件不變的情況下,α與β不可能同時減小或增大
(4)檢驗的方向性 單側檢驗:強調某一方向的檢驗,,顯著性的百分等級為α 雙側檢驗:只強調差異不強調方向性的檢驗,,顯著性百分等級為α/2
對于同樣的顯著性標準,在某一方向上,,單側檢驗的臨界區(qū)域要大于雙側檢驗,,因此如果差異發(fā)生在該方向,單側檢驗犯β錯誤的概率較小,,我們也說它的檢驗效力更高,。
(5)假設檢驗的步驟 ①根據問題要求,提出虛無假設和備擇假設 ②選擇適當的檢驗統(tǒng)計量 ③確定檢驗的方向性并規(guī)定顯著性水平 ④計算檢驗統(tǒng)計量的值 ⑤將統(tǒng)計量的值與臨界值對比做出決策 2.樣本與總體平均數差異的檢驗(1)總體正態(tài)分布且方差已知 其中 和分別為總體的平均數和方差
(2)總體正態(tài)分布而方差未知 其中而 為用樣本和方估算出的總體方差 3.兩樣本平均數差異的檢驗這是兩樣本平均數檢驗的通用公式,,所不同的僅在于標準誤的計算 (1)總體方差已知 ①獨立樣本
②相關樣本 其中r為兩組變量之間的相關系數
(2)總體方差未知 ①獨立樣本(方差差異不顯著時)
②相關樣本 a.相關系數未知:其中d為每一對對應數據之差 b.相關系數已知: 4.方差齊性檢驗(1)樣本方差與總體方差 當從正態(tài)分布的總體中隨機抽取容量為n的樣本時,其樣本方差與總體方差比值服從χ2分布: 由自由度查χ2表,依據顯著性水平判斷
(2)兩個樣本方差之間 ①獨立樣本 其中當兩樣本自由度相差不大時可用代替 查表時 ②相關樣本 其中 5.相關系數的顯著性檢驗①積差相關 a.當ρ=0時:其中 b.當ρ≠0時:先通過查表將r和ρ轉化為費舍Zr和Zρ然后進行Z檢驗
②等級相關和肯德爾W系數 在總體相關系數為零時:查各自的相關系數表,,判定樣本相關顯著 (四)方差分析1.方差分析的原理與基本過程(1)方差分析的概念 方差分析的目的是推斷多組資料的總體均數是否相同,,也即檢驗多組數據之間的均數差異是否有統(tǒng)計意義。當我們用多個t檢驗來完成這一過程時,,相當于從t分布中隨機抽取多個t值,,這樣落在臨界范圍之外的可能大大增加,從而增加了Ⅰ型錯誤的概率,。我們可以把方差分析看作t檢驗的增強版,。
(2)方差的可分解性 方差分析依據的基本原理就是方差的可加性原則。作為一種統(tǒng)計方法,,方差分析把實驗數據的總變異分解為若干個不同來源的分量,。數據的變異由兩部分組成: 組內變異:由于實驗中一些希望加以控制的非實驗因素和一些未被有效控制的未知因素造成的變異,如個體差異,、隨機誤差 組內變異是具體某一個處理水平之內的,,因此在對總體變異進行估計的時候不涉及研究的處理效應。 組間差異:不僅包括組內變異的誤差因素,,還包括了是不同組所接受的實驗處理不同造成的影響 如果研究數據的總變異是由處理效應造成的,,那么組間變異在總變異中應該占較大比例。 表示組間方差,,,,,表示實驗條件的個數 表示組內方差,,,,,表示每種實驗條件中的被試個數
(3)方差分析的基本假定 ①樣本必須來自正態(tài)分布的總體 ②每次觀察得到的幾組數據必須彼此獨立 ③各實驗處理內的方差應彼此無顯著差異 為了滿足這一假定,,我們可采用最大F比率法,,求出各樣本中方差最大值與最小值的比,通過查表判斷,。
(4)方差分析的基本步驟 Ⅰ 求平方和 ①總平方和是所有觀測值與總平均數的離差的平方總和 其中表示所有數據的總合,,表示總共的數據個數 ②組間平方和是每組的平均數與總平均數的離差的平方再與該組數據個數的乘積的總和 ,為數據總均值,,為每組數據和,,為該組數據個數 ③組內平方和是各被試的數值與組平均數之間的離差的平方總和
(注:推薦用于檢驗之前的計算,而不是被當作快捷計算的方式)
Ⅱ 計算自由度
Ⅲ 計算均方
Ⅳ 計算F值
Ⅴ 查F值表進行F檢驗并做出判斷 Ⅵ 陳列方差分析表 2.完全隨機設計的方差分析
3.隨機區(qū)組設計的方差分析隨機區(qū)組設計中同質被試參加所有水平下測試,,因此,,組間變異不包括個體差異的影響。而每一個水平之內仍然是由不同被試共同完成的,,于是我們仍然將總體變異分為組間變異和組內變異,,但需要進一步將組內變異分為被試間變異和誤差引起的變異,。 這樣,我們就可以在F檢驗時,,將被試間變異從組內變異中去除,,使得檢驗結果更靈敏。
個體誤差用表示,,而隨機誤差用表示,,它們的和等于組內差異
其中而; 其中為同一區(qū)組的數據之和,,或者同一被試在不同處理下的乘積的和
讓我們回憶一下兩個相關樣本平均數假設檢驗,,可以發(fā)現那里出現的情況和這里的多樣本方差分析相仿。也就是說,,對于同樣的實驗數據,,當我們把它看作是由獨立樣本得出或相關樣本得出時,就要采用不同的檢驗方法,,從而有可能得出不同的結論,。在假定為相關樣本的數據得出的顯著性差異如果換作背景是獨立樣本就可能只能接受虛無假設。這實際上是因為相關情況下樣本之間差異的減小使得對應檢驗要使用的統(tǒng)計量變大,,檢驗也就更加靈敏了,。 4.兩因素方差分析在兩因素實驗設計中,研究者同時用兩種影響因素作為自變量研究它們對某一因變量的影響,,其實驗結果比單因素設計更實際,。 (1)交互作用與主效應 主效應:某個自變量的不同水平對因變量所造成的影響的差異 交互作用:一個因素對因變量的影響因另一個因素的不同水平而不同 如果兩個因素彼此獨立,即不管其中一個因素處于哪個水平,,另一個因素的不同水平均值間的差異都保持一致,,則 不會產生交互作用。
(2)統(tǒng)計原理 為了看清各因素獨立作用和交互作用的影響,,我們進一步將組間差異分解:
其中與分別表示a因素與b因素的組間平方和,,表示交互作用的平方和 ;,;,;
(3)F的計算(這里討論獨立樣本) 其中這里的是假定全體數據只根據a因素分為兩組所計算的組間差異 其中這里的也同樣為假設只根據b因素分組所計算的組間差異 其中這里的為總體組間差異減去和得到 5.事后檢驗由方差分析只能得到顯著差異的結果,事后檢驗使我們能夠比較各組,,發(fā)現差異具體產生在什么地方,。事后檢驗采用成對比較的方式,每次比較兩個組的差異,。這里我們只介紹常用的紅絲帶檢驗而不是過氣的內褲檢驗,。
HSD檢驗法 Ⅰ 把要比較的各個平均數從小到大作等級排列 Ⅱ 處理條件的數目,自由度查表得到相應顯著性的值 Ⅲ 計算作為臨界值的(當為隨機區(qū)組時用代替) Ⅳ 把要比較的兩個平均數的差與臨界值比較,,若超過則認為差異顯著 (五)回歸分析1.一元線性回歸分析(1)基本概念 回歸分析:通過大量的觀測發(fā)現變量之間存在的統(tǒng)計規(guī)律性,,并用一定的數學模型表示變量相關關系的方法 只有一個自變量并且統(tǒng)計量成大體一次函數的線性關系的回歸分析叫一元線性回歸分析,。
在一元線性回歸中,我們用作為回歸方程,,代表X與Y的線性關系 其中:表示該直線在Y軸的截距 表示該直線的斜率也就是的變化率 為自變量,,通常是研究者事先選定的數值 為對應于對變量Y的估計值
(2)最小二乘法 所謂最小二乘法,,就是如果散點圖中每一點沿Y軸方向到直線的距離的平方和最小,,則認為這條直線的代表性最好,即使用其作為回歸方程,。這樣我們使得最小,。
其中; 2.一元線性回歸方程的檢驗(1)方差分析法
其中而其 其 其
(2)回歸系數檢驗 其中 而,,它的意義是一個統(tǒng)計量,,表示以為中心值上下波動的標準差 (在知道相關系數時) 3.一元線性回歸方程的應用回歸分析的目的,就是在測定自變量X與因變量Y的關系為顯著相關后,,借助于你和的較優(yōu)回歸模型來預測在自變量X為一定值時因變量Y的發(fā)展變化,。當我們根據給出的X值而預測得到點估計Y時,Y只代表了預測值的中點,,而計算在特定置信區(qū)間內的區(qū)間估計則依靠以下公式: 根號部分當n很大時近似為1 其中t的自由度取 n-2,,為對應該的方程解出的點估計Y值 (六)卡方檢驗其中為觀察次數;為理論期望次數 公式的適用范圍要求觀察彼此之間獨立,,并且單位格的理論期望次數不能小于5(小于5時可與相鄰的組合并) 1.擬合度檢驗χ2匹配度檢驗是用樣本數據來檢驗總體分布的形狀或比率,,以確定與假設的總體性質的匹配度。 其中為分類數 2.獨立性檢驗χ2獨立性檢驗幫助我們考察多種因素的不同分類之間是否獨立,。它是檢驗行和列兩個變量彼此有無關聯(lián)的一種統(tǒng)計方法,,適用于命名型變量和順序型變量。 其中和分別為行列分類數 (七)非參數檢驗1.獨立樣本均值差異的非參數檢驗(1)秩和檢驗法 ①兩樣本容量均小于10 將容量較小的樣本的各數據等級求和,,T值檢驗表中的臨界值比較,。 ②兩樣本容量均大于10
其中而
(2)中數檢驗法# ①將兩個樣本數據混合從小到大排列 ②求混合排列的中數 ③分別找出每個樣本中大于和小于中數的數據的個數,列成四格表(中數本身不在內) ④對四格表卡方檢驗公式進行計算 2.相關樣本均值差異的非參數檢驗(1)符號檢驗法 ①對子數小于25 對于樣本每對數據之差來記錄符號,,求出正負號分別的個數,,用其中較小的個數作為觀測值r對照臨界值表檢驗 ②對子數大于25
其中而
(2)維爾克松檢驗法 ①對子數小于25時 a.把相關樣本對應數據之差值按照絕對值從小到大排列 b.在各等級前加上原來差值的正負號 c.分別求出正號等級和負號等級的秩和,取其中較小的值作為T d.由n值查表檢驗T ②對子數大于25時
其中而
|
|