聚類分析,、判別分析,、主成分分析、因子分析
1 ,、聚類分析 基本原理:將個體(樣品)或者對象(變量)按相似程度(距離遠近)劃分類別,,使得同一類中的元素之間的相似性比其他類的元素的相似性更強。目的在于使類間元素的同質性最大化和類與類間元素的異質性最大化,。 常用聚類方法:系統(tǒng)聚類法,,K-均值法,模糊聚類法,有序樣品的聚類,,分解法,,加入法。 注意事項:1. 系統(tǒng)聚類法可對變量或者記錄進行分類,,K-均值法只能對記錄進行分類,; 應用領域:細分市場,消費行為劃分,,設計抽樣方案等 2,、判別分析 基本原理:從已知的各種分類情況中總結規(guī)律(訓練出判別函數),當新樣品進入時,,判斷其與判別函數之間的相似程度(概率最大,,距離最近,離差最小等判別準則),。 常用判別方法:最大似然法,,距離判別法,F(xiàn)isher判別法,,Bayes判別法,,逐步判別法等。 注意事項:1. 判別分析的基本條件:分組類型在兩組以上,,解釋變量必須是可測的,; 相對而言,即使判別函數違反上述適用條件,,也很穩(wěn)健,,對結果影響不大。 應用領域:對客戶進行信用預測,,尋找潛在客戶(是否為消費者,,公司是否成功,學生是否被錄用等等),,臨床上用于鑒別診斷,。 3,、 主成分分析/ 因子分析 主成分分析基本原理:利用降維(線性變換)的思想,在損失很少信息的前提下把多個指標轉化為幾個綜合指標(主成分),即每個主成分都是原始變量的線性組合,且各個主成分之間互不相關,使得主成分比原始變量具有某些更優(yōu)越的性能(主成分必須保留原始變量90%以上的信息),,從而達到簡化系統(tǒng)結構,,抓住問題實質的目的。 因子分析基本原理:利用降維的思想,,由研究原始變量相關矩陣內部的依賴關系出發(fā),把一些具有錯綜復雜關系的變量歸結為少數幾個綜合因子,。(因子分析是主成分的推廣,,相對于主成分分析,更傾向于描述原始變量之間的相關關系) 求解主成分的方法:從協(xié)方差陣出發(fā)(協(xié)方差陣已知),,從相關陣出發(fā)(相關陣R已知),。 求解因子載荷的方法:主成分法,,主軸因子法,極大似然法,,最小二乘法,,a因子提取法。 注意事項:1. 由協(xié)方差陣出發(fā)與由相關陣出發(fā)求解主成分所得結果不一致時,要恰當的選取某一種方法; 應用領域:解決共線性問題,,評價問卷的結構效度,,尋找變量間潛在的結構,內在結構證實,。 4,、對應分析/最優(yōu)尺度分析 基本原理:利用降維的思想以達到簡化數據結構的目的,同時對數據表中的行與列進行處理,,尋求以低維圖形表示數據表中行與列之間的關系,。 對應分析:用于展示變量(兩個/多個分類)間的關系(變量的分類數較多時較佳),; 最優(yōu)尺度分析:可同時分析多個變量間的關系,變量的類型可以是無序多分類,,有序多分類或連續(xù)性變量,,并 對多選題的分析提供了支持。 5,、典型相關分析 基本原理:借用主成分分析降維的思想,,分別對兩組變量提取主成分,且使從兩組變量提取的主成分之間的相關程度達到最大,,而從同一組內部提取的各主成分之間互不相關,。 |
|
來自: 戴偉亞 > 《SPSS資料與數據處理,、問卷調查》