久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

聚類分析,、判別分析,、主成分分析、因子分析

 戴偉亞 2009-09-16
聚類分析,、判別分析,、主成分分析、因子分析

主成分分析與因子分析的區(qū)別

 

1. 目的不同: 因子分析把諸多變量看成由對每一個變量都有作用的一些公共因子和僅對某一個變量有作用的特殊因子線性組合而成,,因此就是要從數據中控查出對變量起解釋作用的公共因子和特殊因子以及其組合系數,;主成分分析只是從空間生成的角度尋找能解釋諸多變量變異的絕大部分的幾組彼此不相關的新變量(主成分)。

2. 線性表示方向不同: 因子分析是把變量表示成各公因子的線性組合,;而主成分分析中則是把主成分表示成各變量的線性組合,。

3. 假設條件不同:主成分分析中不需要有假設;因子分析的假設包括:各個公共因子之間不相關,,特殊因子之間不相關,,公共因子和特殊因子之間不相關。

4. 提取主因子的方法不同:因子分析抽取主因子不僅有主成分法,,還有極大似然法,,主軸因子法,基于這些方法得到的結果也不同,;主成分只能用主成分法抽取,。

5. 主成分與因子的變化:當給定的協(xié)方差矩陣或者相關矩陣的特征值唯一時,主成分一般是固定的,;而因子分析中因子不是固定的,,可以旋轉得到不同的因子。

6. 因子數量與主成分的數量:在因子分析中,,因子個數需要分析者指定(SPSS根據一定的條件自動設定,,只要是特征值大于1的因子主可進入分析),指定的因子數量不同而結果也不同,;在主成分分析中,,成分的數量是一定的,一般有幾個變量就有幾個主成分(只是主成分所解釋的信息量不等),。

7. 功能:和主成分分析相比,,由于因子分析可以使用旋轉技術幫助解釋因子,在解釋方面更加有優(yōu)勢,;而如果想把現(xiàn)有的變量變成少數幾個新的變量(新的變量幾乎帶有原來所有變量的信息)來進入后續(xù)的分析,,則可以使用主成分分析。當然,,這種情況也可以使用因子得分做到,,所以這種區(qū)分不是絕對的。

1 ,、聚類分析

基本原理:將個體(樣品)或者對象(變量)按相似程度(距離遠近)劃分類別,,使得同一類中的元素之間的相似性比其他類的元素的相似性更強。目的在于使類間元素的同質性最大化和類與類間元素的異質性最大化,。

常用聚類方法:系統(tǒng)聚類法,,K-均值法,模糊聚類法,有序樣品的聚類,,分解法,,加入法。

注意事項:1. 系統(tǒng)聚類法可對變量或者記錄進行分類,,K-均值法只能對記錄進行分類,;

          2. K-均值法要求分析人員事先知道樣品分為多少類;

           3. 對變量的多元正態(tài)性,,方差齊性等要求較高,。

應用領域:細分市場,消費行為劃分,,設計抽樣方案等

2,、判別分析

基本原理:從已知的各種分類情況中總結規(guī)律(訓練出判別函數),當新樣品進入時,,判斷其與判別函數之間的相似程度(概率最大,,距離最近,離差最小等判別準則),。

常用判別方法:最大似然法,,距離判別法,F(xiàn)isher判別法,,Bayes判別法,,逐步判別法等。

注意事項:1. 判別分析的基本條件:分組類型在兩組以上,,解釋變量必須是可測的,;

           2. 每個解釋變量不能是其它解釋變量的線性組合(比如出現(xiàn)多重共線性情況時,判別權重會出現(xiàn)問題),;

           3. 各解釋變量之間服從多元正態(tài)分布(不符合時,,可使用Logistic回歸替代),且各組解釋變量的協(xié)方差矩陣相等(各組協(xié)方方差矩陣有顯著差異時,,判別函數不相同),。

相對而言,即使判別函數違反上述適用條件,,也很穩(wěn)健,,對結果影響不大。

應用領域:對客戶進行信用預測,,尋找潛在客戶(是否為消費者,,公司是否成功,學生是否被錄用等等),,臨床上用于鑒別診斷,。

3,、 主成分分析/ 因子分析

主成分分析基本原理:利用降維(線性變換)的思想,在損失很少信息的前提下把多個指標轉化為幾個綜合指標(主成分),即每個主成分都是原始變量的線性組合,且各個主成分之間互不相關,使得主成分比原始變量具有某些更優(yōu)越的性能(主成分必須保留原始變量90%以上的信息),,從而達到簡化系統(tǒng)結構,,抓住問題實質的目的。

因子分析基本原理:利用降維的思想,,由研究原始變量相關矩陣內部的依賴關系出發(fā),把一些具有錯綜復雜關系的變量歸結為少數幾個綜合因子,。(因子分析是主成分的推廣,,相對于主成分分析,更傾向于描述原始變量之間的相關關系)

求解主成分的方法:從協(xié)方差陣出發(fā)(協(xié)方差陣已知),,從相關陣出發(fā)(相關陣R已知),。

        (實際研究中,總體協(xié)方差陣與相關陣是未知的,,必須通過樣本數據來估計)

求解因子載荷的方法:主成分法,,主軸因子法,極大似然法,,最小二乘法,,a因子提取法。

注意事項:1. 由協(xié)方差陣出發(fā)與由相關陣出發(fā)求解主成分所得結果不一致時,要恰當的選取某一種方法;

          2. 對于度量單位或是取值范圍在同量級的數據,,可直接求協(xié)方差陣,;對于度量單位不同的指標或是取值范圍彼此差異非常大的指標,應考慮將數據標準化,,再由協(xié)方差陣求主成分;

          3.主成分分析不要求數據來源于正態(tài)分布;

          4. 在選取初始變量進入分析時應該特別注意原始變量是否存在多重共線性的問題(最小特征根接近于零,,說明存在多重共線性問題)。

             5. 因子分析中各個公共因子之間不相關,,特殊因子之間不相關,,公共因子和特殊因子之間不相關。

應用領域:解決共線性問題,,評價問卷的結構效度,,尋找變量間潛在的結構,內在結構證實,。

4,、對應分析/最優(yōu)尺度分析

基本原理:利用降維的思想以達到簡化數據結構的目的,同時對數據表中的行與列進行處理,,尋求以低維圖形表示數據表中行與列之間的關系,。

對應分析:用于展示變量(兩個/多個分類)間的關系(變量的分類數較多時較佳),;

最優(yōu)尺度分析:可同時分析多個變量間的關系,變量的類型可以是無序多分類,,有序多分類或連續(xù)性變量,,并 對多選題的分析提供了支持。

5,、典型相關分析

基本原理:借用主成分分析降維的思想,,分別對兩組變量提取主成分,且使從兩組變量提取的主成分之間的相關程度達到最大,,而從同一組內部提取的各主成分之間互不相關,。

    本站是提供個人知識管理的網絡存儲空間,所有內容均由用戶發(fā)布,,不代表本站觀點,。請注意甄別內容中的聯(lián)系方式、誘導購買等信息,,謹防詐騙,。如發(fā)現(xiàn)有害或侵權內容,請點擊一鍵舉報,。
    轉藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多