久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

《應(yīng)用多元統(tǒng)計分析》第五章聚類分析實驗報告

 MAGIC_Y_A_N 2013-03-09

第五章聚類分析實驗報告 

實驗項目

名稱

聚類分析的上機實現(xiàn)

實驗

目的及要求

能熟練應(yīng)用計算機軟件進行系統(tǒng)聚類法和K-均值聚類法,,并對結(jié)果進行分析,培養(yǎng)實際應(yīng)用能力,。

實驗

內(nèi)容

每個特定汽車是從各個制造商分別提供的汽車型號中隨機選取的,,現(xiàn)

在想研究各個獨立的汽車是否可以歸成更有意義的類別。每輛汽車包括以下幾項指標:

1,、汽車的近似市場價格(price),;2、汽車的加速度(accelerate),;

3,、汽車的剎車能力(braking);4,、車輛行駛性能指數(shù)(handling),;

5、汽車耗油量(mileage),。

數(shù)據(jù)中的測量單位不一樣,,因此在聚類之前需要對數(shù)據(jù)進行標準化,附表中數(shù)據(jù)就是已經(jīng)標準化后的數(shù)據(jù),。我們的目的是要研究各個獨立的汽車是否可以歸類成更有意義的類別,。請對以上數(shù)據(jù)利用系統(tǒng)聚類法及K-均值聚類法進行分類,并對樣品分為四類的情況進行解釋和說明。

 

 

 

 

 

 

 

 

實驗步驟

1. 選擇菜單項AnalyzeClassifyHierachical Cluster,,打開Hierachical Cluster Analysis對話框,,如 5-5將原始變量Price in thousandsFuel efficiency移入Variables列表框框中,,將標志變量Model移入Label Case by列表框框中,。

 

Cluster欄中選擇Cases單選按鈕,對樣品進行聚類(若選擇Variables,,則對變量進行聚類),。在Display欄中選擇StatisticsPlots復(fù)選框,這樣在結(jié)果輸出窗口中可以同時得到聚類結(jié)果統(tǒng)計量和統(tǒng)計圖,。

2. 點擊Plots按鈕,,打開Plots子對話框,如圖,。設(shè)置結(jié)果輸出窗口中給出的聚類分析統(tǒng)計圖,。Dendrogram為聚類樹形圖,Icicle為冰柱圖,。

這里我們選中Dendrogram復(fù)選框和Icicle欄中的None單選按鈕,,只輸出比較常用的聚類樹形圖,而不給出冰柱圖,。

3. 點擊Method按鈕,,打開Method子對話框,設(shè)置系統(tǒng)聚類的方法選項,。

 

 

Cluster Method下拉列表用于指定類與類之間距離的測度方法,,具體選項的含義參見教材。

Measure欄用于設(shè)置不同數(shù)據(jù)類型下的個體與個體之間距離的測度方法,,其中,,Interval中的方法適用于連續(xù)型變量,Counts中的方法適用于計數(shù)變量,,Binary中的方法適用于二值變量,。

Transform Values選項欄用于當原始數(shù)據(jù)不是同一數(shù)量級別的時候選擇對原始數(shù)據(jù)進行標準化的方法。單選按鈕By variable表示針對變量進行標準化,,適用于Q型聚類,;By case表示針對觀測進行標準化,適用于R型聚類,。

這里我們選擇最為常用的Z分數(shù)標準化法對原始數(shù)據(jù)進行標準化,,其余選項均保持默認。

4. 點擊Save按鈕,,打開  Save New Variables子對話框,,指定保存在數(shù)據(jù)文件中的用于表明聚類結(jié)果的新變量,。

None表示不保存任何新變量;Single solution表示生成一個分類變量,,在其后的矩形框中輸入要分成的類數(shù),;Range of solutions表示生成多個分類變量。這里我們選擇Range of solutions,,并在后面的兩個矩形框中分別輸入24,,即生成三個新的分類變量,分別表明將樣品分為2類,、3類和4類時的聚類結(jié)果,。

5. 在主對話框中點擊OK按鈕,運行系統(tǒng)聚類過程,,結(jié)果如下表所示,。

 

 

BKmeans操作步驟及結(jié)果分析

電信營銷商對客戶分類分析。telco_extra.sav

1. 選擇菜單項AnalyzeClassifyK-Means Cluster,,打開K-Means Cluster Analysis對話框,,將原始變量移入Variables列表框框中,將標志變量Region移入Label Case by列表框框中,。

 

Method選項欄中選擇Iterate classify單選項,,使用K-means算法不斷計算新的類中心,并替換舊的類中心,;若選擇Classify only,則根據(jù)初始類中心進行聚類,,在聚類過程中不改變類中心,。

Number of Cluster后面的輸入框中輸入想要把樣品聚成的類數(shù),這里我們輸入3,,即將分為3類,。

至于Centers按鈕,則用于設(shè)置迭代的初始類中心,。如果不用手工設(shè)置,,則系統(tǒng)會自動設(shè)置初始類中心,這里我們不作設(shè)置,。

2. 點擊Iterate按鈕,,打開Iterate子對話框,如 59,,對迭代參數(shù)進行設(shè)置,。

Maximum Iterations輸入框用于設(shè)定K-means算法迭代的最大次數(shù);Convergence Criterion輸入框用于設(shè)定算法的收斂判據(jù),,其值應(yīng)該介于01之間,。另外,,如果選擇了Use running means復(fù)選框,則每當一個樣品被分配到一類時便要立即重新計算新的類中心,;如果不選該選項,,則完成了所有樣品的重新分配之后才要計算新的類中心,不選該選項會比較節(jié)省事件,。這里我們保持該對話框的系統(tǒng)默認選項,。

3. 點擊Options按鈕,打開Options子對話框,,如 10?4,。對話框中Statistics選項欄中各選項的含義如下:

Initial cluster centers:在結(jié)果輸出窗口中給出聚類的初始類中心;

ANOVA table:給出以聚類結(jié)果為控制變量的針對每個原始變量的單因素方差分析表,;

Cluster information for each case:在結(jié)果輸出窗口中給出每個樣品的分類信息,,包括分配到哪一類以及該觀測量距所屬類中心的距離。

單擊Continue返回主對話框,。

 

4. 在主對話框中點擊OK按鈕,,運行K均值聚類分析程序。

給出了K-均值迭代的初始類中心坐標,,由SPSS自動給定,。

 

從表的結(jié)果來看,針對分析變量的方差分析的 值均小于0.05,,需要拒絕原假設(shè),,說明所選的聚類變量對于分類具有顯著作用。

 

實驗環(huán)境

Windows xp,、Windows vista,、Windows 7等,軟件SPSS 11.0版本及以上,。

 

 

實驗結(jié)果與

分析

從表的結(jié)果來看,,針對分析變量的方差分析的 值均小于0.05,需要拒絕原假設(shè),,說明所選的聚類變量對于分類具有顯著作用,。

教師評語

 

注:可根據(jù)實際情況加頁

 

 


 

附表:

name

price

accelera

braking

handling

mileage

Acura

-0.521

0.477

-0.007

0.382

2.079

Audi

0.866

0.208

0.319

-0.091

-0.677

BMW

0.496

-0.802

0.192

-0.091

-0.154

Buick

-0.614

1.689

0.933

-0.21

-0.154

Corvette

1.235

-1.811

-0.494

0.973

-0.677

Chrysler

-0.614

0.073

0.427

-0.21

-0.154

Dodge

-0.706

-0.196

0.481

0.145

-0.154

Eagle

-0.614

1.218

-4.199

-0.21

-0.677

Ford

-0.706

-1.542

0.987

0.145

-1.724

Honda

-0.429

0.41

-0.007

0.027

0.369

Isuzu

-0.798

0.41

-0.061

-4.23

1.067

Mazda

0.126

0.679

-0.133

0.5

-1.724

Mercedes

1.051

0.006

0.12

-0.091

-0.154

Mitsub.

-0.614

-1.003

0.084

0.382

0.718

Nissan

-0.429

0.073

-0.007

0.263

0.997

Olds

-0.614

-0.734

0.409

0.382

2.114

Pontiac

-0.614

0.679

0.536

0.145

0.195

Porsche

3.454

-2.215

-0.296

0.618

-1.026

Saab

0.588

0.679

0.246

0.263

0.021

Toyota

-0.059

1.218

0.228

0.736

-0.851

VW

-0.706

-0.128

0.102

0.382

0.195

Volvo

0.219

0.612

0.138

-0.21

0.369

 

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,,不代表本站觀點,。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,,謹防詐騙,。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報,。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多