久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

SPSS(十五)spss之聚類分析(圖文+數(shù)據(jù)集)

 misswee 2020-02-28

聚類分析簡(jiǎn)介

按照個(gè)體(記錄)的特征將它們分類,,使同一類別內(nèi)的個(gè)體具有盡可能高的同質(zhì)性,,而類別之間則具有盡可能高的異質(zhì)性。
為了得到比較合理的分類,,首先要采用適當(dāng)?shù)闹笜?biāo)來(lái)定量地描述研究對(duì)象之間的聯(lián)系的緊密程度,。

假定研究對(duì)象均用所謂的“點(diǎn)”來(lái)表示。
在聚類分析中,,一般的規(guī)則是將“距離”較小的點(diǎn)歸為同一類,,將“距離”較大的點(diǎn)歸為不同的類。
常見(jiàn)的是對(duì)個(gè)體分類,,也可以對(duì)變量分類,,但對(duì)于變量分類此時(shí)一般使用相似系數(shù)作為“距離”測(cè)量指標(biāo)

  • 聚類分析前所有個(gè)體所屬的類別是未知的,類別個(gè)數(shù)一般也未知,,分析的依據(jù)就是原始數(shù)據(jù),,可能事先沒(méi)有任何有關(guān)類別的信息可參考。
  • 嚴(yán)格說(shuō)來(lái)聚類分析并不是純粹的統(tǒng)計(jì)技術(shù),,它不像其它多元分析法那樣,需要從樣本去推斷總體,。一般都涉及不到有關(guān)統(tǒng)計(jì)量的分布,,也不需要進(jìn)行顯著性檢驗(yàn),。
  • 聚類分析更像是一種建立假設(shè)的方法,而對(duì)相關(guān)假設(shè)的檢驗(yàn)還需要借助其它統(tǒng)計(jì)方法,。
     

注意:聚類分析更像是一種建立假設(shè)的方法,,而對(duì)于相關(guān)假設(shè)的檢驗(yàn)還需要借助其他統(tǒng)計(jì)的方法,比如判別分析,、T-檢驗(yàn),、方差分析等,看聚類出來(lái)的幾個(gè)類別是否存在差異

 

聚類的用途

  • 設(shè)計(jì)抽樣方案(分層抽樣)
  • 預(yù)分析過(guò)程(先通過(guò)聚類分析達(dá)到簡(jiǎn)化數(shù)據(jù)的目的,,將眾多的個(gè)體先聚集成比較好處理的幾個(gè)類別或子集,,然后再進(jìn)行后續(xù)的多元分析)
  • 細(xì)分市場(chǎng)、個(gè)體消費(fèi)行為劃分(先聚類,,然后再利用判別分析進(jìn)一步研究各個(gè)群體之間的差異)

 

聚類分析的基本步驟總結(jié)

 

聚類方法

K均值聚類(K-means Cluster)

方法原理

  1. 選擇(或人為指定)某些記錄作為凝聚點(diǎn)
  2. 按就近原則將其余記錄向凝聚點(diǎn)凝集
  3. 計(jì)算出各個(gè)初始分類的中心位置(均值)
  4. 用計(jì)算出的中心位置重新進(jìn)行聚類
  5. 如此反復(fù)循環(huán),,直到凝聚點(diǎn)位置收斂為止

方法特點(diǎn)

  1. 要求已知類別數(shù)
  2. 可人為指定初始位置
  3. 節(jié)省運(yùn)算時(shí)間
  4. 樣本量過(guò)大時(shí)有必要考慮
  5. 只能使用連續(xù)性變量
     

案例:移動(dòng)通訊客戶細(xì)分

數(shù)據(jù)包含6個(gè)變量
是客戶編號(hào)(Customer_ID)
工作日上班時(shí)期電話時(shí)長(zhǎng)(Peak_mins)
工作日下班時(shí)期電話時(shí)長(zhǎng)(OffPeak_mins)
周末電話時(shí)長(zhǎng)(Weekend_mins)
國(guó)際電話時(shí)長(zhǎng)(International_mins)
總通話時(shí)長(zhǎng)(Total_mins)
平均每次通話時(shí)長(zhǎng)(average_mins)
根據(jù)前期的調(diào)研,研究者認(rèn)為移動(dòng)用戶應(yīng)當(dāng)被分為5個(gè)主要群體,,現(xiàn)希望得到相應(yīng)的定量聚類結(jié)果,。
(由于數(shù)據(jù)集過(guò)多,可到我的資源下載“spss之聚類分析--移動(dòng)通訊客戶細(xì)分”

看到結(jié)果無(wú)法收斂,,所以重新設(shè)置迭代次數(shù),,讓其收斂

但是最終聚類出來(lái),結(jié)果怪怪的

各變量測(cè)量尺度,,量綱不一樣,,聚類計(jì)算其距離時(shí)量綱大的對(duì)結(jié)果影響大

如何進(jìn)行標(biāo)化呢?

重新聚類

標(biāo)準(zhǔn)化的變量,,一般在正負(fù)3以內(nèi),,0代表平均水平

但是我們想看原始變量的原始水平,不看這標(biāo)準(zhǔn)化的

保存?zhèn)€案被劃分為哪個(gè)類

 

我們只想看均值

 

得到非標(biāo)準(zhǔn)化的聚類中心結(jié)果 

 

解讀

  • 第一類:高端商用客戶,,總通話時(shí)間長(zhǎng),,工作日上班時(shí)間通話比例高
  • 第二類:少使用低端客戶,總通話時(shí)間短,,各時(shí)段通話時(shí)間都短
  • 第三類:中端商用客戶,,總通話時(shí)間居中,工作日上班時(shí)間通話比例高
  • 第四類:中端日常用客戶,,總通話時(shí)間居中,,工作日下班時(shí)間通話比例高
  • 第五類:長(zhǎng)聊客戶,每次通話時(shí)間長(zhǎng)

 

層次聚類(Hierarchical Cluster)

屬于系統(tǒng)聚類法的一種,,其聚類過(guò)程可以用樹(shù)形結(jié)構(gòu)(treelike structure)來(lái)描繪的方法

方法原理

  1. 先將所有n個(gè)變量/觀測(cè)看成不同的n類
  2. 然后將性質(zhì)最接近(距離最近)的兩類合并為一類
  3. 再?gòu)倪@n-1類中找到最接近的兩類加以合并
  4. 依此類推,,直到所有的變量/觀測(cè)被合為一類
  5. 使用者再根據(jù)具體的問(wèn)題和聚類結(jié)果來(lái)決定應(yīng)當(dāng)分為幾類

 

特點(diǎn)

  1. 一旦記錄/變量被劃定類別,其分類結(jié)果就不會(huì)再進(jìn)行更改
  2. 可以對(duì)變量或記錄進(jìn)行聚類
  3. 變量可以為連續(xù)或分類變量(變量雖然可以為連續(xù)型或者分類型,,但是不能混用,,要不就是全分類這樣使用,,要不就全連續(xù)變量聚類)
  4. 提供的距離測(cè)量方法非常豐富
  5. 運(yùn)算速度較慢

 

案例:體操裁判打分傾向聚類(這個(gè)案例是對(duì)變量進(jìn)行聚類)

SPSS自帶數(shù)據(jù)集judges.sav是中、美,、法等七個(gè)國(guó)家的裁判和未經(jīng)嚴(yán)格訓(xùn)練體育愛(ài)好者在評(píng)判體育比賽中對(duì)選手的評(píng)分情況,。請(qǐng)根據(jù)在評(píng)分上的差異將它們分為適當(dāng)?shù)念悺?/p>

  1. 7.30 8.00 7.10 7.70 7.20 7.20 7.00 7.6
  2. 7.80 8.70 7.20 8.40 7.50 8.10 7.30 7.1
  3. 7.20 7.40 7.10 7.50 7.20 7.10 7.00 7.0
  4. 7.30 8.40 7.20 7.90 7.50 8.50 7.30 7.1
  5. 7.70 7.80 7.20 8.40 7.60 7.40 7.10 7.1
  6. 7.30 7.60 7.20 8.10 7.30 7.20 7.00 7.0
  7. 8.30 8.30 7.70 8.50 7.80 7.80 7.20 7.8
  8. 9.60 9.80 9.30 9.80 8.80 9.90 9.40 10.0
  9. 9.10 8.80 8.60 9.10 7.80 9.30 8.50 8.5
  10. 9.50 9.70 9.00 9.60 8.90 9.80 9.20 10.0
  11. 7.80 8.50 8.30 9.10 8.00 9.50 7.60 7.9
  12. 8.60 8.90 7.80 9.00 8.00 8.70 7.80 7.8
  13. 8.50 9.10 8.10 9.30 8.00 8.30 7.80 8.5
  14. 9.20 9.10 8.00 9.40 8.50 9.60 8.60 8.9
  15. 8.20 9.20 7.90 9.10 7.80 8.30 7.50 8.2
  16. 7.00 7.50 7.10 7.40 7.10 7.10 7.00 7.7
  17. 9.70 9.90 9.10 9.70 9.00 10.00 9.60 9.9
  18. 9.80 9.90 9.50 9.80 9.00 10.00 9.70 9.9
  19. 8.60 9.40 8.20 9.50 8.70 9.80 8.30 9.5
  20. 8.80 9.00 7.90 8.50 8.10 9.30 8.00 9.8
  21. 9.30 9.80 9.30 9.80 8.70 10.00 9.30 9.3
  22. 7.50 7.90 7.20 8.10 7.30 7.70 7.10 7.2
  23. 9.00 9.30 7.80 9.10 8.20 9.40 8.10 8.5
  24. 8.90 9.70 8.90 9.50 8.60 9.70 9.40 9.2
  25. 9.90 10.00 9.70 9.90 9.40 10.00 9.90 9.9
  26. 7.20 7.20 7.00 7.90 7.10 7.10 7.00 7.3
  27. 7.00 7.10 7.00 7.20 7.00 7.00 7.00 7.0
  28. 7.30 7.50 7.10 7.60 7.30 7.90 7.10 7.6
  29. 9.00 9.00 8.10 9.10 7.80 9.30 7.70 7.1
  30. 7.50 8.50 7.20 8.50 8.00 8.90 7.20 7.6
  31. 9.10 9.70 8.60 9.60 9.10 9.90 9.50 7.6
  32. 7.60 8.00 7.20 8.90 7.40 7.60 7.10 7.2
  33. 7.70 8.30 7.40 8.40 7.50 8.30 7.40 8.5
  34. 7.70 7.90 7.30 8.70 7.40 7.70 7.30 8.3
  35. 8.10 8.40 7.90 8.90 7.90 8.60 7.70 7.0
  36. 8.50 9.60 8.70 9.20 8.40 9.30 8.30 8.7
  37. 9.80 9.80 9.70 9.90 8.90 9.90 9.80 9.9
  38. 9.20 9.20 8.10 9.60 8.40 9.60 8.80 9.2
  39. 9.90 9.90 9.70 9.90 9.10 10.00 9.70 9.8
  40. 8.90 8.70 7.90 9.00 8.40 9.70 8.40 7.5
  41. 9.90 10.00 9.20 9.90 9.00 10.00 9.30 8.0
  42. 7.50 8.50 7.50 8.20 7.50 8.70 7.90 9.4
  43. 8.90 9.60 8.80 9.30 8.40 9.90 9.20 9.1
  44. 7.70 8.70 7.40 8.50 7.70 8.30 7.30 7.1
  45. 9.70 9.90 9.40 9.80 9.20 9.90 9.60 10.0
  46. 9.60 9.90 8.80 9.70 9.00 9.90 9.30 9.2
  47. 7.60 8.40 7.60 8.60 7.50 8.00 7.20 7.1
  48. 8.30 8.40 7.30 8.50 7.60 7.60 7.30 7.8
  49. 8.90 8.90 8.30 9.00 8.30 9.50 8.70 9.4
  50. 9.50 9.90 8.60 9.60 8.60 9.90 9.30 8.8
  51. 7.90 8.50 7.60 8.30 7.60 8.40 7.30 7.1
  52. 8.70 9.60 8.00 9.30 8.30 9.30 8.00 8.8
  53. 7.30 7.90 7.20 7.70 7.30 8.00 7.00 8.0
  54. 7.30 7.40 7.00 7.80 7.20 7.60 7.00 7.2
  55. 7.10 7.20 7.10 7.50 7.10 7.20 7.00 7.0
  56. 9.80 10.00 9.50 9.90 9.40 10.00 9.90 10.0
  57. 9.30 9.50 8.50 9.40 7.90 9.50 8.70 9.8
  58. 8.50 9.00 7.50 8.90 7.90 9.10 7.70 8.6
  59. 9.70 10.00 9.40 9.90 9.10 10.00 9.90 9.7
  60. 8.70 8.40 8.00 8.90 7.60 9.40 7.40 9.9
  61. 7.50 7.80 7.20 8.10 7.30 7.80 7.30 8.5
  62. 8.20 8.70 7.90 9.00 8.10 8.90 8.50 7.9
  63. 8.70 9.50 8.30 9.60 8.10 9.80 8.50 8.3
  64. 9.40 9.70 9.10 9.40 8.80 9.90 8.90 9.9
  65. 8.90 9.80 8.20 9.30 8.20 9.70 8.50 9.5
  66. 9.80 9.90 9.20 9.60 9.30 9.90 9.90 10.0
  67. 9.00 9.60 8.30 9.60 8.20 9.60 8.70 9.8
  68. 8.30 8.60 7.90 8.50 7.90 9.50 8.40 9.3
  69. 8.80 9.10 8.00 9.10 8.00 9.50 8.80 9.8
  70. 8.40 8.40 7.40 8.70 7.90 8.40 7.40 8.0
  71. 9.90 10.00 9.80 9.70 9.50 10.00 10.00 8.3
  72. 8.80 9.20 8.60 9.20 8.00 9.50 7.50 7.3
  73. 8.90 9.00 8.00 9.10 7.90 9.30 7.90 8.3
  74. 9.50 10.00 9.50 9.80 9.10 10.00 9.70 9.1
  75. 9.00 9.50 8.30 9.30 8.60 9.80 9.30 9.1
  76. 9.70 9.40 9.10 9.50 9.00 9.90 9.40 10.0
  77. 8.70 9.60 8.90 9.70 8.80 9.70 9.10 10.0
  78. 7.40 7.80 7.10 8.20 7.10 7.90 7.10 8.7
  79. 8.10 8.90 8.00 9.10 8.10 9.30 8.10 8.5
  80. 7.80 8.40 7.60 8.30 7.50 7.80 7.20 8.2
  81. 7.50 7.40 7.10 8.10 7.20 7.30 7.10 7.8
  82. 7.70 8.10 7.40 8.70 7.60 8.50 7.60 7.2
  83. 9.80 10.00 9.70 9.90 9.30 10.00 9.80 10.0
  84. 7.10 7.60 7.00 7.80 7.20 7.20 7.00 7.1
  85. 9.70 9.70 9.20 9.70 8.60 10.00 9.40 7.3
  86. 9.60 9.20 9.00 9.40 8.60 9.60 9.10 9.8
  87. 9.80 9.90 9.30 9.70 8.80 10.00 9.30 9.6
  88. 7.10 7.20 7.10 7.70 7.10 7.10 7.00 7.0
  89. 7.40 7.80 7.20 8.40 7.50 7.60 7.20 8.5
  90. 8.70 8.50 8.20 9.20 7.80 8.20 7.60 7.9
  91. 7.30 8.10 7.10 8.00 7.10 7.50 7.20 7.5
  92. 8.50 9.20 8.40 9.30 7.90 9.50 8.60 9.4
  93. 8.90 9.60 8.70 9.50 8.50 9.60 9.30 7.8
  94. 7.00 7.40 7.00 7.50 7.00 7.10 7.00 7.2
  95. 7.70 8.90 7.20 8.70 7.90 8.60 7.50 8.2
  96. 7.90 8.90 7.40 9.00 7.90 8.80 7.70 7.2
  97. 7.10 7.50 7.10 7.90 7.10 7.20 7.00 7.0
  98. 8.30 9.10 7.50 8.70 7.80 8.40 7.50 8.2
  99. 8.50 9.00 8.10 8.90 7.90 9.30 7.80 9.0
  100. 9.60 9.90 9.30 9.70 9.00 9.90 9.50 9.3
  101. 8.80 9.40 8.20 9.30 8.10 9.90 8.60 8.6
  102. 8.30 8.60 7.50 8.80 7.60 8.60 7.30 7.3
  103. 9.50 9.20 8.90 9.50 8.50 9.90 9.10 9.9
  104. 7.60 8.30 7.50 8.70 7.50 8.00 7.80 7.6
  105. 9.40 9.80 9.10 9.60 8.40 9.70 9.40 8.9
  106. 7.30 7.90 7.40 7.90 7.20 8.30 7.20 7.7
  107. 8.70 9.20 7.50 9.20 7.50 8.10 7.40 9.7
  108. 7.40 7.50 7.10 8.30 7.10 7.30 7.00 7.1
  109. 8.50 9.60 8.40 9.10 8.10 9.50 8.30 9.7
  110. 8.40 8.80 7.70 9.10 8.00 9.30 8.30 8.2
  111. 8.80 9.30 7.50 9.30 7.80 9.20 8.30 7.9
  112. 9.90 10.00 9.70 9.80 9.50 10.00 10.00 10.0
  113. 7.00 7.20 7.00 7.60 7.10 7.10 7.00 7.0
  114. 8.80 9.40 8.60 9.10 7.80 8.70 8.30 9.2
  115. 7.20 7.80 7.10 8.00 7.10 7.60 7.10 7.1
  116. 8.70 9.70 8.90 9.70 8.40 9.70 9.30 9.2
  117. 7.10 7.40 7.10 7.70 7.10 7.00 7.00 7.1
  118. 7.90 9.00 7.30 8.50 7.30 8.30 7.30 7.0
  119. 8.70 9.40 7.70 9.10 7.80 9.10 8.70 9.8
  120. 7.20 7.60 7.10 8.10 7.30 7.70 7.10 7.3
  121. 9.10 9.80 8.40 9.50 8.60 9.60 8.20 9.8
  122. 8.30 8.40 8.20 8.60 7.90 9.30 8.20 7.0
  123. 8.70 9.80 8.90 9.40 8.00 9.70 8.30 9.5
  124. 8.40 8.80 7.30 9.30 7.40 8.60 7.70 7.0
  125. 9.30 9.90 9.00 9.70 8.50 9.70 9.40 9.9
  126. 9.20 9.50 8.60 9.60 8.20 9.50 9.40 8.3
  127. 7.40 7.60 7.10 8.30 7.20 7.10 7.00 7.0
  128. 7.30 8.00 7.10 8.30 7.30 7.50 7.40 7.8
  129. 8.70 9.50 8.20 9.60 8.20 9.50 8.80 8.0
  130. 7.20 8.60 7.10 8.00 7.30 7.70 7.00 8.5
  131. 8.80 8.10 7.50 8.70 7.70 8.40 7.50 7.7
  132. 9.20 9.70 8.70 9.70 8.50 9.40 9.00 9.5
  133. 7.60 7.80 7.20 8.30 7.40 8.00 7.10 7.1
  134. 7.90 8.50 7.40 8.30 7.40 8.40 7.10 7.4
  135. 7.70 7.70 7.20 8.30 7.20 8.10 7.10 9.1
  136. 7.50 8.30 7.60 8.60 7.30 8.20 7.50 7.3
  137. 8.80 8.60 7.60 8.90 7.80 9.00 7.80 9.5
  138. 7.60 7.90 7.30 8.10 7.40 7.70 7.10 7.1
  139. 9.30 9.60 8.70 9.40 7.90 9.10 8.30 7.8
  140. 8.10 8.70 7.70 8.80 7.70 8.70 7.90 9.3
  141. 9.80 9.90 9.40 9.70 8.80 9.80 9.40 8.8
  142. 9.90 9.80 9.30 9.90 8.80 9.90 9.80 9.9
  143. 8.90 9.10 8.50 9.50 8.40 9.80 8.80 9.9
  144. 7.90 8.30 7.80 8.80 7.50 8.30 7.30 7.9
  145. 8.10 9.00 7.30 8.30 7.30 7.30 7.10 9.0
  146. 9.20 8.70 7.80 9.00 8.00 9.10 7.90 7.1
  147. 9.80 9.90 9.70 9.90 9.30 10.00 9.90 9.8
  148. 9.20 9.10 8.70 8.90 7.90 9.20 8.40 9.1
  149. 7.50 8.00 7.30 7.90 7.30 8.10 7.30 7.6
  150. 8.10 8.90 7.70 8.90 7.60 8.40 8.10 7.6
  151. 9.60 9.90 9.20 9.70 8.90 9.90 9.60 9.7
  152. 9.00 9.00 8.00 9.40 8.30 9.10 8.70 8.2
  153. 7.10 7.30 7.10 7.80 7.10 7.30 7.00 7.0
  154. 9.70 9.90 9.40 9.70 9.30 10.00 9.80 9.5
  155. 9.60 9.90 9.50 9.60 8.70 10.00 9.30 7.6
  156. 7.20 7.80 7.20 8.00 7.30 7.10 7.00 7.0
  157. 9.60 9.90 9.50 9.90 9.30 9.90 9.90 10.0
  158. 8.30 8.80 7.30 9.00 7.60 8.70 7.10 8.9
  159. 7.90 9.10 7.50 8.90 7.50 8.60 8.10 7.6
  160. 9.30 9.70 8.80 9.70 8.70 9.70 9.50 7.7
  161. 9.50 9.90 8.70 9.70 9.10 9.90 9.50 9.9
  162. 8.10 8.70 7.20 8.70 7.50 7.80 7.40 9.5
  163. 7.80 7.80 7.30 8.60 7.40 7.50 7.10 7.2
  164. 9.70 9.90 9.00 9.70 9.20 10.00 9.60 9.4
  165. 8.10 9.30 7.60 9.00 7.90 8.10 8.00 7.4
  166. 7.80 8.40 7.20 8.10 7.40 7.80 7.10 7.9
  167. 8.50 8.90 7.50 8.80 7.90 8.60 7.70 8.9
  168. 9.30 9.80 9.20 9.40 8.90 9.80 9.10 9.9
  169. 7.90 8.30 7.40 8.60 7.50 7.70 7.30 7.8
  170. 8.20 9.10 8.20 9.00 7.80 8.50 8.10 8.2
  171. 9.40 9.70 8.30 9.10 8.20 9.40 8.40 7.5
  172. 9.00 9.60 9.00 9.50 8.80 9.60 9.40 9.9
  173. 8.60 8.60 8.00 9.10 8.10 9.20 7.70 7.7
  174. 9.40 9.90 9.50 9.80 9.20 10.00 9.40 9.9
  175. 8.20 9.40 8.30 9.20 8.20 9.10 8.80 9.4
  176. 7.90 9.20 7.90 9.00 7.90 8.90 7.70 9.9
  177. 7.90 8.30 7.60 8.80 7.50 8.00 7.20 7.1
  178. 9.40 9.90 9.70 9.70 9.20 10.00 9.40 9.8
  179. 9.10 9.40 8.40 9.20 8.50 9.90 8.80 7.7
  180. 7.90 8.40 7.40 8.60 7.60 8.80 7.50 7.0
  181. 8.80 9.50 8.50 9.70 8.00 9.60 8.90 9.4
  182. 9.80 9.90 9.40 9.90 9.30 9.90 9.70 9.6
  183. 8.30 9.30 7.70 9.20 7.90 9.30 8.60 9.2
  184. 9.70 9.80 8.80 9.70 9.20 9.90 9.50 8.3
  185. 9.00 9.60 8.40 9.40 8.30 9.10 9.00 9.2
  186. 7.20 7.10 7.00 7.50 7.10 7.30 7.00 7.5
  187. 7.70 8.50 7.40 8.70 7.70 8.30 7.30 9.5
  188. 8.20 8.00 7.40 8.40 7.40 8.30 7.20 8.9
  189. 7.40 7.70 7.10 7.80 7.30 7.10 7.20 7.0
  190. 8.30 8.80 7.60 9.10 7.70 8.90 7.80 7.5
  191. 9.80 9.80 9.80 9.90 8.60 10.00 9.90 8.8
  192. 9.80 9.90 9.30 9.80 9.10 10.00 9.50 9.3
  193. 8.70 9.10 8.20 9.10 8.20 9.10 8.20 8.4
  194. 7.90 8.60 7.40 8.50 7.60 8.40 7.30 8.5
  195. 7.50 8.00 7.30 8.00 7.40 8.00 7.10 7.1
  196. 7.20 7.60 7.20 8.00 7.40 7.30 7.00 8.9
  197. 9.50 9.70 8.30 9.60 8.70 9.80 8.70 9.7
  198. 8.30 8.10 7.50 9.00 7.30 7.50 7.20 7.4
  199. 9.50 9.80 9.50 9.70 9.10 9.80 8.80 9.3
  200. 8.40 8.70 8.10 9.20 7.90 8.50 7.30 8.1
  201. 9.80 9.80 8.70 9.60 8.70 9.90 9.40 9.9
  202. 8.70 8.50 7.50 8.40 7.70 8.20 7.30 8.6
  203. 9.70 9.90 8.90 9.80 9.00 9.90 9.20 9.4
  204. 7.80 8.50 8.00 8.80 8.00 9.20 7.30 7.4
  205. 8.30 8.70 7.50 8.40 7.50 8.70 7.20 7.8
  206. 8.00 8.40 7.50 8.60 7.50 7.50 7.20 8.8
  207. 7.50 8.20 7.20 8.50 7.30 8.00 7.10 7.0
  208. 9.70 9.90 9.50 9.80 8.70 10.00 9.90 9.8
  209. 9.70 9.90 9.70 9.90 9.40 10.00 9.80 9.8
  210. 7.00 7.10 7.00 7.20 7.00 7.00 7.00 7.0
  211. 7.50 8.20 7.10 8.40 7.20 7.80 7.10 8.0
  212. 8.60 9.20 8.50 9.20 8.50 9.60 8.40 8.1
  213. 9.00 9.40 7.90 9.50 8.40 9.30 8.20 9.7
  214. 8.40 8.70 7.50 9.20 7.80 8.30 7.70 7.6
  215. 8.00 9.20 7.80 8.90 7.90 8.40 7.30 10.0
  216. 8.50 8.70 8.20 9.40 7.80 9.50 8.20 7.9
  217. 7.20 8.20 7.30 8.30 7.50 7.80 7.10 7.5
  218. 7.20 7.90 7.10 7.90 7.20 7.70 7.00 8.3
  219. 8.30 8.60 7.30 9.00 7.80 8.20 8.10 7.7
  220. 7.20 7.40 7.10 7.80 7.10 7.20 7.00 7.3
  221. 9.20 9.80 8.80 9.50 8.60 10.00 9.30 9.6
  222. 8.40 9.00 7.50 9.10 8.00 8.90 8.00 9.2
  223. 7.30 7.50 7.00 8.00 7.30 7.10 7.00 7.8
  224. 8.40 9.50 8.30 9.40 8.20 9.40 9.20 9.0
  225. 7.60 8.10 7.60 8.60 7.30 8.00 7.10 7.6
  226. 7.60 8.40 7.30 8.40 7.30 8.20 7.10 7.3
  227. 7.40 7.80 7.10 8.00 7.20 7.50 7.10 7.0
  228. 8.70 9.00 8.00 9.40 7.70 8.90 7.80 7.9
  229. 9.50 9.90 9.30 9.60 9.10 9.90 9.50 9.0
  230. 9.30 9.80 8.80 9.60 9.20 9.70 9.40 8.7
  231. 9.80 9.80 9.00 9.70 8.60 10.00 9.30 9.8
  232. 8.20 9.00 7.10 8.90 7.50 8.90 7.50 7.9
  233. 8.00 8.40 7.30 8.40 7.30 7.90 7.40 7.2
  234. 8.80 9.30 8.70 9.20 8.20 9.10 8.20 8.4
  235. 8.70 8.70 7.40 8.90 7.80 9.20 7.60 9.4
  236. 7.10 7.60 7.00 7.70 7.10 7.10 7.00 7.1
  237. 8.60 8.50 7.90 9.20 7.80 9.20 7.40 8.6
  238. 7.70 8.00 7.20 8.50 7.40 8.10 7.10 9.2
  239. 8.10 8.80 7.70 8.90 8.00 9.10 7.90 8.7
  240. 8.40 9.20 8.50 9.50 8.50 9.80 8.20 9.7
  241. 9.20 9.70 9.20 9.60 9.00 9.80 9.60 9.5
  242. 9.90 9.80 9.30 9.80 8.80 9.90 9.80 9.9
  243. 9.60 9.90 8.70 9.60 8.30 9.90 9.30 9.5
  244. 7.00 7.20 7.00 7.30 7.00 7.00 7.00 7.3
  245. 7.60 8.20 7.40 8.90 7.60 8.10 7.30 7.2
  246. 8.30 9.20 7.90 9.10 8.00 9.00 8.00 8.9
  247. 9.60 9.80 8.50 9.50 8.60 9.80 9.20 7.6
  248. 8.50 8.80 7.60 8.80 7.80 8.90 7.40 8.5
  249. 9.80 10.00 9.30 9.90 9.20 9.90 9.90 10.0
  250. 9.50 9.80 9.40 9.50 8.90 10.00 9.70 10.0
  251. 8.50 9.20 8.10 9.10 8.50 9.70 7.70 9.9
  252. 7.40 7.90 7.10 8.20 7.10 7.90 7.30 7.2
  253. 8.00 9.20 7.90 9.10 8.00 8.80 7.30 9.6
  254. 9.20 9.60 8.00 9.50 8.40 9.60 9.50 10.0
  255. 8.80 9.70 8.20 9.50 8.90 9.50 8.20 8.8
  256. 7.10 7.60 7.40 7.80 7.20 7.40 7.00 7.1
  257. 9.00 9.70 8.20 9.50 7.90 9.60 8.60 9.9
  258. 7.60 8.90 8.40 9.20 7.90 8.20 7.60 8.2
  259. 9.70 9.70 9.30 9.70 9.00 9.90 9.60 7.8
  260. 8.20 9.20 8.10 9.00 7.70 9.00 8.60 7.3
  261. 9.00 9.00 8.10 9.30 8.00 10.00 8.70 9.9
  262. 9.10 9.30 8.20 9.50 8.20 9.70 8.50 9.4
  263. 10.00 10.00 9.80 9.90 9.40 10.00 9.90 9.4
  264. 7.50 8.30 7.30 8.30 7.90 7.60 7.20 7.3
  265. 9.80 9.90 9.10 9.40 8.30 9.90 9.20 9.4
  266. 8.90 9.50 8.60 9.60 8.40 9.20 8.00 9.7
  267. 7.90 8.80 7.40 8.50 7.50 8.20 8.10 9.2
  268. 9.30 9.90 9.10 9.60 9.00 9.60 9.50 9.8
  269. 7.80 8.70 7.60 8.70 7.60 9.10 7.30 7.1
  270. 9.00 9.60 8.60 9.20 7.80 9.30 8.10 7.3
  271. 9.50 9.80 8.50 9.30 8.40 9.60 8.90 8.2
  272. 8.70 9.60 8.70 9.10 8.40 9.70 8.40 9.9
  273. 7.90 8.40 7.40 8.40 7.50 7.90 7.30 7.5
  274. 7.00 7.10 7.00 7.60 7.10 7.10 7.00 7.0
  275. 9.20 9.90 8.70 9.70 9.50 9.90 9.60 9.3
  276. 8.90 9.00 7.60 9.20 7.80 9.30 7.70 7.7
  277. 7.80 8.10 7.70 8.60 7.50 8.60 7.20 8.2
  278. 7.80 8.10 7.40 8.10 7.30 8.40 7.10 8.0
  279. 9.40 9.90 9.60 9.70 9.50 10.00 9.80 10.0
  280. 9.30 9.50 8.70 9.50 8.20 9.70 8.90 8.5
  281. 8.40 9.50 8.60 9.20 8.40 9.70 8.60 8.2
  282. 9.70 9.90 9.00 9.90 9.00 10.00 9.70 8.4
  283. 9.00 9.70 8.70 9.40 8.10 9.80 9.10 9.6
  284. 9.30 9.50 8.80 9.70 8.50 9.90 9.50 8.3
  285. 7.90 9.30 8.10 9.20 7.70 9.00 8.40 7.3
  286. 8.80 9.60 8.80 9.50 8.30 9.80 8.50 7.6
  287. 7.40 7.50 7.10 7.80 7.30 7.30 7.00 7.4
  288. 9.70 9.90 8.60 9.80 9.30 10.00 9.70 8.2
  289. 7.80 8.20 7.40 9.00 7.40 7.90 7.20 9.7
  290. 9.20 9.50 8.70 9.60 8.20 9.60 8.80 8.8
  291. 8.30 8.70 7.90 9.10 8.40 9.50 8.40 9.2
  292. 7.80 8.70 7.50 8.30 7.40 8.40 7.40 7.3
  293. 9.80 9.90 9.60 9.90 9.10 10.00 9.80 9.9
  294. 7.90 8.40 7.50 8.50 7.90 8.20 7.50 7.1
  295. 9.00 9.40 8.70 9.60 8.40 9.70 8.70 7.9
  296. 8.40 9.20 8.00 9.00 7.90 9.20 8.40 8.2
  297. 9.70 9.60 9.20 9.50 8.90 9.50 9.40 10.0
  298. 7.30 7.60 7.10 7.70 7.10 7.10 7.00 7.7
  299. 7.80 8.20 7.50 8.20 7.40 7.60 7.20 7.0
  300. 8.40 9.20 8.10 9.30 7.70 8.40 7.70 9.8

為什么不能使用K均值聚類呢?

因?yàn)镵均值聚類只能對(duì)案例做聚類,,這個(gè)是對(duì)變量做聚類

而且K均值聚類需要確定類別數(shù),,目前是不知道的

我們是對(duì)變量做聚類,冰柱圖看起來(lái)太麻煩了,,直接看樹(shù)狀圖

聚類過(guò)程 ,,系數(shù)代表距離,距離什么含義,,要看我們使用了什么距離指標(biāo)

樹(shù)狀圖,,233.297換算成下面的25

發(fā)現(xiàn)意大利和東方集團(tuán)(中國(guó)、俄羅斯,、羅馬尼亞)聚類有一些問(wèn)題

變量聚類一般默認(rèn)距離為相關(guān)性(默認(rèn)是平方歐氏距離)

得到的結(jié)果好很多

 

這個(gè)例子也可以使用因子分析解決

擴(kuò)展:

一般聚類方法組間聯(lián)接是最好的,;ward法聚類出來(lái)會(huì)比較平均

度量標(biāo)準(zhǔn) :案例--平方歐式距離最好

變量--皮爾遜相關(guān)性最好

關(guān)于標(biāo)準(zhǔn)化問(wèn)題

K均值聚類需要自己手動(dòng)

系統(tǒng)聚類如下

 

前面說(shuō)的兩種方法是經(jīng)典的分析聚類方法,還有智能分析聚類方法

兩步聚類算法(TwoStep Cluster)

特點(diǎn):

  •  處理對(duì)象:分類變量和連續(xù)變量
  • 自動(dòng)決定最佳分類數(shù)
  • 快速處理大數(shù)據(jù)集 

前提假設(shè):

  • 變量間彼此獨(dú)立
  • 分類變量服從多項(xiàng)分布,,連續(xù)變量服從正態(tài)分布

 

其實(shí)稍微違反假設(shè)條件其實(shí)也不要緊,,結(jié)果很穩(wěn)健,其會(huì)自動(dòng)剔除異常值

數(shù)據(jù)集還是(我的資源下載“spss之聚類分析--移動(dòng)通訊客戶細(xì)分”

spss使用該模型自動(dòng)對(duì)連續(xù)變量進(jìn)行標(biāo)化

設(shè)置其最大聚類數(shù)

 

 

聚類需要注意的地方

  • 距離測(cè)量方法

使用默認(rèn)值即可

  • 變量選擇

無(wú)關(guān)變量有時(shí)會(huì)引起嚴(yán)重的錯(cuò)分
應(yīng)當(dāng)只引入在不同類間有顯著差別的變量
盡量只使用相同類型的變量進(jìn)行分析(使用連續(xù)變量,,將分類變量用于結(jié)果解釋;新的聚類方法比如兩步聚類算法可以同時(shí)使用這些變量)

  • 共線性問(wèn)題

對(duì)記錄聚類結(jié)果有較大的影響,,相當(dāng)于某個(gè)變量在聚類中的權(quán)重大于其它變量
最好先進(jìn)行預(yù)處理

  • 變量的標(biāo)準(zhǔn)化

變量量綱/變異程度相差非常大時(shí)需要進(jìn)行
數(shù)理統(tǒng)計(jì)算法上要求一律標(biāo)準(zhǔn)化
標(biāo)準(zhǔn)化后會(huì)削弱有用變量的作用

  • 異常值

影響較大
還沒(méi)有比較好的解決辦法
盡力避免

  • 分類數(shù)

從實(shí)用角度講,2~8類比較合適

  • 專業(yè)意義

一定要結(jié)合專業(yè)知識(shí)進(jìn)行分析

  • 其他方面

聚類分析主要應(yīng)用于探索性的研究,,其分析的結(jié)果可以提供多個(gè)可能的解,,選擇最終的解需要研究者的主觀判斷和后續(xù)的分析
聚類分析的解完全依賴于研究者所選擇的聚類變量,增加或刪除一些變量對(duì)最終的解都可能產(chǎn)生實(shí)質(zhì)性的影響
不管實(shí)際數(shù)據(jù)中是否真正存在不同的類別,,利用聚類分析都能得到分成若干類別的解
  

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn),。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式,、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙,。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多