舉例:某自變量X1與Y為正相關關系,但是線性回歸顯示X1的回歸系數(shù)為負數(shù),,和實際情況相反,,這不符合現(xiàn)實情況,屬于比較典型的共線性問題,。 此時,不管前面調整R方有多么能說明問題,,這個模型也是不能用的!錯誤的! 然后我們發(fā)現(xiàn)自變量身長,、自變量頭圍的VIF值均大于200,,VIF指標是非常不錯的共線性的指針,一般上,,當VIF>10,,即可懷疑存在共線性問題了。 也就是說,,身長和頭圍這兩個存在較為嚴重的共線性問題,。如果強行擬合線性回歸的話,模型不可用,。但是醫(yī)師就是要研究身長,、頭圍、體重和周齡的關系,,我們還不能直接剔除,。 回歸還得繼續(xù),但顯然普通線性回歸已經(jīng)不合適了,。 怎么辦呢,?嶺回歸是一個可選的解決方案。 SPSS也是可以執(zhí)行嶺回歸的,,不過不是常見的菜單對話框模塊來執(zhí)行,,而是需要編寫一段語法。不要擔心,,這段語法比較簡單,,是比較容易理解和掌握的。 菜單:【文件】→【新建】→【語法】,,打開語法窗口,,輸入如下代碼: INCLUDE'C:\Program Files\IBM\SPSS\Statistics\24\Samples\Simplified Chinese\Ridge regression.sps'. ridgereg enter=long touwei weight /dep=y /start=0 /stop=1 /inc=0.05 /k=999. EXECUTE 如下圖所示: 觀察嶺跡圖后,我們需要確定一個拐點,,在這個拐點處,,能使各條曲線同步趨于平穩(wěn)和重合,。拐點的確定,是比較主觀的,,不同的人可能會有不同的看法,,總的原則是,所選拐點,,也就是參考K,,它對應的調整R方盡可能大一些。 我們可以看到,參數(shù)K(拐點的位置)越大,,縱軸回歸擬合決定系數(shù)R方就越小,。所以K不能選的過大,否則回歸方程決定系數(shù)就會大幅降低,,回歸方程質量就會下降,。 我們要在盡可能少的損失下,確定合適的參數(shù)K ,。 本例,,當K=0.05時,三條曲線,,尤其是long和touwei兩個變量趨于平穩(wěn),,此時對應的R方約為0.95,模型擬合質量還是蠻高的,。 因此,,本例K=0.05。 確定了參數(shù)K的取值,,接下來正式的開始用嶺回歸的方法擬合出回歸方程,。這一步仍然需要編寫一段語法代碼。 打開你電腦安裝SPSS的工作路徑,,找到“Ridge regression.sps”,,這個文件就是SPSS提供的能實現(xiàn)嶺回歸的語法代碼宏文件,每個人的電腦只要安裝了SPSS,,就會在軟件的安裝路徑下自動有這個文件,。 現(xiàn)在打開這個文件,找到【out similar to REGRESSION output.】這一段語法,,在下方合適的位置,,插入一句語法代碼: INCLUDE'C:\Program Files\IBM\SPSS\Statistics\24\Samples\Simplified Chinese\Ridge regression.sps'. ridgereg enter=long touwei weight /dep=y /start=0 /stop=1 /inc=0.05 /k=0.05. EXECUTE 將參數(shù)k有默認的999,,修改為0.05(前面嶺跡圖確定的拐點位置),。然后執(zhí)行代碼,。得到嶺回歸結果。 y=8.7+0.225*long+0.111*touwei+0.005*weight 該回歸方程的方差分析顯示,,p<0.05,,說明模型有統(tǒng)計學意義,該方程的調整R方=0.94,,模型能解釋因變量94%的變化,擬合效果可以接受,。 回歸方程中,,三個自變量long、touwei,、weight的偏回歸系數(shù)均為正數(shù),,說明三個自變量與胎兒周齡均為正相關關系,影響的程度具體看系數(shù)的絕對值,。符合現(xiàn)實情況,。 嶺回歸視頻演示近期更新發(fā)布至《SPSS從入門到實踐提高》課程 參考資料:嗵嗵e研-嶺回歸分析及其SPSS實現(xiàn)方法 |
|
來自: 鐘山紫竹林 > 《統(tǒng)計》