久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

如何用SPSS嶺回歸解決共線性問題,?

 鐘山紫竹林 2019-08-20
我們在線性回歸中,,難免會遇到數(shù)據(jù)存在共線性問題,所謂共線性,,是指兩個或多個自變量之間存在明顯的相關關系,,在線性擬合的過程中,導致回歸方程出現(xiàn)擬合效果差,、回歸系數(shù)難以解釋等問題,。

舉例:某自變量X1與Y為正相關關系,但是線性回歸顯示X1的回歸系數(shù)為負數(shù),,和實際情況相反,,這不符合現(xiàn)實情況,屬于比較典型的共線性問題,。

一起來看今天的實例:
某醫(yī)師希望通過B超下胎兒的身長,、頭圍、體重來預測胎兒周齡,,這些觀測值均是連續(xù)性數(shù)值變量,,所以很容易想到建立一個多重線性回歸方程來解決問題。
周齡為因變量,,體重,、身長、頭圍為自變量的回歸方程,,調整后R方=0.971,,模型可以解釋掉因變量97.1%的變異,說明模型擬合的不錯,。
再一細看,。自變量頭圍的回歸系數(shù)=-2.159,頭圍和胎兒周齡負相關,?隨著胎兒的頭圍增長,,胎兒的周齡變小,?很顯然這是不符合生活邏輯的,。

此時,不管前面調整R方有多么能說明問題,,這個模型也是不能用的!錯誤的!

然后我們發(fā)現(xiàn)自變量身長,、自變量頭圍的VIF值均大于200,,VIF指標是非常不錯的共線性的指針,一般上,,當VIF>10,,即可懷疑存在共線性問題了。

也就是說,,身長和頭圍這兩個存在較為嚴重的共線性問題,。如果強行擬合線性回歸的話,模型不可用,。但是醫(yī)師就是要研究身長,、頭圍、體重和周齡的關系,,我們還不能直接剔除,。

回歸還得繼續(xù),但顯然普通線性回歸已經(jīng)不合適了,。

怎么辦呢,?嶺回歸是一個可選的解決方案。

SPSS也是可以執(zhí)行嶺回歸的,,不過不是常見的菜單對話框模塊來執(zhí)行,,而是需要編寫一段語法。不要擔心,,這段語法比較簡單,,是比較容易理解和掌握的。

菜單:【文件】→【新建】→【語法】,,打開語法窗口,,輸入如下代碼:

INCLUDE'C:\Program Files\IBM\SPSS\Statistics\24\Samples\Simplified Chinese\Ridge regression.sps'.
ridgereg enter=long touwei weight
/dep=y
/start=0
/stop=1
/inc=0.05
/k=999.
EXECUTE

如下圖所示:
全選語法代碼,菜單:【運行】→【全部】,,得到如下可視化結果(修飾后):
上圖名為 嶺跡圖 ,,每個自變量X會在嶺跡圖上生成一條曲線,特點是隨著參數(shù)K的增大,,各條曲線逐漸重合重疊,。每條曲線有一個拐點,拐點左側的特點是快速下滑,,拐點右側的特點是趨于平穩(wěn)并與其他曲線重合,。

觀察嶺跡圖后,我們需要確定一個拐點,,在這個拐點處,,能使各條曲線同步趨于平穩(wěn)和重合,。拐點的確定,是比較主觀的,,不同的人可能會有不同的看法,,總的原則是,所選拐點,,也就是參考K,,它對應的調整R方盡可能大一些。
此時,,要結合上圖,。

我們可以看到,參數(shù)K(拐點的位置)越大,,縱軸回歸擬合決定系數(shù)R方就越小,。所以K不能選的過大,否則回歸方程決定系數(shù)就會大幅降低,,回歸方程質量就會下降,。

我們要在盡可能少的損失下,確定合適的參數(shù)K ,。

本例,,當K=0.05時,三條曲線,,尤其是long和touwei兩個變量趨于平穩(wěn),,此時對應的R方約為0.95,模型擬合質量還是蠻高的,。

因此,,本例K=0.05。

確定了參數(shù)K的取值,,接下來正式的開始用嶺回歸的方法擬合出回歸方程,。這一步仍然需要編寫一段語法代碼。

打開你電腦安裝SPSS的工作路徑,,找到“Ridge regression.sps”,,這個文件就是SPSS提供的能實現(xiàn)嶺回歸的語法代碼宏文件,每個人的電腦只要安裝了SPSS,,就會在軟件的安裝路徑下自動有這個文件,。

現(xiàn)在打開這個文件,找到【out similar to REGRESSION output.】這一段語法,,在下方合適的位置,,插入一句語法代碼:
.computeppp=2*(1-tcdf(abs(ratio),n-nv-1)).
具體如下:
然后,我們重新調用這個宏文件:

INCLUDE'C:\Program Files\IBM\SPSS\Statistics\24\Samples\Simplified Chinese\Ridge regression.sps'.
ridgereg enter=long touwei weight
/dep=y
/start=0
/stop=1
/inc=0.05
/k=0.05.
EXECUTE

將參數(shù)k有默認的999,,修改為0.05(前面嶺跡圖確定的拐點位置),。然后執(zhí)行代碼,。得到嶺回歸結果。
回歸方程表達式:

y=8.7+0.225*long+0.111*touwei+0.005*weight

該回歸方程的方差分析顯示,,p<0.05,,說明模型有統(tǒng)計學意義,該方程的調整R方=0.94,,模型能解釋因變量94%的變化,擬合效果可以接受,。

回歸方程中,,三個自變量long、touwei,、weight的偏回歸系數(shù)均為正數(shù),,說明三個自變量與胎兒周齡均為正相關關系,影響的程度具體看系數(shù)的絕對值,。符合現(xiàn)實情況,。

嶺回歸視頻演示近期更新發(fā)布至《SPSS從入門到實踐提高》課程
參考資料:嗵嗵e研-嶺回歸分析及其SPSS實現(xiàn)方法

任何人經(jīng)過一段時間的刻意學習和訓練之后,都能使用SPSS完成統(tǒng)計分析任務和基本的數(shù)據(jù)分析工作,,SPSS是最容易入門并熟練掌握的統(tǒng)計分析軟件工具,,本號推出的SPSS在線視頻教程《SPSS從入門到實踐提高》長期維護更新,想學習SPSS的讀者歡迎加入,。

    本站是提供個人知識管理的網(wǎng)絡存儲空間,,所有內容均由用戶發(fā)布,不代表本站觀點,。請注意甄別內容中的聯(lián)系方式,、誘導購買等信息,謹防詐騙,。如發(fā)現(xiàn)有害或侵權內容,,請點擊一鍵舉報。
    轉藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多