久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

警惕危險因素分析中的3個關(guān)鍵問題

 昵稱60542818 2019-09-19

危險因素篩選或探索是醫(yī)學(xué)研究中的一大類目的,很多臨床醫(yī)生都會通過已有的數(shù)據(jù),,確定一個醫(yī)學(xué)結(jié)局,,然后分析這一結(jié)局跟哪些因素有關(guān),或者說,,哪些因素可能是該結(jié)局發(fā)生的獨立影響因子,。

危險因素的探索分析過程,說簡單就簡單,,說復(fù)雜也很復(fù)雜,。說簡單,是因為很多人習(xí)慣把數(shù)據(jù)往軟件里一扔,,因變量放到因變量的地方,,自變量拖到自變量的地方,運行,,出結(jié)果,,結(jié)束。說復(fù)雜,,是因為往往上述的這種分析方式,,其實很多都有問題,因為統(tǒng)計分析最關(guān)鍵的不是軟件,,而是使用軟件的人,。

本文根據(jù)作者多年的分析經(jīng)驗,說一下危險因素探索分析中的3個關(guān)鍵問題,,希望以此提醒各位朋友,,在數(shù)據(jù)分析時,不要一味依賴軟件,。軟件主要是幫你計算,,思路是無法替代的,。

沒有一個明確的分析思路,,只能導(dǎo)致garbage in, garbage out 這種悲慘結(jié)局,。關(guān)鍵的問題是,,很多人即使得到了garbage的結(jié)果,卻懵然不知,,還以為發(fā)現(xiàn)了真理,。這才是最大的悲哀,。所以本文特地介紹幾個在危險因素探索過程中比較關(guān)鍵的3個問題,希望對各位有所幫助,。

一,、線性問題

不管是線性回歸還是logistic回歸或Poisson回歸,他們都屬于廣義線性模型,,本質(zhì)上都是“線性模型”,,因此一定要確認自變量與因變量(logistic回歸中為logit P)之間是否線性關(guān)系,如果不是,,需要考慮進行相應(yīng)的變換,,否則可能會產(chǎn)生錯誤結(jié)果。

例1:某研究分析老年人高血壓(二分類變量,,是或否)的危險因素,,研究因素包括gender、age,、ox-LDL,、Adiponectin、ox-LDL IgG和ox-LDL IgM 共6個指標,。其中g(shù)ender為二分類變量,,其余變量均為連續(xù)變量。如果把這6個自變量直接納入統(tǒng)計軟件分析,,所得結(jié)果如表1所示,。



可以看出,這6個變量均無統(tǒng)計學(xué)意義,。然而對數(shù)據(jù)重新分析后發(fā)現(xiàn),,并不是這些變量對結(jié)局均無影響,只是未能發(fā)現(xiàn)它們之間的真實關(guān)系而已,。經(jīng)仔細觀察,,發(fā)現(xiàn)age和 ox-LDL IgM 對結(jié)局的影響是有統(tǒng)計學(xué)意義的,但不是線性影響,,而是二次項關(guān)系(表2),。



這提醒我們,不僅僅是線性回歸需要看自變量與因變量的線性,,logistic回歸也需要考慮,,雖然logistic回歸中不像線性回歸可以用散點圖那么直觀,然而logit p與自變量的關(guān)系仍需要考慮是否線性,。如果不是,,你的結(jié)果恐怕就有問題。

二,、共線性問題

共線性簡單來說就是自變量之間存在高度相關(guān),,從而導(dǎo)致結(jié)果不可靠,。共線性是大多數(shù)回歸模型都需要考慮的一個問題,一旦發(fā)現(xiàn)該問題,,需要采取不同措施來解決,。常見的解決方案包括刪除某一自變量、主成分分析,、Lasso回歸等,。

例2:某研究分析乳腺增生的危險因素,自變量同時包括妊娠次數(shù)(三分類變量,,用1,、2、3表示相應(yīng)次數(shù))和流產(chǎn)次數(shù)(三分類變量,,用0,、1、2表示相應(yīng)次數(shù)),。

在單因素分析中妊娠次數(shù)有統(tǒng)計學(xué)意義(2 vs. 1,,P=0.0258;3 vs. 1,,P=0.0354),,然而多因素分析中變得無統(tǒng)計學(xué)意義(P值分別為0.6351、0.5942),。

分析原因發(fā)現(xiàn),,主要是由于妊娠次數(shù)和流產(chǎn)次數(shù)有較強的共線性,二者相關(guān)系數(shù)高達0.55,,從而導(dǎo)致妊娠次數(shù)變得無統(tǒng)計學(xué)意義,。解決方案采用了刪除法,刪除妊娠次數(shù)變量,,保留了流產(chǎn)次數(shù)變量,。

多數(shù)軟件都可以實現(xiàn)線性回歸的共線性診斷,logistic回歸則不一定有相應(yīng)選項,。實際上無所謂,,因為共線性只是針對自變量的,因此即使logistic回歸分析,,仍可以用線性回歸的共線性診斷工具,,判斷自變量之間是否存在共線性。

關(guān)于共線性的判斷,,有很多種方法,,后續(xù)會慢慢再說。但是必須先提醒一點,,共線性的判斷,,不建議根據(jù)某一固定值,大于或小于多少就有共線性,,否則就沒有共線性,。根據(jù)我個人的多年分析經(jīng)驗,這種方式很不可靠,。當(dāng)然,,這些問題在后續(xù)文章中詳細再說,這里先做一簡單提醒,。

三,、單因素和多因素的問題

對于危險因素篩選,不少人的分析思路是:先進行單因素分析,,將單因素分析中有統(tǒng)計學(xué)意義(P<0.05)的變量再納入多因素分析,,選出最終有統(tǒng)計學(xué)意義的變量作為危險因素。

然而這一思路并非十分可靠,,有些情況下可能會出現(xiàn)單因素分析無統(tǒng)計學(xué)意義而多因素分析有統(tǒng)計學(xué)意義的情況,,此時就容易漏掉某些重要的因素。

例3:某研究分析兩個血清學(xué)指標(分別用陽性和陰性表示)對癌的影響,,數(shù)據(jù)結(jié)果如表3所示,。



該數(shù)據(jù)采用單因素分析的話,可以發(fā)現(xiàn)x1并無統(tǒng)計學(xué)意義(P=0.114),,而在多因素分析中卻變得有統(tǒng)計學(xué)意義(P=0.018),。如果只將單因素分析中有統(tǒng)計學(xué)意義的變量納入多因素分析的話,就會漏掉x1變量,。為什么會出現(xiàn)這種情況,,主要是因為x1和x2之間存在負相關(guān),而x1,、x2與結(jié)局之間均為正相關(guān),。

關(guān)于這一問題,在前面的文章中(“先做單因素,,有意義的做多因素”,,這種思路對嗎?)已有專門提到,,大家可以再回去復(fù)習(xí)一下,。不過當(dāng)時那篇文章用的是一個連續(xù)變量舉例,可能有的人看的不夠直觀?,F(xiàn)在這個例子是分類變量,,看起來可能更直觀一些。

給大家的建議是,,數(shù)據(jù)分析過程中,,不要盲目套用所謂的“分析套路”,,而應(yīng)結(jié)合實際情況具體問題具體分析。

正如統(tǒng)計學(xué)界一句很流行的話“所有的模型都是錯誤的,,但是有一些是有用的”,。我也想說“所有的分析套路都可能是錯誤的,但有些是可以參考的”,。為什么這么說呢,?因為統(tǒng)計分析太靈活了,絕對找不出一個適用于任何數(shù)據(jù)分析的所謂套路或模式或步驟,,然而,,有些過程的確是可以參考,可以幫助我們探索一些問題,。



小提示:78%用戶已下載梅斯醫(yī)學(xué)APP,,更方便閱讀和交流,請掃描二維碼直接下載APP

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,,所有內(nèi)容均由用戶發(fā)布,,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式,、誘導(dǎo)購買等信息,,謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,,請點擊一鍵舉報,。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多