一、問題與數(shù)據(jù) 在臨床研究中,,經(jīng)常會比較兩種治療方式對患者結(jié)局的影響,,并且多次測量結(jié)局。例如,,為了研究兩種降壓藥物對血壓的控制效果是否存在差異,,研究者會對兩個人群服藥后在不同時間點記錄血壓值,然后評價降壓效果,?;蛘邔山M動物分別施加兩種干預(yù),,連續(xù)記錄多個時間點的結(jié)局,然后比較兩種干預(yù)的效果,。 這種設(shè)計可以用如下示意圖表示: 另外,,有時研究只需要收集一個時間點的數(shù)據(jù),但是一個研究對象會提供多個部位的數(shù)據(jù)點,。例如,,研究者想評價冠心病患者在冠脈搭橋術(shù)后應(yīng)用阿司匹林是否可以有效降低患者血管的再堵塞,評價的方法是術(shù)后1年做冠脈造影觀察血管是否堵塞,,但是每個患者可能會在同一次手術(shù)中對多條冠狀動脈血管進(jìn)行搭橋,,因此有的患者可能會貢獻(xiàn)多組數(shù)據(jù)。 這種設(shè)計可以用如下示意圖表示: 以上兩種設(shè)計,,不管是臨床試驗還是動物試驗都非常常見,,它的特點在于數(shù)據(jù)間非獨立,同一個體間數(shù)據(jù)具有相關(guān)性,。對于這樣的設(shè)計類型,,該如何分析呢? 今天我們來介紹另外一種非常好的方法——廣義估計方程(GEE),。GEE既可以處理連續(xù)型結(jié)局變量也可以處理分類型結(jié)局變量,,它實際上代表了一種模型類別,即在傳統(tǒng)模型的基礎(chǔ)上對相關(guān)性數(shù)據(jù)進(jìn)行了校正,,可以擬合Logistic回歸,、泊松回歸、Probit回歸,、一般線性回歸等廣義線性模型,。 本文將以阿司匹林預(yù)防冠脈搭橋后血管再堵塞為例介紹運用SPSS進(jìn)行GEE的操作方法。以下為數(shù)據(jù)格式: 表1. 數(shù)據(jù)格式 每名患者貢獻(xiàn)數(shù)據(jù)量不等,。如編號為1的患者只對一根血管進(jìn)行了搭橋手術(shù),編號為2的患者則有兩根血管進(jìn)行搭橋手術(shù),。 表2. 變量賦值 (注:本例中數(shù)據(jù)純屬虛構(gòu),,分析結(jié)果不能產(chǎn)生任何結(jié)論。性別為待調(diào)整變量,。) 二,、SPSS分析方法 1. 數(shù)據(jù)錄入SPSS 首先在SPSS變量視圖(Variable View)中新建上述表2中變量,然后在數(shù)據(jù)視圖(Data View)中錄入數(shù)據(jù),。
2. 選擇Analyze → Generalized Linear Models → Generalized Estimating Equations 3. 選項設(shè)置 ① 在Repeated模塊中,,將患者ID選入Subject variables 框,搭橋血管Num選入Within-subject variables框,。在Working Correlation Matrix的Structure下拉列表中選擇同一患者貢獻(xiàn)數(shù)據(jù)的相關(guān)性結(jié)構(gòu),。其有5個選項,,分別為:
本例中,同一患者搭橋的血管互相之間應(yīng)等同看待,,兩兩間相關(guān)性應(yīng)相等,,因此選擇等相關(guān)更合適。其他維持默認(rèn),。
② 在Type of Model模塊中設(shè)置模型類型 在此界面有6種模型類型可選:
以上6大類類型下還需選擇連接函數(shù),。本例中結(jié)局變量為二分類變量,Logistic回歸應(yīng)用更加普遍,,因此我們選擇Binary logistic來擬合校正數(shù)據(jù)相關(guān)性的Logistic回歸模型,。
③ 在Response模塊指定結(jié)局變量 將Outcome變量選入Dependent Variable,在Reference Category中選擇最小值作為參考值(本例中0為最小值,,代表未發(fā)生結(jié)局),。
④ 在Predictors模塊中將要納入模型的Treatment和Sex變量選入Covariates中。Covariates應(yīng)放入連續(xù)型變量,,F(xiàn)actors中放入分類變量,,但是本例中兩自變量均為二分類變量,放入Covariates處也可,。
⑤ 在Model模塊中將Treatment和Sex選入Model框內(nèi),,還可納入交互項,本例中不納入,。
⑥ 在Statistics模塊中除默認(rèn)外,,另外勾選Include exponential parameter estimates以獲得OR值,然后點擊OK,。 三,、結(jié)果解讀 結(jié)果中首先給出的是一些模型基本信息,在此略過,。這里僅介紹模型參數(shù)估計值結(jié)果:
從結(jié)果可以看到,,Treatment變量的系數(shù)值(B)為-1.077,,Exp(B)為0.341,即OR值,,P=0.046,,說明術(shù)后使用阿司匹林的患者1年后發(fā)生血管再堵塞的風(fēng)險是使用安慰劑組的0.341倍且有統(tǒng)計學(xué)意義,即阿司匹林具有保護(hù)作用,。另外我們納入校正的性別變量Sex OR值為0.692,,但P=0.531未達(dá)顯著水平。 如果我們不考慮數(shù)據(jù)間的相關(guān)性,,直接采用傳統(tǒng)的Logistic回歸模型,,那么將得到以下結(jié)果(詳情可看: SPSS實例教程:二分類Logistic回歸):
從結(jié)果中可以看到,盡管Treatment的OR值與GEE模型中相差不大,,但其P值卻不再顯著,。從本例中可以看到,如果在數(shù)據(jù)分析中方法選用錯誤將可能得不到正確結(jié)論,。 四,、結(jié)果匯總 冠脈搭橋術(shù)后患者應(yīng)用阿司匹林可以有效降低發(fā)生血管堵塞的風(fēng)險。服用阿司匹林組患者發(fā)生血管堵塞風(fēng)險是服用安慰劑組患者的0.341倍(P=0.046),。 五,、總結(jié)與拓展 對于文首提及的兩個例子,常見的分析方法有重復(fù)測量方差分析和多水平模型,,但是重復(fù)測量方差分析要求結(jié)局變量為連續(xù)變量,,不適用于分類變量。多水平模型處理相關(guān)性數(shù)據(jù)時非常靈活,,結(jié)局可以為連續(xù)變量,,也可以為分類變量,應(yīng)用非常廣泛,。 GEE的應(yīng)用似乎沒有前兩種廣泛,,但其具有非常好的特性。GEE既可以處理連續(xù)型結(jié)局變量也可以處理分類型結(jié)局變量,,其優(yōu)勢在于,,即使設(shè)定的數(shù)據(jù)間相關(guān)結(jié)構(gòu)與實際有偏差,在樣本量較大時其模型估計參數(shù)仍然具有無偏性,。GEE模型中自變量系數(shù)估計值準(zhǔn)確性的論證相較于多水平模型更加充分,,因此部分研究者更加推薦使用GEE,。 雖然GEE模型中數(shù)據(jù)間相關(guān)結(jié)構(gòu)指定錯誤時模型系數(shù)也具有無偏性,,但前提是樣本量要足夠大。在同樣的樣本量下,,正確的相關(guān)結(jié)構(gòu)更可能得到準(zhǔn)確的參數(shù)估計和置信區(qū)間,,因此應(yīng)仔細(xì)分析數(shù)據(jù)類型,,選擇最可能正確的相關(guān)結(jié)構(gòu)。 |
|