久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

預(yù)測模型第6期 | 臨床預(yù)測模型的建立與驗(yàn)證

 醫(yī)科研 2021-01-25

然前面我們已經(jīng)對臨床預(yù)測模型的概念有了基本了解后,那么它具體如何構(gòu)建以及驗(yàn)證呢,?本節(jié)我們就討論下這方面的內(nèi)容,。

臨床問題決定研究類型:

首選我們要明確具體的臨床問題決定研究類型的選擇。臨床預(yù)測模型可以回答疾病的病因,、診斷,、患者對治療的反應(yīng)和預(yù)后等問題。不同的問題需要設(shè)計不同的研究類型,。

例如,,在病因?qū)W研究方面,隊(duì)列研究可以用來根據(jù)潛在的原因來預(yù)測疾病是否發(fā)生,。關(guān)于診斷準(zhǔn)確性的臨床問題,,適合采用橫斷面研究設(shè)計,因?yàn)轭A(yù)測因子和結(jié)果可能同時發(fā)生或在短時間內(nèi)發(fā)生,。

為了預(yù)測患者對治療的反應(yīng),,可以采用隊(duì)列研究或隨機(jī)對照試驗(yàn)(RCT)。對于預(yù)測類臨床問題,,設(shè)計隊(duì)列研究是適用的,,因?yàn)轭A(yù)測因子和結(jié)局有縱向的時間邏輯關(guān)系。評估病因的隊(duì)列研究需要選擇合理的研究對象和控制混雜因素,。

在診斷模型的研究中,,需要一個“金標(biāo)準(zhǔn)”或參考標(biāo)準(zhǔn)來獨(dú)立診斷疾病,參考標(biāo)準(zhǔn)的診斷應(yīng)該在“盲法”狀態(tài)下進(jìn)行,。也就是說,,參考標(biāo)準(zhǔn)診斷不能依賴于預(yù)測模型中預(yù)測因子的信息,以避免出現(xiàn)診斷評估偏差,。

評估患者對治療的反應(yīng)是干預(yù)性研究的一種類型,。需要選擇合理的研究對象,、控制非測試因素的干擾。在預(yù)后模型中,,預(yù)測因子與結(jié)局之間存在縱向關(guān)系,,研究者通常期望得到疾病在自然狀態(tài)下的結(jié)局,因此前瞻性隊(duì)列研究是最常見的預(yù)后模型,,也是最佳的研究設(shè)計類型,。

構(gòu)建模型的數(shù)量:

首先需要回顧文獻(xiàn)來確定我們要構(gòu)建的預(yù)測模型的數(shù)量:

(一)針對具體臨床問題目前還沒有預(yù)測模型。為了構(gòu)建一個新的模型,,通常需要一個訓(xùn)練集來構(gòu)建模型,,并需要一個驗(yàn)證集來驗(yàn)證模型的預(yù)測能力。

(二)目前已有預(yù)測模型,。為了構(gòu)建新的模型,,使用驗(yàn)證集來構(gòu)建新模型,并使用相同的訓(xùn)練數(shù)據(jù)集來分別驗(yàn)證現(xiàn)有模型和新模型的預(yù)測能力,。

(三)為了更新現(xiàn)有模型,,使用相同的驗(yàn)證數(shù)據(jù)集來評估這兩個模型的預(yù)測能力。

關(guān)于訓(xùn)練數(shù)據(jù)集和驗(yàn)證數(shù)據(jù)集的生成,,可以前瞻性地或回顧性地收集數(shù)據(jù),,其中前瞻性收集的數(shù)據(jù)具有更高的質(zhì)量。對于建模人群,,樣本量應(yīng)盡可能大,。

如果數(shù)據(jù)是回顧性收集的,還應(yīng)該評估數(shù)據(jù)質(zhì)量,,識別離群值,,并對缺失值進(jìn)行適當(dāng)處理,如填充或刪除,。

最后,根據(jù)實(shí)際情況確定用于建模的訓(xùn)練數(shù)據(jù)集和用于驗(yàn)證的驗(yàn)證數(shù)據(jù)集,。由于現(xiàn)實(shí)原因,,有時只能在同一數(shù)據(jù)集中建模和驗(yàn)證,這是允許的,,但模型的外部適用性會受到一定程度的影響,。

模型的建立與呈現(xiàn):

在建立預(yù)測模型之前,有必要了解以往文獻(xiàn)報道中的預(yù)測因子,,確定選擇預(yù)測因子的原則和方法,,并選擇所需應(yīng)用的模型類型,如logistic回歸模型或Cox回歸模型,。目前,,預(yù)測模型常用有四種呈現(xiàn)形式:

(一)公式,。直接使用數(shù)學(xué)公式作為預(yù)測模型工具。

(二)列線圖Nomogram,。通過適當(dāng)?shù)臄?shù)學(xué)變換將回歸模型中的回歸系數(shù)轉(zhuǎn)換為分?jǐn)?shù),,并將其繪制為諾模圖作為預(yù)測模型工具。

(三) 網(wǎng)絡(luò)計算器,。其本質(zhì)也是通過適當(dāng)?shù)臄?shù)學(xué)運(yùn)算將回歸模型中的回歸系數(shù)轉(zhuǎn)換成分?jǐn)?shù),,并將其制作成網(wǎng)站供在線使用。

(四)評分系統(tǒng),。通過適當(dāng)?shù)臄?shù)學(xué)運(yùn)算,,將回歸模型的回歸系數(shù)轉(zhuǎn)化為一個可量化的評分系統(tǒng)。

臨床預(yù)測模型的驗(yàn)證:

預(yù)測模型的效果會隨著應(yīng)用場景和人群的變化而變化,。因此,,對預(yù)測模型的完整研究應(yīng)該包括模型的驗(yàn)證驗(yàn)證的內(nèi)容包括模型的內(nèi)部有效性和外部有效性,。內(nèi)部有效性反映了模型的可重復(fù)性,,以用本身的研究數(shù)據(jù)通過交叉驗(yàn)證和Bootstrap方法來進(jìn)行驗(yàn)證外部有效性反映了模型的普遍性,,需要使用不是來自研究本身的數(shù)據(jù)集進(jìn)行驗(yàn)證,,這些數(shù)據(jù)集在時間或地理上是相互獨(dú)立的。

模型的內(nèi)部驗(yàn)證和外部驗(yàn)證是評估模型穩(wěn)定性和適用性的必要步驟,。用于內(nèi)部驗(yàn)證和外部驗(yàn)證的數(shù)據(jù)集應(yīng)該是完全異質(zhì)的,,不能僅僅在一定程度上不同。一般情況下,,使用原機(jī)構(gòu)的數(shù)據(jù)作為訓(xùn)練集來建立模型,,并隨機(jī)抽取一部分內(nèi)部數(shù)據(jù)進(jìn)行內(nèi)部驗(yàn)證。選擇來自其他機(jī)構(gòu)的數(shù)據(jù)作為外部驗(yàn)證數(shù)據(jù)集,。當(dāng)然,,最好是進(jìn)行外部數(shù)據(jù)集驗(yàn)證。下面介紹幾種驗(yàn)證內(nèi)部有效性的方法,。

(一)隨機(jī)拆分法,。將現(xiàn)有數(shù)據(jù)隨機(jī)分成兩部分,一部分用于構(gòu)建模型,,另一部分用于驗(yàn)證模型,。采用該方法將數(shù)據(jù)分為兩部分進(jìn)行“內(nèi)部驗(yàn)證”。由于只有一部分的數(shù)據(jù)用于構(gòu)建模型,,因此模型相對不穩(wěn)定,。樣本量較小的研究通常不適合這種方法。

(二)交叉驗(yàn)證方法這種方法是對隨機(jī)拆分法的的進(jìn)一步延伸,。常用的有半折交叉驗(yàn)證和十折交叉驗(yàn)證,。半折交叉驗(yàn)證法是將原始數(shù)據(jù)分成兩部分,一部分用于建立模型,,另一部分用于驗(yàn)證模型,。然后調(diào)換兩部分的數(shù)據(jù)并相互驗(yàn)證。十折交叉驗(yàn)證法是將數(shù)據(jù)分成十部分,,其中九部分用于建模,,另一部分用于模型驗(yàn)證。用這種方法建立和驗(yàn)證模型十次,,就可以構(gòu)建一個相對穩(wěn)定的模型,。

(三)Bootstrap方法。傳統(tǒng)的Bootstrap內(nèi)部有效性驗(yàn)證方法是在原始數(shù)據(jù)集中有放回的隨機(jī)抽取一定數(shù)量的樣本建立模型,,然后使用原始數(shù)據(jù)集對模型進(jìn)行驗(yàn)證,。通過500-1000次的隨機(jī)抽樣、建立和驗(yàn)證,,可以得到500-1000個模型,,并可以總結(jié)出模型的參數(shù)分布。因此,,可以確定模型的最終參數(shù)值,。實(shí)踐證明,該方法得到的模型比前兩種方法具有更高的穩(wěn)定性,???strong>以推測,Bootstrap方法將越來越多地應(yīng)用于驗(yàn)證模型的內(nèi)部有效性分析,。當(dāng)然,,在具備條件的情況下,應(yīng)盡量對預(yù)測模型進(jìn)行外部驗(yàn)證,,提高模型的外部適用性,。

目前臨床預(yù)測模型的研究從臨床醫(yī)生的角度大致可分為三大類:

1.預(yù)測模型是根據(jù)傳統(tǒng)的臨床特征、病理特征,、體檢結(jié)果,、實(shí)驗(yàn)室檢查結(jié)果等構(gòu)建起來的,這類模型中的預(yù)測變量更加便于從臨床上獲取,。

2.隨著影像組學(xué)研究方法的成熟,越來越多的學(xué)者意識到影像學(xué)的某些表現(xiàn)或參數(shù)代表了特定的生物學(xué)特征,。使用彩色多普勒超聲,、CT、MR以及PET的大量成像參數(shù)結(jié)合臨床特征來構(gòu)建預(yù)測模型,往往可以進(jìn)一步提高預(yù)測模型的準(zhǔn)確性,。此類建?;谟跋窠M學(xué)數(shù)據(jù)。此類建模的前期工作量比第一種方法大得多,,并且需要臨床和影像部門之間的緊密合作,。

3.隨著基因組學(xué)和蛋白質(zhì)組學(xué)等高通量生物技術(shù)的廣泛應(yīng)用,臨床研究人員正試圖從這些海量的生物信息中尋找某種特征生物標(biāo)記物來構(gòu)建預(yù)測模型,。這些預(yù)測模型是將基礎(chǔ)醫(yī)學(xué)轉(zhuǎn)化為臨床醫(yī)學(xué)的一個很好的切入點(diǎn),,但由于需要對臨床標(biāo)本進(jìn)行各種組學(xué)測試,這類研究往往需要強(qiáng)有力的資金支持,。一旦愿意投入資金進(jìn)行組學(xué)分析的研究,,可以很好地轉(zhuǎn)化為臨床研究,一般可以產(chǎn)出高分文章,。此外,,還必須要有生物樣本的支持。

從臨床醫(yī)生的角度構(gòu)建臨床預(yù)測模型的所需條件:

1.建立單一疾病的隨訪數(shù)據(jù)庫,,盡可能完整地收集患者信息,,包括但不限于:人口統(tǒng)計學(xué)特征、既往病史,、家族史,、個人病史;與疾病相關(guān)的信息,,如治療前重要的生理和實(shí)驗(yàn)室檢查結(jié)果,、疾病的嚴(yán)重程度、臨床分期,、病理分期,、組織學(xué)分級;治療信息:如手術(shù)方法,、放化療方案,、劑量和強(qiáng)度;患者的預(yù)后:對于癌癥患者,,需要持續(xù)的隨訪才能獲得其結(jié)果,,這是一項(xiàng)極其困難和復(fù)雜的任務(wù)。

2.從以往發(fā)表的預(yù)測模型文章來看,,大部分都是基于回顧性的數(shù)據(jù),,也有一小部分是基于前瞻性的數(shù)據(jù)。與隨機(jī)對照研究相比,,這樣的研究更容易進(jìn)行,,而且它們屬于我們現(xiàn)在提議的現(xiàn)實(shí)世界研究領(lǐng)域。在過去,我們過分強(qiáng)調(diào)了隨機(jī)對照研究的重要性,,而忽視了現(xiàn)實(shí)世界數(shù)據(jù)的巨大價值,。隨機(jī)對照研究的數(shù)據(jù)無疑是質(zhì)量最高的,但數(shù)據(jù)經(jīng)過了嚴(yán)格的篩選,,因此證據(jù)的外推是有限的,。真實(shí)數(shù)據(jù)來源于我們的日常臨床實(shí)踐,更全面地反映了臨床干預(yù)的有效性,,證據(jù)具有較好的外部適用性,。然而,現(xiàn)實(shí)世界研究的最大問題是數(shù)據(jù)的質(zhì)量參差不齊,,有太多難以識別的混雜因素,。因此,有必要用更復(fù)雜的統(tǒng)計方法從復(fù)雜的混雜因素中找出真相,。

在這里,,我們需要理解混雜因素是客觀存在的,因為任何臨床結(jié)果的發(fā)生都不是單一因素的結(jié)果,。對于混雜因素有兩個級別的校正,。一種是實(shí)驗(yàn)設(shè)計階段的校正,即頂層校正,,即通過隨機(jī)化和足夠的樣本量來均衡組間的混雜因素,。這也是隨機(jī)對照研究流行的原因:只要樣本量足夠,隨機(jī)化正確,,就能一勞永逸地解決混雜因素問題,。第二種情況是通過統(tǒng)計方法進(jìn)行后期校正,顯然沒有隨機(jī)對照研究校正的那么徹底,,但第二種情況更接近我們臨床實(shí)踐的真實(shí)情況,。

3.樣本大小。由于現(xiàn)實(shí)研究中混雜因素較多,,需要一定的樣本量才能達(dá)到足夠的統(tǒng)計效能,,才能辨別混雜因素對結(jié)果的影響。多變量分析篩選變量的一個簡單可行的原則是,,如果多變量分析中包含一個變量,,則有效樣本量應(yīng)為20個,稱為“1:20原則”,。例如,,我們在做COX回歸分析時,如果收集了8個與預(yù)后相關(guān)的變量,,那么至少應(yīng)該有160個患者發(fā)生了我們定義的終點(diǎn)事件,,如死亡,。注意是至少160個死亡患者,,而不是160個患者,,未出現(xiàn)終點(diǎn)事件的樣本我們一般不能稱其為有效樣本,。

4.臨床研究洞察力。建立臨床預(yù)測模型是為了解決臨床問題。要發(fā)現(xiàn)有價值的臨床問題,,就需要進(jìn)行廣泛閱讀和臨床實(shí)踐。

預(yù)測模型研究目前所面臨的問題:

1.臨床應(yīng)用率低,。主要原因是預(yù)測模型的臨床應(yīng)用需要在模型的準(zhǔn)確性和簡便性之間取得平衡。如果有一個模型,,它與TNM分期一樣易于使用,但比TNM分期更準(zhǔn)確,,您會做出什么選擇,?

2.大多數(shù)臨床預(yù)測模型都是基于回顧性數(shù)據(jù)集來構(gòu)建和驗(yàn)證的,,很少在前瞻性數(shù)據(jù)中進(jìn)行驗(yàn)證,。因此,模型預(yù)測的穩(wěn)定性相對較差,。

3.大多數(shù)臨床預(yù)測模型的驗(yàn)證都是基于內(nèi)部數(shù)據(jù),。大多數(shù)文章只有一個數(shù)據(jù)集。即使有兩個數(shù)據(jù)集,,一個要構(gòu)建,另一個要驗(yàn)證,,但這兩個數(shù)據(jù)集往往來自同一個研究中心。如果該預(yù)測模型的有效性能夠進(jìn)一步擴(kuò)展到另一個研究中心的數(shù)據(jù)集,那么該模型的應(yīng)用價值將會大大提高,。

參考文獻(xiàn)

Zhou ZR, Wang WW, Li Y, et al. In-depth mining of clinical data: the construction of clinical prediction model with R. Ann Transl Med. 2019;7(23):796. doi:10.21037/atm.2019.08.63

      發(fā)SCI的人都點(diǎn)了“在看” 

    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多