非劣效性臨床試驗(yàn)已成為評估藥物、器械,、生物制劑和其他療法的主要工具,,其初衷是尋找好的替代療法,然而設(shè)計(jì)缺陷往往導(dǎo)致弄巧成拙,。 1. ARISTOTLE,、RE-LY和ROCKET AF試驗(yàn)在心房顫動(dòng)患者中,,與安慰劑或阿司匹林相比,華法林降低了卒中風(fēng)險(xiǎn),,但出血風(fēng)險(xiǎn)增加,,且需要頻繁的血液檢測以確保治療效果。幾種新型口服抗凝劑因?yàn)槌鲅L(fēng)險(xiǎn)較低,,不需要血液檢測,,因此具有更大的便利性。這些藥物獲得FDA批準(zhǔn)的依據(jù)是比較口服抗凝劑與華法林預(yù)防卒中或血栓栓塞的三項(xiàng)大型非劣效性試驗(yàn):ARISTOTLE(阿哌沙班用于減少房顫患者的卒中和其他血栓栓塞事件,,Apixaban for Reduction in Stroke and Other Thromboembolic Events in Atrial Fibrillation),、RE-LY(長期抗凝治療隨機(jī)評估,Randomized Evaluation of Long-Term Anticoagulant Therapy)和ROCKET-AF(每日一次口服凝血因子Ⅹa直接抑制劑利伐沙班與維生素K拮抗劑預(yù)防房顫患者卒中和栓塞的比較,,Rivaroxaban Once Daily Oral Direct Factor Xa Inhibition Compared with Vitamin K Antagonism for Prevention of Stroke and Embolism Trial in Atrial Fibrillation),。研究者根據(jù)比較華法林與阿司匹林的既往隨機(jī)試驗(yàn)預(yù)期卒中或全身性血栓栓塞的發(fā)生率。非劣效性試驗(yàn)比較了新型抗凝劑與華法林的療效,,這些試驗(yàn)的參與者規(guī)模為14,264~18,261人,,他們被隨機(jī)分配到各治療組,以卒中或血栓栓塞的相對危險(xiǎn)度作為主要終點(diǎn),,相對非劣效性界值為小于1.4,。每項(xiàng)研究的相對危險(xiǎn)度單側(cè)97.5%置信區(qū)間(單側(cè)檢驗(yàn))的上限介于0.95~1.11,每項(xiàng)研究的結(jié)果都低于預(yù)設(shè)界值,,因此支持非劣效性結(jié)論,。這些研究還表明這些新型抗凝劑的顱內(nèi)出血發(fā)生率低,患者用藥方便,,因此替代華法林成為許多心房顫動(dòng)患者預(yù)防卒中的一線用藥,。2. PARTNER、CoreValve和SURTAVI試驗(yàn)未經(jīng)治療的重度主動(dòng)脈瓣狹窄與心力衰竭及死亡有一定相關(guān)性,,而外科主動(dòng)脈瓣置換術(shù)(SAVR)對許多患者有效,。可通過導(dǎo)管置換,,而無需切開胸骨的瓣膜帶來了低創(chuàng)療法,。研究者首先在重度主動(dòng)脈瓣狹窄患者中進(jìn)行了CoreValve和PARTNER2(經(jīng)導(dǎo)管主動(dòng)脈瓣置換術(shù)2,,Placement of Aortic Transcatheter Valves 2)試驗(yàn)。這些患者由于其他疾病和高齡而不太可能耐受(開胸)手術(shù),,在降低死亡率方面,,經(jīng)導(dǎo)管主動(dòng)脈瓣置換術(shù)(TAVR)被證明優(yōu)于主動(dòng)脈瓣球囊成形術(shù)(一種姑息手術(shù))(圖2)。在療效類似的情況下,,低創(chuàng)手術(shù)是首選,,故隨后研究了TAVR手術(shù)在可耐受開胸手術(shù)的患者以及年輕患者中的療效。在手術(shù)死亡風(fēng)險(xiǎn)中等(預(yù)測風(fēng)險(xiǎn)4%~8%)的患者中,,PARTNER 2試驗(yàn)的主要復(fù)合終點(diǎn)(2年時(shí)死亡和致殘卒中的相對危險(xiǎn)度)的相對界值被預(yù)設(shè)為1.2,。研究得到的風(fēng)險(xiǎn)比為0.89,95%置信區(qū)間上限(1.09)低于1.2,,證明了非劣效性,。其實(shí),在可行股動(dòng)脈TAVR的預(yù)設(shè)患者亞組中,,TAVR優(yōu)于手術(shù),。類似地,在預(yù)測手術(shù)死亡率為3%~15%的患者人群中,,SURTAVI(外科置換術(shù)和經(jīng)導(dǎo)管主動(dòng)脈瓣植入術(shù),,Surgical Replacement and Transcatheter Aortic Valve Implantation,)試驗(yàn)顯示,,經(jīng)導(dǎo)管瓣膜置換術(shù)不劣于外科手術(shù),,其絕對危險(xiǎn)度差異為7個(gè)百分點(diǎn)(比手術(shù)的終點(diǎn)預(yù)期發(fā)生率14%低7個(gè)百分點(diǎn))。圖2. 經(jīng)導(dǎo)管主動(dòng)脈瓣的評估從優(yōu)效性試驗(yàn)推進(jìn)至非劣效性試驗(yàn)在手術(shù)風(fēng)險(xiǎn)較低的人群中已開展了一系列試驗(yàn)來比較TAVR與標(biāo)準(zhǔn)治療,。灰色區(qū)域顯示的是優(yōu)效性研究,,納入了有手術(shù)禁忌證的患者,。這些研究比較了TAVR與姑息治療后的結(jié)局,TAVR的死亡率較低,。黃色區(qū)域顯示的是非劣效性研究,,納入了手術(shù)風(fēng)險(xiǎn)低的患者。這些研究顯示TAVR與SAVR相比具有非劣效性,。這些試驗(yàn)比較的是兩種差異巨大的手術(shù),,因此已出現(xiàn)治療依從性不平衡和隨訪不平衡的問題,因?yàn)橐恍﹨⑴c者可能對一種治療有強(qiáng)烈偏好,,也因?yàn)闊o法設(shè)盲,。雖然研究人員通過知情同意來盡量減少這種不平衡,但并不能完全解決這一問題,。治療依從性達(dá)不到100%的情況下,,可能會使結(jié)果偏向于非劣效性,,因此對意向性治療隊(duì)列和實(shí)際治療隊(duì)列(僅包括接受了所分配治療的參與者)同時(shí)進(jìn)行分析非常重要。在PARTNER 2A試驗(yàn)中,,不依從隨機(jī)分配治療方案的患者比例在兩組之間相差4倍以上(SAVR組為7.5%,,TAVR組為1.7%),但意向性治療隊(duì)列和實(shí)際治療隊(duì)列的結(jié)果基本相似,,它們的置信區(qū)間上限都未超過1.2的非劣效性界值(意向性治療隊(duì)列的相對危險(xiǎn)度為0.92,;95% CI,0.77~1.09,;非劣效性P=0.001,;實(shí)際治療隊(duì)列的相對危險(xiǎn)度為0.90;95% CI,,0.75~1.08,;非劣效性P<0.001)。類似地,,在SURTAVI試驗(yàn)中,,改良意向性治療分析(排除了未嘗試所分配治療的患者)被作為主要分析,其結(jié)果與意向性治療分析類似,。在這種情況下,,缺失數(shù)據(jù)處理方式也很重要。因?yàn)槿绻诜治鲋信懦唇邮芩峙渲委煹幕颊?,可能?dǎo)致各組的患者特征不平衡,,因此通過填補(bǔ)數(shù)據(jù)的方式進(jìn)行完全意向性治療分析是避免偏倚的另一個(gè)重要方法。20世紀(jì)70年代進(jìn)行的隨機(jī)試驗(yàn)證明,,在冠狀動(dòng)脈左主干病變患者中,,通過冠狀動(dòng)脈旁路移植術(shù)(CABG)實(shí)施血運(yùn)重建優(yōu)于藥物治療,手術(shù)患者的中位生存期較藥物治療患者延長了約7年,。而PCI在冠狀動(dòng)脈左主干病變的治療中也變得更加安全和普遍,。在比較CABG和PCI重建冠狀動(dòng)脈左主干血運(yùn)的隨機(jī)試驗(yàn)中,亞組分析顯示PCI組的心臟主要不良事件沒有顯著增加,,恢復(fù)時(shí)間較短,,圍手術(shù)期卒中風(fēng)險(xiǎn)可能較低?;诖?,臨床上放寬了PCI的適應(yīng)證。EXCEL(評估依維莫司洗脫支架和冠狀動(dòng)脈旁路術(shù)對左主干冠狀動(dòng)脈血運(yùn)重建的有效性,,Evaluation of XIENCE versus Coronary Artery Bypass Surgery for Effectiveness of Left Main Revascularization)是專門比較PCI和CABG治療左主干狹窄的非劣效性試驗(yàn),。主要終點(diǎn)為死亡、卒中或心肌梗死構(gòu)成的復(fù)合終點(diǎn)。結(jié)果顯示在中位隨訪3年時(shí),,PCI具有非劣效性,。NOBLE(北歐-波羅的海-英國左主干血運(yùn)重建Nordic-Baltic-British Left Main Revascularization)試驗(yàn)也是一項(xiàng)非劣效性試驗(yàn),旨在比較PCI和CABG治療左主干病變,,復(fù)合終點(diǎn)為術(shù)后5年時(shí)死亡,、卒中、心肌梗死或血運(yùn)重建,。研究人員未得出PCI具有非劣效性的結(jié)論,,而是得出了CABG具有優(yōu)效性的結(jié)論。在EXCEL試驗(yàn)中,,術(shù)后1個(gè)月時(shí),,PCI患者的圍手術(shù)期心肌梗死發(fā)生率較低,因而復(fù)合主要終點(diǎn)發(fā)生率低于CABG患者,。然而,,術(shù)后3年時(shí),PCI患者的自發(fā)性心肌梗死發(fā)生率高于CABG患者(圖3),。盡管如此,,由于兩間3年時(shí)的主要終點(diǎn)總發(fā)生率并無顯著差異,且并未超過預(yù)設(shè)界值,,因此研究人員得出了PCI具有非劣效性的結(jié)論,。在NOBLE試驗(yàn)中,由于PCI組中非手術(shù)相關(guān)心肌梗死和血運(yùn)重建這兩個(gè)終點(diǎn)的發(fā)生率較高,,因此隨訪5年時(shí),,PCI的主要終點(diǎn)發(fā)生率高于CABG(29% vs. 19%);PCI不符合非劣效性標(biāo)準(zhǔn),,因此研究人員得出CABG具有優(yōu)效性的結(jié)論,。NOBLE試驗(yàn)的隨訪期更長,終點(diǎn)涵蓋范圍更大,,這使其與EXCEL試驗(yàn)的結(jié)論存在差異,。因此,復(fù)合臨床結(jié)局的構(gòu)成部分和結(jié)局評估時(shí)機(jī)對于結(jié)果解讀和向患者解釋預(yù)期療效具有重要意義,。圖3. 冠狀動(dòng)脈左主干血運(yùn)重建的非劣效性試驗(yàn)中,,結(jié)局評估時(shí)機(jī)和終點(diǎn)構(gòu)成部分的影響 比較PCI與CABG的兩項(xiàng)試驗(yàn)得出了不同結(jié)論,。在EXCEL試驗(yàn)中,,次要復(fù)合終點(diǎn)為30日時(shí)的死亡、卒中或心肌梗死,,主要復(fù)合終點(diǎn)為3年時(shí)的死亡,、卒中或心肌梗死。組間絕對差異的非劣效性界值在30日和3年時(shí)分別為2.0個(gè)百分點(diǎn)和4.2個(gè)百分點(diǎn),大致相當(dāng)于組間相對差異界值為1.67和1.38,。在NOBLE試驗(yàn)中,,復(fù)合主要終點(diǎn)是全因死亡、非手術(shù)相關(guān)心肌梗死,、冠狀動(dòng)脈血運(yùn)重建或卒中,。雖然兩項(xiàng)試驗(yàn)的非劣效性界值大致相似,但EXCEL的結(jié)果得出PCI在30日時(shí)優(yōu)于CABG,、在3年時(shí)不劣于CABG的結(jié)論,。而NOBLE,基于更長的隨訪時(shí)間和涵蓋范圍更大的主要終點(diǎn),,得出CABG在5年時(shí)具有優(yōu)效性的結(jié)論,。 非劣效性研究設(shè)計(jì)越來越多地用于評估新療法的安全性。評估安全性的非劣效性研究設(shè)計(jì)面臨一個(gè)特殊挑戰(zhàn),,即通常并無支持安全性界值的合理數(shù)據(jù),。取而代之的是,臨床顧問必須決定什么水平的不良事件是可以接受的,。該水平可能會因事件嚴(yán)重程度,、患者群體絕對風(fēng)險(xiǎn)以及治療預(yù)期獲益不同而有所不同。在PRECISION(塞來昔布相對于布洛芬或萘普生的安全性前瞻性隨機(jī)評估Prospective Randomized Evaluation of Celecoxib Integrated Safety versus Ibuprofen or Naproxen)中,,研究者評估了塞來昔布與萘普生相比,,在治療關(guān)節(jié)炎方面的非劣效性,根據(jù)主要復(fù)合終點(diǎn)(心血管原因[包括出血]所致死亡,、非致死性心肌梗死或非致死性卒中)的預(yù)期年度風(fēng)險(xiǎn)2%,,選擇了1.33作為安全性的相對界值。雖然這是一項(xiàng)包含三組的試驗(yàn),,但第三組不接受安慰劑而是接受布洛芬治療,,作為塞來昔布的第二項(xiàng)非劣效性比較。在10年研究期間,,停藥率接近80%,,表明藥物試驗(yàn)易出現(xiàn)依從性達(dá)不到100%的情況。然而,,無論在主要的意向性治療分析中,,還是在次要的實(shí)際治療分析中,塞來昔布均不劣于萘普生和布洛芬,。當(dāng)研究人群心血管結(jié)局的實(shí)際風(fēng)險(xiǎn)為預(yù)期風(fēng)險(xiǎn)的一半時(shí),,出現(xiàn)了另外一個(gè)挑戰(zhàn)。盡管使用相對非劣效性界值可以保持該低危人群的非劣效性檢驗(yàn)效度,,但數(shù)據(jù)和安全性監(jiān)查委員會發(fā)現(xiàn),,在對事件總發(fā)生率所做的檢驗(yàn)中,該研究功效不足,因此樣本量從計(jì)劃招募約20,000名參與者增加到最終納入24,081名參與者,。最后,,因?yàn)樵诩{入慢性疼痛患者的研究中不應(yīng)設(shè)置安慰劑對照,所以PRECISION試驗(yàn)并未證明其中任何藥物的心血管風(fēng)險(xiǎn)未增加(即藥物不劣于安慰劑),。簡化試驗(yàn)實(shí)施過程(減少與參與者的聯(lián)系次數(shù)和評估的結(jié)局?jǐn)?shù)量)能夠更可靠地確認(rèn)較大樣本量,,并且可能減少由缺失數(shù)據(jù)引入的偏倚,從而有利于優(yōu)效性和非劣效性試驗(yàn),。然而在從日常臨床治療獲得隨訪數(shù)據(jù)的實(shí)效性臨床試驗(yàn)中,,可能存在治療依從性不平衡或終點(diǎn)事件確認(rèn)不精確的問題,這些問題在非劣效性研究中應(yīng)特別關(guān)注,?;颊邽樵囼?yàn)設(shè)計(jì)提供的信息對于非劣效性試驗(yàn)可能特別有價(jià)值。鑒于臨床實(shí)踐中共同決策的重要性,,我們認(rèn)為,,基于預(yù)期獲益和風(fēng)險(xiǎn)預(yù)設(shè)可接受的界值時(shí)以及應(yīng)用研究結(jié)果時(shí),應(yīng)考慮患者偏好,。最后,,非劣效性研究可用于比較效果或醫(yī)療服務(wù)。在以價(jià)值取向?yàn)榛A(chǔ)的醫(yī)療框架中,,將非劣效性研究設(shè)計(jì)中的治療結(jié)局評價(jià)與費(fèi)用區(qū)分開來,,可更好地保證在確保效率的前提下,臨床結(jié)局仍可接受或更好,。除了隨機(jī)研究,,觀察性數(shù)據(jù)分析和薈萃分析也可包括非劣效性假設(shè)檢驗(yàn),假設(shè)和非劣效性界值提高了這些研究的效度,。對于非劣效性試驗(yàn),,試驗(yàn)報(bào)告統(tǒng)一標(biāo)準(zhǔn)(Consolidated Standards of Reporting Trials,CONSORT)小組,、FDA和歐洲藥品管理局已提出非劣效性試驗(yàn)的具體標(biāo)準(zhǔn)(表2),。此外,我們建議對以下各項(xiàng)多加注意,。表2. 非劣效性試驗(yàn)的設(shè)計(jì),、報(bào)告和解讀建議* CONSORT表示試驗(yàn)報(bào)告統(tǒng)一標(biāo)準(zhǔn)。第一,,非劣效性試驗(yàn)應(yīng)為界值(基于測量或預(yù)期的試驗(yàn)治療獲益)提供明確理由,。不應(yīng)單純依靠研究者經(jīng)驗(yàn)或醫(yī)生群體期望來確定界值,一些可供考慮的方法包括借助決策分析(人口或政策觀點(diǎn))或患者問卷,,患者問卷旨在評估非劣效性界值和預(yù)期獲益的平衡程度,。第二,我們建議謹(jǐn)慎使用復(fù)合終點(diǎn),,因?yàn)槠渲械臉?gòu)成部分可能包含相互沖突的風(fēng)險(xiǎn)與獲益,。最后,盡管盡量避免缺失數(shù)據(jù)是一個(gè)重要目標(biāo),,但在非劣效性試驗(yàn)的設(shè)計(jì)和分析過程中,,應(yīng)該重視旨在應(yīng)對數(shù)據(jù)缺失的敏感性分析(例如多重填補(bǔ)法)。非劣效性設(shè)計(jì)在臨床研究中的應(yīng)用日益廣泛,。雖然非劣效性研究在不同情境下的應(yīng)用帶來了新的挑戰(zhàn),,但保證研究效度這一基本原則應(yīng)該遵守。在合理設(shè)計(jì)和實(shí)施的情況下,,非劣效性試驗(yàn)可發(fā)現(xiàn)有臨床價(jià)值的替代性創(chuàng)新療法,。
參考文獻(xiàn) Mauri L, D'Agostino RB, Sr. Challenges in the design and interpretation of noninferiority trials. N Engl J Med 2017;377:1357-1367.
|