目錄
RR(Relative Risk) - 相對(duì)危險(xiǎn)度
HR(Hazard Ratio) - 風(fēng)險(xiǎn)比
我們以病因?qū)W研究為例,,先談?wù)?OR 與 RR 的區(qū)別,因?yàn)檫@兩個(gè)指標(biāo)均可以從四格表中衍生出來(lái),。我們先來(lái)看看兩個(gè)關(guān)于吸煙與肺癌的例子:
RR(Relative Risk) - 相對(duì)危險(xiǎn)度
RR(Relative Risk) - 相對(duì)危險(xiǎn)度,是指 2 個(gè)人群發(fā)病率的比值,,通常為暴露人群的發(fā)病率和非暴露人群的發(fā)病率之比。RR 的計(jì)算公式是[RR=暴露組的發(fā)病或 死亡率/非暴露組的發(fā)病或死亡率],。
例1:為明確吸煙與肺癌的關(guān)系,,某研究者在 1985 年隨機(jī)調(diào)查了某社區(qū)的 10000 名居民,,并每年對(duì)其進(jìn)行隨訪,以觀察其肺癌的發(fā)生狀況在剛剛進(jìn)行調(diào)查的時(shí)候,,他就發(fā)現(xiàn)這 10000 個(gè)居民中有 3000 人吸煙,7000 人不吸煙,。在本例中,我們假定吸煙和不吸煙居民之間不存在交叉污染,,即吸煙的 3000 人永遠(yuǎn)不會(huì)戒煙,而不吸煙的 7000人 也永遠(yuǎn)不會(huì)吸煙。且這 10000 個(gè)人不會(huì)失訪,。隨訪 30 年后,吸煙的 3000 人中有 300 人得了肺癌,。相比之下,,不吸煙的 7000 人中僅有 70 人患肺癌。如表1所示:
暴露因素 | 肺癌 | 非肺癌 |
吸煙(3000) | a(300) | b(2700) |
不吸煙(7000) | c(70) | d(6930) |
在本案例中,吸煙人群 30 年內(nèi)發(fā)生肺癌的比例為 0.10(300/3000),,而不吸煙人群發(fā)生肺癌的比例為 0.01(70/7000)。因此,,與非吸煙人群相比,,吸煙人群發(fā)生肺癌的相對(duì)危險(xiǎn)度(RR)為:0.10/0.01=10,,即可以認(rèn)為吸煙人群 30 年內(nèi)發(fā)生肺癌的風(fēng)險(xiǎn)是非吸煙人群的 10 倍。
RR 在四格表中的計(jì)算公式就是:RR=(a/(a+b))/(c/(c+d)),。
OR(Odd Ratio) - 比值比
OR(Odd Ratio) - 比值比,用于反映病例與對(duì)照在暴露上的差異,,從而建立疾病與暴露因素之間的聯(lián)系。通常為病例組中暴露人數(shù)與非暴露人數(shù)的比值除以對(duì)照組中暴露人數(shù)與非暴露人數(shù)的比值,。OR 的計(jì)算公式是[OR=(病例組暴露人數(shù) / 非暴露人數(shù))/(對(duì)照組暴露人數(shù)/非暴露人數(shù))]。
例2:某醫(yī)生懷疑吸煙與肺癌有關(guān),,因?yàn)樗l(fā)現(xiàn)自己經(jīng)手的很多肺癌患者都有吸煙史,。于是他在 2015 年找了 100 名肺癌患者和 100 名健康對(duì)照,,回溯了他們的過(guò)去 30 年的吸煙史,,結(jié)果發(fā)現(xiàn):100 名肺癌患者中 90 名患者有吸煙史,,100 名健康個(gè)體中僅有20人有吸煙史。如表2所示:
表2
患病 | 吸煙 | 不吸煙 |
肺癌(100) | a(90) | b(10) |
健康人(100) | c(20) | d(80) |
在本案例中,,肺癌組暴露人數(shù)與非暴露人數(shù)的比值為 9(90/10),而在健康個(gè)體中,,暴露人數(shù)與非暴露人數(shù)的比值為 0.25(20/80),。因此,OR 為:9/0.25=36,。
格表中的計(jì)算公式為:OR=ad/bc。
按理說(shuō) RR 的臨床解釋最為清晰,,說(shuō)得通俗點(diǎn)就是:吸煙個(gè)體發(fā)生肺癌的風(fēng)險(xiǎn)是非吸煙個(gè)體的多少倍。相比之下,,OR 的臨床解釋則要復(fù)雜得多,。為何表1用 RR 來(lái)描述吸煙與肺癌的關(guān)聯(lián)強(qiáng)度,,表2則要用 OR 來(lái)描述呢,?按理說(shuō),只要是四格表,,都可以計(jì)算 RR,,為什么流行病學(xué)家還搞個(gè) OR 在這里呢?的確,,所有的四格表都可以計(jì)算 RR,,比如我們將表2調(diào)整為如表1格式,當(dāng)然也可以計(jì)算 RR:
RR 的計(jì)算過(guò)程為:吸煙人群中有 110 名個(gè)體吸煙,,90 例發(fā)生了肺癌,,肺癌發(fā)生風(fēng)險(xiǎn)約為 0.82(90/110);不吸煙的 90 名個(gè)體中,,僅有 10 人發(fā)生肺癌,,因此肺癌的發(fā)生風(fēng)險(xiǎn)是 0.11(10/90)。因此與不吸煙的個(gè)體相比,,吸煙個(gè)體發(fā)生肺癌的風(fēng)險(xiǎn)約為 7.45 倍(0.82/0.11)。
然而,,表2絕對(duì)不能轉(zhuǎn)化成表1的格式,,這是有研究的性質(zhì)決定的,表1的數(shù)據(jù)來(lái)源于隊(duì)列研究,,表2的數(shù)據(jù)來(lái)源于病例對(duì)照研究,。
隊(duì)列研究和病例對(duì)照研究有很大的區(qū)別,這些區(qū)別概括起來(lái)就是:隊(duì)列研究是前瞻性研究,,是由因索果的研究,;病例對(duì)照研究是回顧性研究,是由果索因的研究。前瞻性研究最大的優(yōu)勢(shì)在于:“真實(shí)世界”尚未發(fā)生,,因?yàn)檠芯空呖梢栽敱M地描述“真實(shí)世界”,,體現(xiàn)在:抽取的 10000 名研究對(duì)象實(shí)際上就是來(lái)自于“真實(shí)世界”的,因?yàn)檠芯空呤菑钠胀ㄈ巳褐须S機(jī)抽取研究對(duì)象的,;研究對(duì)象中吸煙個(gè)體的比例為 0.30,,也是反映了真實(shí)情況,即現(xiàn)實(shí)生活中,,吸煙個(gè)體的比例就是 0.30,;隨訪 30 年后,總共有 370 人發(fā)生了肺癌(患病率為 3.7%),,這一患病率也是來(lái)源于真實(shí)世界的結(jié)論,。由于其得出的 RR 值是來(lái)自于真實(shí)世界的,因此具有“外推性”,,或者說(shuō)“泛化性”,可以直接地告訴人們吸煙的患者發(fā)生肺癌的風(fēng)險(xiǎn)是不吸煙患者的多少倍,。
相比之下,,病例對(duì)照研究就沒(méi)有那么簡(jiǎn)單了,因?yàn)椴±龑?duì)照研究是先知道結(jié)局,,再去回溯原因,,此時(shí),“真實(shí)世界”已經(jīng)一去不復(fù)返了,,哪里還能完整地回溯回來(lái),?研究者募集了 100 名肺癌患者和 100 名健康個(gè)體,,實(shí)際上就是假定了肺癌的患病率為 0.50,這一數(shù)字顯然不是來(lái)自于真實(shí)世界,。在真實(shí)世界中,過(guò)去 30 年肺癌的發(fā)生了是多少呢,?沒(méi)有人會(huì)知道這個(gè)精確的數(shù)字。因此,,如果強(qiáng)行用 RR 來(lái)展示病例對(duì)照研究結(jié)果的話,,沒(méi)有多大的臨床價(jià)值,,因?yàn)檫@個(gè) RR 不是來(lái)自真實(shí)世界的,不具備“外推性”,。流行病學(xué)家不得已,才在這里提出了一個(gè) OR 的概念,,用于反映暴露因素與結(jié)局事件的關(guān)聯(lián)強(qiáng)度。如前所述,,OR 這個(gè)指標(biāo)在四格表中的計(jì)算公式:OR=ad/bc,實(shí)際上也可以表示為(a/b)/(c/d),。理論上講,,不管實(shí)驗(yàn)組樣本為多少例,,a/b 是不變的(當(dāng)然可能會(huì)有一些小的波動(dòng),但屬于抽樣誤差),;同理,不管對(duì)照組樣本量如何變化,,c/d 的比例也是固定的。因此,,OR 最大的優(yōu)勢(shì)的是不受實(shí)驗(yàn)組和對(duì)照組比例(或者說(shuō)患病率)的影響。這也就是為什么在病例對(duì)照研究中人們喜歡用 OR 來(lái)表示暴露因素與結(jié)局事件關(guān)聯(lián)強(qiáng)度的原因所在,。
我們不妨來(lái)做一個(gè)根本就不存在的假設(shè),。我們假設(shè)表1中的隊(duì)列研究的資料是完全存在的,,只是沒(méi)有發(fā)表。后來(lái),,有人用病例對(duì)照的研究思路來(lái)闡述吸煙與肺癌的關(guān)系。從表1我們得知,,過(guò)去三十年,這個(gè)社區(qū)總共發(fā)生了 370 例肺癌,,其中 300 個(gè)肺癌患者具有吸煙史,,70 個(gè)不具有吸煙史,。因此如果從中抽取 100 例肺癌的話,理論上說(shuō)就應(yīng)該是 81 個(gè)肺癌患者有吸煙史,,19 個(gè)肺癌患者沒(méi)有吸煙史。健康個(gè)體一共有 9630 個(gè),,其中 2700 個(gè)吸煙,6930 個(gè)不吸煙,,如果從這 9630 個(gè)健康個(gè)體中抽取 100 人的話,,就應(yīng)該有 28 個(gè)人吸煙,,72 個(gè)人不吸煙。于是可以得出下表(表3):
表3
患病 | 吸煙 | 非吸煙 |
肺癌(100) | a(81) | b(19) |
健康人(100) | c(28) | d(72) |
根據(jù)表3的內(nèi)容不難算出,,與非吸煙個(gè)體相比,吸煙患者發(fā)生肺癌的 RR 是 3.56(計(jì)算過(guò)程略),該 RR 值與表1的 RR 值(10)相距甚遠(yuǎn),。假定我們抽取的健康個(gè)體不是 100 人,而是 200 人,,則可以算出 RR 為 5.07(計(jì)算過(guò)程略),。
原因就在于在病例對(duì)照研究中,,肺癌的“患病率”是由研究者入組的患者數(shù)量決 定的。如果入組肺癌患者與健康個(gè)體的例數(shù)分別為 200 和 200,,則患病率為 50%, 如果分別為 100 和 300,,則患病率為 25%。那么真正的患病率是多少呢,,沒(méi)有人會(huì)知道,,因?yàn)檫@是過(guò)去的事情。 而反觀表 1,,由研究性質(zhì)可知該研究為隊(duì)列研究,是由因到果的研究,。1000 例患者中有 82 例發(fā)生肺癌,計(jì)算發(fā)病率為 8.2%,,吸煙與不吸煙者肺癌的發(fā)生率分別 為 80/(80+720)和 2/(2+198)。該研究中肺癌的發(fā)生是在隨訪過(guò)程中自然發(fā)生的,, 因此可以反映真實(shí)的發(fā)病率,由其得出的 RR 值便是可信的,。 所以在病例對(duì)照研究中,,無(wú)法計(jì)算 RR,,因此流行病學(xué)家提出了 OR 用于反映暴露因素與結(jié)局事件的關(guān)聯(lián)強(qiáng)度。而 OR 的優(yōu)勢(shì)也在于不受患病率(即病例組與對(duì)照 組的比值)的影響,,因此常用于在病例對(duì)照研究中替代 RR。 在對(duì)結(jié)果的解釋上,,RR 或 OR 是一致的。其值越大,,表明暴露的效應(yīng)越大,暴露與結(jié)局關(guān)聯(lián)的強(qiáng)度也就越大,。若 RR 或 OR=1,說(shuō)明暴露因素與疾病之間無(wú)關(guān)聯(lián),; 若>1,說(shuō)明暴露因素與疾病呈正相關(guān),;若<1,,說(shuō)明暴露因素與疾病呈負(fù)相關(guān)(保護(hù)因素),。
前述 OR 和 RR 都來(lái)源于四格表,即僅僅考慮了一個(gè)暴露因素(吸煙)與結(jié)局事件(肺癌)的關(guān)系,。而在現(xiàn)實(shí)中,,疾病的發(fā)生往往不是單一因素作用的結(jié)果,。比如:假定吸煙的人都不太喜歡吃水果,而水果攝入過(guò)少也可以導(dǎo)致肺癌,。因此很有可能出現(xiàn)一種極端的情況,其實(shí)吸煙與肺癌無(wú)關(guān),,我們之所以在隊(duì)列研究或病例對(duì)照研究中觀察到了吸煙與肺癌的關(guān)系,完全是“吃水果”作怪,。此時(shí),我們將“吃水果”稱為“混雜因素”,,即表示他們可能會(huì)干擾暴露因素與結(jié)局變量之間的關(guān)系,。為了排除混雜因素的干擾,,需要在統(tǒng)計(jì)學(xué)上做一些校正,比較常用的方法就是 Cox 風(fēng)險(xiǎn)比例模型和 logistic 回歸模型,。一說(shuō)到 Cox 風(fēng)險(xiǎn)比例模型和 logistic 回歸模型,估計(jì)很多讀者的腦海里馬上閃現(xiàn)兩個(gè)概念,,HR 和 OR,。沒(méi)錯(cuò),這里的 OR 和四格表里面的 OR 其實(shí)就是一個(gè)意思,,只是二者的計(jì)算方法不同。來(lái)自于 logistic 回歸的 OR 可以校正很多混雜因素,,因此是一個(gè)多因素校正的 OR,而來(lái)自于四格表的 OR 只考慮了單一因素,,因此可以簡(jiǎn)單理解為單因素分析的 OR,。在撰寫(xiě)論文的過(guò)程中,一般認(rèn)為多因素校正的 OR 更可靠,。實(shí)際上,如果把四格表的數(shù)據(jù)用單因素的 logistic 回歸方程計(jì)算,,得到的 OR 是一樣的,,有興趣的讀者可以自己算,。
HR(Hazard Ratio) - 風(fēng)險(xiǎn)比
搞清楚了 RR 和 OR,,再來(lái)看 HR。 HR(Hazard Ratio)即風(fēng)險(xiǎn)比,,主要用于生存分析。 HR 的解釋與 RR 相似,,即表示暴露組患病的概率為非暴露組的多少倍。區(qū)別在于 RR 只考慮結(jié)局是否發(fā)生,,而 HR 還考慮了結(jié)局發(fā)生的時(shí)間,,因此可以認(rèn)為 HR 是考慮了時(shí)間因素的RR,。
Cox 模型與 logistic 回歸有很多相似之處,都可以用于校正混雜因素,。根據(jù) Cox 模型可以計(jì)算出 HR 值,HR 值的解釋與 RR 幾乎一致,,即表示暴露組患病的概率為非暴露組的多少倍。但是與 logistic 回歸不同的是,,Cox 模型除了可以校正混雜因素外,還考慮了結(jié)局事件發(fā)生的時(shí)間,。因此,,HR 不能簡(jiǎn)單等同于 RR,,只能說(shuō) HR 是考慮了時(shí)間因素的 RR,。說(shuō)得這里,,估計(jì)部分讀者有點(diǎn)糊,啥叫“考慮了時(shí)間因素的 RR”,?我們不妨來(lái)做這樣一個(gè)假設(shè):在表1中(隊(duì)列研究)中,RR 為 10,,我們可以理解為:與不吸煙人群相比,吸煙人群在 30 年內(nèi)患肺癌的風(fēng)險(xiǎn)是不吸煙人群的10倍,。注意“30 年內(nèi)患肺癌的風(fēng)險(xiǎn)”,,這是一個(gè)很含糊的說(shuō)法:有人可能在隨訪開(kāi)始第二年就發(fā)生肺癌,,有人可能到隨訪快結(jié)束時(shí)(第三十年)才發(fā)生肺癌。如果構(gòu)建四格表,,這兩個(gè)肺癌是同等看待的,但實(shí)際上,,這兩種肺癌的“社會(huì)危害性”顯然是不能相提并論的!畢竟后者很有可能會(huì)多活二十多年,。因此,我們?cè)诳紤]結(jié)局事件是否發(fā)生的同時(shí),,往往還要考慮結(jié)局事件發(fā)生的時(shí)間,!這就是 HR 存在的價(jià)值,!
綜上所述,RR 主要用于隊(duì)列研究,,計(jì)算需要發(fā)病率,,表明暴露人群的發(fā)病風(fēng)險(xiǎn)是非暴露人 群的多少倍,;OR 主要用于回顧性研究,如病例對(duì)照研究和橫斷面研究,,不需要知道發(fā)病率,, 表明病例組中暴露人數(shù)與非暴露人數(shù)的比值除以對(duì)照組中暴露人數(shù)與非暴露人數(shù)的比值,; HR 主要用于隊(duì)列研究,是考慮了時(shí)間因素的 RR,。
總結(jié)一下本文,以研究疾病發(fā)生機(jī)制的研究為例來(lái)談?wù)?RR,,OR 和 HR 的區(qū)別,實(shí)際上,,研究疾病預(yù)后的研究也可以類推,。
- RR:主要用于隊(duì)列研究,,可以從四格表衍生出來(lái),表示暴露患者發(fā)生疾病的風(fēng)險(xiǎn)是非暴露患者的多少倍,。
- OR:主要用于病例對(duì)照研究和橫斷面研究,可以從四格表中衍生出來(lái),,也可以由logistic回歸計(jì)算得來(lái),表示病例組中暴露人數(shù)與非暴露人數(shù)的比值除以對(duì)照組中暴露人數(shù)與非暴露人數(shù)的比值,。
- HR:主要用于隊(duì)列研究,主要由 Cox 風(fēng)險(xiǎn)比例模型衍生出來(lái),,是考慮了時(shí)間因素的 RR。