圖1:假設總體剩餘部分的SMR為1,估計最大隱藏子集SMR與總體SMR和子集比例。
全文
陶旭光(格蘭特)*
美國巴爾的摩市約翰霍普金斯醫學院醫學係職業與環境醫學部*通訊作者:陶旭光(Grant),美國約翰霍普金斯大學醫學院醫學係職業與環境醫學研究室,E-mail: xtao1@jhmi.edu
本文提出了一種簡單的篩查方法,在總體風險較低的人群子集中檢測可能隱藏的高風險。舉個例子,使用該方法,可以預測研究人群子集中某種疾病的未知標準死亡率(SMR)及其置信區間,前提是該子集和該疾病在研究人群中的SMR的比例。為估計的SMR計算的置信區間可用於判斷子集中可能存在的風險是否在所需的顯著性水平上具有統計可檢測性。該方法可能是一種有用的工具,可以表明統計上可檢測到的疾病高風險是否隱藏在無風險或低風險人群的子集中,需要進一步研究。
健康工人效應;方法;,階梯短環到超級扁環相對風險;風險篩查
標準死亡率(SMR)分析在職業流行病學隊列研究中非常流行,其中觀察到的死亡人數與基於美國普通人群死亡率[1]的預期死亡人數進行比較。它的優點之一是,在計算SMR時隻需要彙總信息,如疾病的總死亡人數和人口的總體年齡分布。換句話說,個人層麵的信息是不必要的,盡管有時他們的數據也是可用的。在對總體風險較低的研究人群進行SMR分析後,有一個經常被問到的問題。是否有可能在研究人群中存在一個高風險子集,僅僅是因為當將所有研究人群集中在一起時,子集中的高風險被稀釋了,或者因為所謂的健康工作者效應?我們是否會漏掉在研究人群中暴露於危險物質的子集中出現的任何風險在我們可能遺漏的子集中最大風險是多少?如果我們在期望的顯著性水平上對該子集進行進一步研究,風險在統計上是否可檢測到?為了回答這些問題,人們通常需要收集更多關於子集甚至個人水平的暴露信息,可以使用泊鬆回歸或考克斯比例風險模型進行內部比較。然而,在調查人員繼續收集更多信息並進行進一步分析之前,是否有辦法進行可行性篩選測試,以根據有限的數據預測子集中的最大風險,並且這種風險在統計上是否可檢測到?為了做到這一點,本文提出了一種簡單的篩查方法,這可能有助於研究人員係統地決定是否需要進一步的研究,即使在整個研究人群中沒有明顯的疾病風險。 An example will be given to show the application of the method used based on a published paper [2].
這種篩選方法包括兩項任務。第一個任務是預測最大的隱藏風險,第二個任務是估計該風險的置信區間。
一般概念
如果已知研究人群患某種疾病的風險較低,那麼研究人群中某個亞群的疾病風險將由該亞群在研究人群中的比例和其餘研究人群的風險決定。子集的最大隱藏風險可以通過假設其餘人群的風險為零風險水平來估計。如果估計的95%置信區間的隱藏下界高於1,則表明即使在整個研究人群中沒有發現顯著的風險,但在子集中可能隱藏著可檢測的風險。
假設
在與外部標準相比,風險沒有顯著升高的人群中識別潛在高風險亞群的程序依賴於以下假設:1)所選亞群之外的其餘人群假設沒有超額風險,這意味著相對風險等於1或標準死亡率(SMR)等於100%。如果健康工作者效應被認為是一個問題,則假定一種疾病對其餘人群的SMR與整個研究人群中所有死亡原因的SMR相等。通過假設所有死因的死亡率為原因特定相對風險的空值來糾正健康工人效應是一種被廣泛接受的做法[3-7]。2)為簡化方法介紹,假設年齡等混雜因素在子集和總體中是均勻分布的。3)利益原因引起的死亡假設遵循泊鬆分布,這是一個被廣泛接受的假設[8]。
為了獲得子集的估計SMR,我們需要獲得疾病的估計病例數和疾病的預期病例數。根據假設,下列公式成立:
$ $ {{\ rm {E}} _ {{\ rm{子集}}}}{\ rm { = }}\,{\ rm {p}} {\ rm{。}} \, {{\ rm {E}} _ {{\ rm{總}}}}{\ rm { }}..............\左(1 \右){\rm{}}$$
$ $ {{\ rm {E}} _ {{\ rm {nonsubset}}}} {\ rm{=}} \ \離開({1 - p} \右){\ rm {}} {\ rm{。}}\,{{\ rm {E}} _ {{\ rm{總}}}}$ $
$${\rm{E}}_{{\rm{total}}}}\,{\rm{= p}}\,{\rm{。}} {{\ rm {E}} _ {{\ rm{總}}}}\,rm結構為{+}}{\ \離開({1 - p} \) \, {\ rm{。}} {{\ rm {E}} _ {{\ rm{總}}}}$ $
$ $ {{\ rm {N}} _ {{\ rm{子集}}}}\,{\ rm {=}} {{\ rm {N}} _ {{\ rm{總數 }}}}\, - {\ rm {SM}} {{\ rm {R}} _ {{\ rm {nonsubset}}}} \, {\ rm{。}} {{\ rm {E}} _ {{\ rm {nonsubset}}}} $ $
$ $ {{\ rm {N}} _ {{\ rm{子集}}}}\,{\ rm {=}} {{\ rm {N}} _ {{\ rm{總}}}}\,{\ rm { - }}\,{\ rm {SM}} {{\ rm {R}} _ {{\ rm {nonsubset}}}} \, {\ rm{。}}\左({1 - p} \右)\,{\rm{。}} \, {\ rm {}} {{\ rm {E}} _ {{\ rm{總}}}}{\ rm { }}...........\左(2 \右)$$
$ $ {\ rm {SM}} {{\ rm {R}} _ {{\ rm{子集}}}}\,{\ rm {=}} {{\ rm {N}} _ {{\ rm{子集}}}}\,{\ rm {/}} {{\ rm {E}} _ {{\ rm{子集}}}}{\ rm { }}.........{\ rm {(3)}} $ $
在那裏,
E子集:亞群人群某一疾病的預期病例數
P:子集占整個人口的比例
Etotal:某一疾病在整個人群中的預期病例數
Enonsubset:非亞群人群某一疾病的預期病例數
N子集:該子集中某種疾病的估計病例數
N總計:在整個人口中觀察到的某種疾病病例數
SMRnonsubset:一種疾病在該子集以外的其餘人群中的SMR
SMR子集:該亞群疾病的估計SMR
公式(1)將用於計算子集人群中某一疾病的預期病例數,公式(2)將用於計算子集人群中某一疾病的估計最大病例數。因為p是整個總體子集的比例,而E總計,一種疾病在整個人群中的預期病例數是已知的,E子集時,公式1中某一疾病子集的預期病例數可輕鬆求解。式(2)中,E總計,整個人群中某一疾病數量的預期病例數N總計,即在整個人群中觀察到的某種疾病的病例數,以及p,即整個人群亞群的比例,都是已知的。唯一未知的項目是smrnon子集,一種疾病的SMR對子集以外的其餘人群。基於假設(1),假設子集以外的其餘人群的疾病風險為零水平。如果健康工作者效應被認為是一個問題,則假設整個研究人群中所有死因的SMR為零水平。有了這個假設,N子集,可計算該子集中某種疾病的估計病例數。鼻中隔黏膜下切除術後最後,子集,該亞群中某一疾病的估計SMR可由式(3)計算。
圖1顯示了給定疾病對總人口的觀察到的SMR (SMR),子集中的最大SMR總計),子集的比例(p),並假設剩餘總體的SMR (SMRnonsubset)等於1。例如,與外部比較相比,當總體的SMR為1.3時,占總數14%的子集的SMR可以高達3,而其餘總體的SMR為1,如圖1所示。
表1:估計最大子集smr和示例數據的95%置信區間* *總體的示例數據來自[1],
用公式(1)計算子集的估計病例數。用公式(2)計算子集的預期病例數子集由式(3)計算,子集的smr的95%置信區間由式(4)計算。
Breslow和Day提出了一種基於泊鬆假設的方法來計算SMR[9]的95%置信區間(95% CI),式(4)和式(5),如果病例數大於50,也可以用式(6)計算SMR的95% CI
在那裏,
SMRl:亞群中某一疾病的SMR下界;
SMRu:亞群中某一疾病SMR的上邊界;
SMR:亞群中疾病的SMR;
Z:正態分布的Z值;
α: 95% CI 0.05為顯著性水平;
醫生:預期病例數。
一個例子
以下數據來自一項已發表的職業人群[2]隊列研究。這裏的例子包括預期死亡人數不同的九種疾病及其smr風險。5種疾病的smr高於1,7種疾病(包括所有死因)的smr低於1。與美國普通人群相比,沒有一個smr顯著高於1。問題是,“我們是否會在一小部分工人中遺漏任何風險?”例如,約14%的研究人群暴露於某種工業工藝,“其他化學製漿”,除硫酸鹽和亞硫酸鹽製漿外的化學製漿。實際上,這個子集可以用任何定義來定義,例如一組暴露於某種產品、工作區域或一組化學物質的工人。根據目前的數據,我們能否找出14%的人口子集中是否存在潛在的風險?子集中可能隱藏的最大smr及其置信區間是使用所提出的方法計算的,假設其餘人群中的風險空值等於所有死亡原因,0.74,如表1所示。結果顯示,一個子集,即研究人群的14%,可能對所有腫瘤(SMR: 1.31, 95% CI: 1.17, 1.47)、肺癌(SMR: 1.24, 95% CI: 1.02, 1.50)、前列腺癌(SMR: 2.31, 95% CI: 1.40, 3.78)、腎癌(SMR: 2.81, 95% CI: 1.19, 6.30)和白血病(SMR: 2.24, 95% CI: 1.09, 4.47), if internal comparisons are used in the further analysis, since the all cause of death for the entire study population is assumed as a null risk value in the calculations. The risks in a subset of 14% of the population for stomach cancer, testis cancer, brain cancer, lymphosarcoma, and Hodgkin’s disease, would not be statistically detectable.
所提出的分析方法簡單直接。這些方法將有助於研究人員決定是否需要進一步研究,並可能在人群中疾病的總體風險不顯著高的情況下,在一個子集中發現重大風險。與其僅僅在全隊列研究的基礎上放棄調查,不如使用“鳥槍”方法在人群中篩選子集進行調查可能會有所幫助。
在Matanoski博士的論文[2]中,使用內部比較組,使用泊鬆回歸分析暴露於不同製漿工藝的工人組的風險。在表1中采用篩選方法預測亞群中可能存在統計學可檢測風險的疾病中,根據上一篇論文[2]的泊鬆回歸結果,“其他化學製漿”工藝的腫瘤相對風險為1.14 (95% CI: 1.04-1.26),“硫酸鹽”工藝的肺癌相對風險為1.35 (95% CI: 1.04, 1.75),與預測水平非常吻合。在亞組中被預測沒有統計上可檢測到的風險的疾病組中,除腦癌外,沒有一組在泊鬆回歸分析中顯示出任何顯著的風險。使用該方法,表1中預測的腦癌的最大SMR為2.17 (95% CI: 0.96, 4.67),盡管不顯著。95% CI的下限實際上接近於1。泊鬆回歸結果顯示,與“其他化學製漿”的相對風險為2.33 (95% CI: 1.38, 3.93)。這種差異可能是由於違反了其中一個假設造成的。例如,其餘人群的風險可能低於假設的空值。
如果健康工人效應存在,則假定某種疾病對除計算中的子集以外的其餘人口的零風險值等於所有死亡原因的風險。健康工人效應是指由於各種選擇偏差和工作對健康的有益影響,與一般人口相比,工人的死亡率有所下降。選擇偏差的來源可能來自雇主對健康個體的選擇或自我選擇,以及由於繼續雇用健康個體而導致的不完全隨訪,以及那些患病的人離職的傾向[1,10,11]。工作對健康的有益影響可能來自體力消耗和獲得更好醫療服務的能力等等。健康工人效應在職業流行病學研究中非常常見,與一般人群[10]相比,這些研究往往使工業工作人群的相對死亡風險比零值低約10-30%。在工業工作人口中,疾病的相對風險是工業危害(如果存在的話)的上升影響和健康工人效應的下降影響的綜合結果。由於總體相對風險遠低於一般人群,工業危害的真正上行影響可能會被健康工人效應的下行影響所抵消。本文提出的方法允許用戶通過假設剩餘人群的相關疾病的相對風險的零值等於平均的所有死因來修正健康工人效應,因為這是一種被廣泛接受的修正健康工人效應的做法[3-7]。
- Monson RR(1981)對健康工人效應的觀察。《醫學雜誌》28:425-433。[Ref。]
- 馬塔諾斯基GM, Kanchanaraksa S, Lees PS,陶曉國,Royall R等(1998)紙漿和造紙廠工人死亡率的全行業研究。美國醫學雜誌33:354-65。[Ref。]
- Stewart W, Hunting K(1988)死亡率優勢比,比例死亡率,和健康工人效應。美國醫學雜誌14:45 -353。[Ref。]
- Park AM, Maizlish NA, Punnett L, Moure-Eraso R, Silverstein MA(1991)職業死亡率的pmr和SMRs估計量的比較。流行病學2:49-59。[Ref。]
- Wong O,去斐P(1982)職業研究中涉及標準化死亡率和比例死亡率的方法學問題。J occupation Med 24: 299-304。[Ref。]
- Wong O, Morgan RW, Kheifets L, Karson SR(1985)可能暴露於柴油尾氣排放的工會成員的SMR, PMR和PCMR的比較。中華醫學雜誌42:449-460。[Ref。]
- Kupper LL, McMichael AJ, Symons MJ, Most BM(1978)關於比例死亡率分析的效用。紀年卷31:15-22。[Ref。]
- Beaumont JJ, Breslow NE(1981)氯乙烯工人流行病學研究中的權力考慮。美國流行病學雜誌114:725-34。[Ref。]
- Breslow NE, Day NE(1987)癌症研究統計方法中的率和率標準化。第二卷:隊列研究的設計和分析。Ed. Breslow NE和Day NE, IARC,裏昂。[Ref。]
- Choi BCK(1992)健康工作者效應的定義、來源、量級、效應修正因子和減少策略。J占用醫學34:979-988。[Ref。]
- Arrighi HM, Hertz-Piccotto I(1994)衛生工作者幸存者效應概念的演變。流行病學5:189-196。[Ref。]
- Carpenter LM(1987)對健康工人效應的一些觀察。中華流行病學雜誌44:289-291。[Ref。]
- Fox AJ, Collier PF(1976)工業隊列研究中的低死亡率是由於對工作和生存的選擇。Br預防與社會醫學30:225-230。[Ref。]
- McMichael AJ(1976)標準化死亡率和“衛生工作者效應”:在表麵下抓抓。中華醫學雜誌18:165-168。[Ref。]
下載臨時PDF
文章類型:研究文章
引用:陶x(2016)低風險人群子集中隱藏風險的快速估計方法。J流行病學公共衛生Rev 1(2): doi http://dx.doi.org/10.16966/2471-8211.108
版權:©2016 Tao X這是一篇開放獲取的文章,根據創作共用署名許可協議的條款發布,允許在任何媒介上不受限製地使用、分發和複製,前提是注明原作者和來源。
出版的曆史: