流行病學與公共衛生評論

全文

評論文章
估算未測量作業中化學品濃度的方法

陶旭光(格蘭特)

美國巴爾的摩市約翰霍普金斯醫學院醫學係職業與環境醫學部

*通訊作者:陶旭光(Grant),美國約翰霍普金斯大學醫學院醫學係職業與環境醫學研究室,E-mail: xtao1@jhmi.edu


摘要

在職業流行病學研究中,估算未測量工作的化學品暴露是一個公認的問題。本文以苯乙烯暴露與缺血性心髒病的病例隊列研究為例,介紹了一種簡便的Z-score方法及其在按工作和工廠提供苯乙烯濃度估算中的應用。這種估算方法假設,在整個行業中,一種工作的相對暴露是相似的,因為與該工作相關的任務是相似的,但單個工廠在實際化學物質水平上可能有總體差異。某一特定工廠中未測量作業的暴露量可以根據該作業來自其他工廠的相對暴露量水平和同一工廠中測量作業的濃度分布參數來估計。該方法克服了現有未測作業濃度估計方法的一些缺點。

關鍵字

暴露評估;缺失值;職業;苯乙烯;z分數

簡介

在職業流行病學研究中,測量數據並不總是適用於所有工作。在職業數據中,在未測量工作時估算汙染物暴露是一個公認的問題。調查人員采用了以下方法來解決這個問題:1)一種常用的處理方法是要求工業衛生師根據他們的知識和經驗,給每個未測量的工作一個暴露估計類別或所謂的工業衛生師級別(IH級別)。暴露類別(高、中、低)或IH等級(從0到10)可作為風險分析中的相對暴露指標[1-4]。這種方法背後的假設是,在整個行業中,工作的相對曝光率是相似的,因為與工作相關的任務是相似的。該方法的優點是可以在分析中提供一個相對暴露指標。這種方法的一個問題是,如果研究人群中包括不同的植物,那麼它忽略了植物之間對同一工作的暴露濃度可能存在的巨大差異。排在第5位的工作實際上在一個工廠接觸到的化學物質可能比在其他工廠接觸到的相同工作更多。換句話說,在“肮髒”工廠中排名第5的工作,其實際濃度可能與在“清潔”工廠中排名第8的工作相似。基於該風險評估係統的風險分析可能存在分類錯誤的問題。 2) If measurement data are used, a common method is to use an average concentration of the pollutant at the same job from other plants as concentration estimation for the unmeasured job. This method also ignores the variations in exposures of the same job among different plants. Utilizing the exposure from other plants for an unmeasured job in a specific plant may also alter the relative orders of all jobs in terms of exposure levels within that plant, since the measurements from other plant could be systematically higher or lower than that in the particular plant. 3) Another method is proportional interpolation [5]. Exposure concentration at an unmeasured job in Plant A is estimated using the exposure concentration of the same job in Plant B multiplying the ratio of the mean concentrations of available measurements in Plant A versus Plant B. The advantage of this method is that it takes the variation of the mean exposure concentrations among different plants into account. The problem is that the distribution parameters of concentrations such as a standard deviation in Plant A are assumed the same as Plant B, which is not true in most circumstances. 4) Another method is deterministic modeling [6-8]. If the significant factors determining the level of exposure can be identified and assessed, a deterministic model can be used to calculate the exposure. The advantage of this method is that it can be used without measurement data. The problem is that the identification and the data collection of these significant determinants are difficult and the result is likely to be less reliable than a measurement based estimation.

本文描述了一種簡單的方法,Z-score法,用於苯乙烯暴露與缺血性心髒病[9]的病例隊列研究中,按工作和工廠提供未測量工作的苯乙烯和丁二烯濃度(百萬分之一)。該方法克服了現有的未測作業濃度估計方法的不足。

Z-score的基本概念

讓我們從一個簡單的例子開始。假設存在一個均值為0.5,標準差(SD)為0.2的分布,人們可以很容易地看出,在平均值以上1.5倍SD的點值為0.8。這個例子告訴我們什麼?首先,這個例子表明,分布中的任何點值都可以通過與平均值的差值或距離來表示,而這種差值可以通過分布的SD的比例來表示。這種由SD的一定比例所呈現的點值與平均值的差異被稱為“z分數”或“標準分數”[10,11]。換句話說,z分數是由分布的標準偏差規範化的分布的均值距離的度量。在上麵的例子中,1.5是在平均值為0.5,SD為0.2的分布中0.8點值的z分數。數學上的z分數點值可以通過使用公式a .其次這個例子也顯示,鑒於一個分布的均值和SD和z分數點值,我們可以很容易地判斷原始點值,使用公式B,這是一個反向的格式公式a。在上麵的例子中,例如,原始點值,0.8,可以很容易地計算給定的z分數為1.5,平均為0.5,0.2的SD。因此,隻要知道分布的均值和標準差,並且可以識別出點的相對位置,就可以在分布中填充一個未知的點值。

$ $ Z \ = \ {{X \ - \酒吧X} \ {SD }}..............\左(A \右)$$

$$ x \, = \, z \,。\,SD\, + \,\bar X..............\左(B \右)$$

在哪裏

Z:點濃度的Z-score;

X:點濃度值;

X:分布的均值;

SD:分布的標準差。

Z-score變換及其反向的數學是簡單直接的。然而,使這種方法獨特和更有趣的是Z-score分布的特征。如果一個分布的所有點值都轉換為Z-scores,那麼Z-scores的分布必然有一個恒定的均值為0,標準差為1[10,11]。換句話說,Z-score變換將具有不同均值和SDs的分布轉換為具有恒定均值為0和標準差為1的標準分布。更重要的是,盡管z分數、均值和SDs在正態分布中比在其他分布中更有意義,但對於使用z分數轉換來創建一個均值為零、標準差為1的標準化分布來說,原始分布的正態性是不必要的。Z-score轉換所做的隻是從每個點值中減去一個常數,然後將結果除以另一個常數,這樣點值的相對順序是一致的,但比例不同。這一特征的重要之處在於,由於Z-score分布總是具有恒定的平均值為0和標準偏差為1,並且點值的相對順序是一致的,來自不同分布的Z-score將彼此具有可比性,盡管來自不同大小、範圍或單位的分布的原始點值是不可比較的。換句話說,z分數是原始點值相對位置的標準化指標,因此在其自身分布中相對位置相似的點值將具有相似的z分數。因此,如果它們的相對位置相似,那麼在不同的分布中,點值的z分數是可互換的。

Z-score方法在未測作業估計中的應用

根據上麵的描述,如何使用這種z分數方法來估計一個未測量的工作的濃度變得很清楚。根據公式B,為了估計工廠中未測量工作的化學濃度,我們必須知道:1)該工廠中化學分布參數,即化學分布的平均值和標準差。工廠中的平均值和標準差可以根據工廠中被測量的工作的集中程度來估計,假設這些被測量的工作是工廠中所有工作的代表性樣本,2)分布中的相對暴露指標,即未測量工作的z得分。由於該工廠中該工作的濃度無法測量,因此無法獲得同一工廠中該工作的z分數。然而,根據Z-score的特征,假設該工作在整個行業的相對暴露是相似的,其他工廠的相同工作的Z-score應該是相似的,因為與該工作相關的任務是相似的,盡管絕對暴露可能因工廠而異。在這種情況下,來自其他工廠的相同工作的Z-score可以用作特定工廠中該工作的Z-score。如果在任何工廠都沒有測量該工作的濃度,那麼z分數不是基於測量結果,而是基於該工作的IH等級作為替代,因為IH等級是用來表示相對暴露的。IH排名的z得分轉換是必要的,以使分布與基於測量的z得分分布具有可比性。然而,基於IH排名的z分數的有用性取決於IH排名係統中設計的類別數量。在使用這種方法時,0-10的排名係統比高-中-低的排名係統更好。

有一件事需要指出來。當一項工作的z得分可從多個信息源獲得時,可以計算加權平均z得分。不同信息源的權重,包括測量值和IH等級,應由調查人員根據每個信息源的有效性和可靠性確定。然而,如果假設一份工作的相對曝光率在整個行業中是相似的,因為與該工作相關的任務是相似的,那麼來自不同來源的該工作的z得分應該彼此相似,盡管絕對曝光率可能因來源而異。

應用實例

一項關於苯乙烯暴露和缺血性心髒病(IHD)的病例隊列研究包括498例死於IHD的病例和一個兩倍於此規模的子隊列,997例,從1943-1982年間曾在兩個丁苯聚合物製造廠工作的男性隊列中隨機抽取15%的樣本。為了建立苯乙烯暴露和IHD之間的劑量反應關係,病例隊列研究的暴露評估任務包括1)未測量工作的苯乙烯和丁二烯濃度估計和2)隨時間變化的暴露調整。本文介紹的Z-score方法用於兩個任務中的第一個任務,這裏僅以第一個任務中未測量作業的苯乙烯估計為例。

雖然在本案例隊列研究中並非所有未測量的工作都需要估計,但我們事先不知道涉及哪組工作,因此我們估計了之前研究中為該行業開發的工作字典中579個工作中所有未測量和測量的工作的苯乙烯濃度[2-4]。這579個工作中的每一個都分配了一個唯一的工作代碼,該代碼是細分代碼、工作區域、子區域和特定工作的職位名稱的組合。所有的工作都由一組來自業界和學術界的工業衛生專家和工程師進行審查,以確定工作分類的準確性。然後,這些專家被要求對苯乙烯和丁二烯的工作代碼列表上的每個工作從0到10進行排名。這些估算是根據這些工程師的個人經驗做出的,他們中的大多數人從行業成立之初就在這個行業工作。在這項研究中,被試的工作經曆中涉及的獨特工作的實際數量僅為579份中的166份。

測量數據是從不同的來源收集的,如NIOSH,國際合成橡膠生產商協會,以及以前研究中的參與工廠。在之前研究的8個工廠中[2-4],隻有5個工廠提供了苯乙烯的測量結果。測量苯乙烯的五家工廠中有四家是美國工廠,包括參與案例隊列研究的兩家工廠,工廠6和工廠7。為了使用所有可用的測量信息,我們使用了四家美國工廠的所有測量數據來獲得每個作業的相對暴露量(z分數)信息。根據上述方法,使用每個工廠的可用測量數據提供測量的平均值和SD,將z分數轉回未測量作業的濃度。

在計算平均z得分時,測量z得分的權重是該信息源對該作業的測量次數除以所有權重的總和。IH等級z分數的權重是1除以所有權重的總和。平均z得分的所有權重之和為測量總數+ 1。這個加權係統更多地依賴於測量數據而不是IH排名。

工廠中未測量工作的暴露濃度是根據該工作的相對暴露值、該工作的平均暴露z得分以及工廠中測量值的實際平均值和SD來估計的。實際上,對測量工作也進行了估計。然而,在分析中,如果觀測到的濃度可用,則觀測值將覆蓋估計值。估計的濃度僅用於未測量的工作。

評估采取了以下步驟

  1. 使用公式A計算每個工廠每個測量作業的苯乙烯濃度的z分數;
  2. 使用公式A計算每個工作的IH排名的z分數;
  3. 根據工廠內所有測量工作,計算每個工廠苯乙烯濃度的平均值和標準差;
  4. 根據所有工廠和IH排名的每個工作的所有z得分,計算每個工作的加權平均z得分;
  5. 根據作業的平均z分數以及使用公式B的該廠的平均值和SD,計算每個工廠的每個作業的估計濃度。

在這些步驟完成後,每個工廠的579個工作中的每一個都有一個估計的濃度。在本文中,很難對579個工作崗位中的每一個進行估計。然而,作為總結,表1顯示了兩種植物(植物6和7)的測量數據和估計數據的百分位分布,這兩種植物參與了案例隊列研究。測量作業的平均值和SDs,第6工廠的0.153和0.157,第7工廠的0.290和0.339,以及來自其他工廠和IH排名的平均z得分,用於確定每個工廠每個作業的唯一估計濃度。579個工作的估計集中度分布類似於通過比較它們的百分位數、平均值和sd來測量的可用工作的分布。估計數據的濃度範圍比實測數據稍寬。在這兩個工廠中,測量的工作數量很少。表2總結了用於按IH等級和植物計算平均z分數、平均z分數和估計平均苯乙烯濃度的測量數。除了6號和7號工廠,1號和4號工廠的結果也被列出,表明盡管相同作業的平均z分數相同,但每個工廠都保持了自己原始的分布,對所有估計濃度具有不同的濃度均值和SDs。

討論

這種方法的概念和操作非常簡單。然而,在職業流行病學研究中,作為未測量工作的暴露評估替代方法,它可能非常有用。該方法克服了在引言部分討論的現有方法的缺點。它既考慮了工作的相對暴露,也考慮了特定工廠中所有工作的集中分布。然而,這種方法仍然有局限性。該方法的兩個主要假設之一是,這些工作之間的相對暴露在整個行業中是相似的,因為與這些工作相關的任務是相似的,盡管絕對暴露水平可能非常不同。一般來說,這一假設與IH排名係統的假設相同,可能是正確的。這就是為什麼IH排名方法在職業流行病學研究中如此流行。然而,有可能在不同的工廠中,有些工作的變化與其他工作不成比例。如果假設不成立,錯誤分類可能是一個問題。 The other important assumption of this method is that the limited measurements on limited number of jobs in a plant are representative of the concentrations of all jobs in that plant so that the distribution parameters obtained from these limited number of jobs can be applied for all jobs in that plant. This assumption may not be true, 1) if the jobs are not randomly picked or those jobs with higher exposures might be measured more. However, if all plants had the same tendency to select more exposed jobs, would the influence of the issue might not that big, when applying Z-score from other plants for an unmeasured job in a particular plant? This should be investigated further and 2) if the numbers of the measured jobs are too small to obtain stable means and SDs even if the jobs are randomly picked for measurement. In the example of this paper both issues might exist. Anyway, one has to have some measurements in a plant to obtain the distribution parameters so that Z-score can be used to estimate concentrations for unmeasured jobs for that plant. Without any measurements, one cannot use this method. The other issue may rise when only IH rank is available for Z-score calculation. Since IH ranks are categorical, Z-scores of IH ranks are not continuous. For instance, a 0-10 ranking system will only have 11 Z-score values at the best. Sometimes, not all ranking categories are used by the experts as in the example study. For instance, rank 5, 7, and 9 were not assigned to any job (Table 2), so that a possible 11 level ranking system had actually only eight categories in this case. The estimation based on this categorical system would be less precise than that based on measurements.

表1:在兩個研究工廠中測量和估計苯乙烯濃度的分布(1976-1985)
*工廠6有22個測量工作,144個測量
†7號工廠有44個測量工作,704次測量

表2:4個美國工廠按等級估計平均濃度(ppm)
*排名內工作的平均z得分的平均值
†該級別內工作苯乙烯估計濃度的平均值

需要指出的是,這裏介紹的方法是用於橫截麵濃度估計的。濃度隨時間的變化未被考慮。但是,如果在時間維度上有足夠的信息,這種方法也可以用於按時間段估計濃度。例如,如果您有不同時間段的測量數據,則不同時間段的平均值和SDs將用於不同時間段[9]的濃度估計。

參考文獻
  1. Harvey C, Pearce NE, Crawford-Brown DJ(1996)職業流行病學的研究方法。紐約,牛津大學出版社。
  2. 馬塔諾斯基GM, Schwartz L(1987)苯乙烯丁二烯聚合物生產工人的死亡率。J占用醫學29:675-680。[Ref。
  3. Matanoski GM, Santos-Burgoa C, Schwartz L(1990)苯乙烯-丁二烯聚合物(SBR)製造業工人隊列死亡率,1943-1982。環境運行狀況展望86:107- 117。[Ref。
  4. 馬塔諾斯基GM, Elliott E,陶x, Francis M, Correa-Villasenor A,等。(1997)合成橡膠生產中丁二烯和苯乙烯暴露與淋巴造血癌。中國科學院學報(自然科學版)837:157-169。[Ref。
  5. Scheider T, Olsen I, Jorgensen O, Lauersen B(1991)曝光信息評價。應用占用環境Hyg 6: 475-481。[Ref。
  6. Theriault GP, Burgess WA, Di Berardinis LJ, Peters JM(1974)佛蒙特州花崗岩棚的粉塵暴露。拱門環境健康28:13- 17。[Ref。
  7. 於榮榮,譚文義,馬修,李文傑(1990)曆史曝光量定量估計的確定性數學模型。美國工業衛生協會51:194- 201。[Ref。
  8. 馬卡魯索,拉爾森R, Delzell E, Sathiakumar N, Hovinga M,等(1996)合成橡膠工業工人白血病與累積暴露丁二烯、苯乙烯和苯。毒理學113:190-202。[Ref。
  9. 陶X(2003)苯乙烯暴露與缺血性心髒病的病例隊列研究。美國流行病學雜誌158:988-995。[Ref。
  10. Pagano M, Gauvreau(2000)生物統計學原理:第7章:理論概率分布。達克斯伯裏湯姆森學習,太平洋格羅夫,加利福尼亞州,美國。[Ref。
  11. 雷宇S(1997)衛生服務研究方法:第14章:衛生服務研究中的統計分析。德爾瑪出版社和國際湯姆遜出版社。紐約,奧爾巴尼,1997年。[Ref。

下載臨時PDF

PDF

條信息

文章類型:評論文章

引用:陶x(2016)估算未測量作業化學品濃度的方法。J流行病學公共衛生Rev 1(2): doi http://dx.doi。org/10.16966/2471 - 8211.113

版權:©2016 Tao X.這是一篇開放獲取的文章,根據創作共用署名許可的條款發布,允許在任何媒介上不受限製地使用、分發和複製,前提是要注明原作者和來源。

出版的曆史:

  • 收到日期:12月22日

  • 接受日期:2月26日

  • 發表日期:2016年3月1日