全文
易王謝佳佳劉荀Jielin杜明月吳文晶黃丹·鄧*
重慶醫科大學公共衛生與管理學院衛生統計係*通訊作者:400016重慶渝中區一學園路1號重慶醫科大學公共衛生與管理學院衛生統計係鄧丹電子郵件:100079 @cqmu.edu.cn
目的:比較logistic回歸和廣義增強模型(GBM)在治療加權逆概率(IPTW)中估計治療效果和平衡協變量的能力,並基於該方法探討不同類型醫療保險對冠心病門診患者藥品費用的獨立影響。
方法:本研究通過模擬設計不同樣本量(n= 500,2000)的處理變量和協變量之間的線性和非線性相關性,在蒙特卡洛研究中評價邏輯回歸和GBM在IPTW中的表現。評價指標包括平均標準化絕對平均差(ASAM)、點估計、偏差、相對偏差、標準誤差、均方誤差、95%置信區間覆蓋率、權重分布,並對冠心病門診患者進行模擬實證研究。
結果:仿真結果表明,GBM在傾向評分加權中具有較低的偏倚和均方誤差,且在非線性條件模型中達到了較好的協變量平衡。在這個案例研究中。結果表明,與logistic回歸相比,IPTW中的GBM具有更好的平衡混雜因素的能力。加權結果顯示,城鎮職工基本醫療保險門診冠心病患者的藥費比城鄉居民基本醫療保險門診冠心病患者的藥費平均增加256.35元。
結論:在治療變量與協變量關係未知的情況下,采用IPTW結合GBM可能更好地控製混雜因素。本研究發現,冠心病患者不同醫保類型的藥品費用仍存在一定差距,為冠心病醫療保險製度和衛生資源的優化配置提供了合理的科學依據。
傾向分數;處理加權的逆概率;廣義提高造型;模擬;冠心病
盡管隨機對照試驗被認為是研究設計的金標準,但由於倫理、時間和成本限製等原因,它們往往不能被實施或不能準確反映對真實實驗設計或社會和健康科學的興趣效果[1,2]。隨著醫院信息化的發展,大量的觀測數據變得唾手可得。但觀察性研究無法通過隨機分配的方式控製治療組與非治療組之間的混雜因素。因此,在評估治療效果時,往往會出現選擇偏差。在觀察性研究中減少偏倚的傳統方法包括回歸模型、匹配和分層,但這些方法可能不適用於協變量較多的研究[3-5]。傾向評分方法可以將多個協變量(多維)轉化為傾向評分(一維),可以解決這些問題。傾向評分方法的應用主要包括匹配、分層、加權和回歸調整[6-9]。傾向評分加權比匹配有很大的優勢,它通過保留樣本中的所有個體來分析處理效果,可以顯著提高統計效率。近年來,傾向評分加權越來越多地應用於醫學領域[10-12]。
傾向得分通常用邏輯回歸估計[13-15]。建模需要幾個與選擇變量和指定函數形式相關的假設[16-18]。因此,在尋找最佳模型的過程中往往涉及到主觀決策。此外,當其中一個假設錯誤時,通過調整傾向得分可能無法實現共變量平衡,這可能導致對治療效果的估計存在偏差[19,20]。此外,邏輯回歸不能處理協變量之間的非線性和交互效應等複雜關係[21-23]。廣義增強建模(Generalized boosting modeling, GBM)是機器學習中最新的預測方法之一,在處理高維和缺失數據方麵優於邏輯回歸[1,24,25],可以作為一種替代的非參數方法來達到相同的目的,但假設較少,結果更準確。不幸的是,GBM並未與傾向評分一起廣泛使用。因此,本研究擬在不存在隱性偏倚和不同樣本量的情況下,構建線性和非線性條件作用模型,比較邏輯回歸和GBM對處理效果的估計能力以及傾向評分權重中協變量的平衡能力,為處理各種複雜數據的混雜因素提供一定的參考。2012年,重慶市將冠心病納入專項疾病管理。不同類型醫療保險的報銷比例不同[26,27],因此我們想分析城鎮職工和城鄉居民醫療保險對冠心病門診患者藥費的獨立影響。 However, because of the large sample size of outpatient data and the uneven baseline, we used this case study as an empirical analysis.
基本假設和平均治療效果
正如Rosenbaum PR等人[28]最初提出的那樣,考慮到觀察到的協變量向量(e(X)也被稱為平衡得分,X是一個向量),傾向得分指的是將成員si (i=1,…,N)分配給特定治療組(W=1)而非非治療組(W= 0)的條件概率公關(W e (X) = = 1│X),觀察到的基線協變量可能影響治療和結果變量的選擇。在傾向評分的情況下,治療分配與觀察到的基線協變量無關X⊥W│e (X).因此,如果治療組和非治療組的傾向得分相似,每個成員被分配到治療組的概率與隨機實驗相同,即使他們有不同的協變量值。如果實現了強可忽略的治療假設(SITA),即治療的潛在結果(Y1)和非治療(Y0)組獨立於治療方法的選擇(Y0,Y1)⊥Wcat X,則平均治療效果(ATE)的無偏估計為吃= E[日元│W = 1)——(Y0│W = 0)│X.傾向評分加權的目的是給每個成員分配一個權重,使權重代表整體。估計ATE的方法稱為處理加權的逆概率(IPTW)。治療組的體重為1 / e (X)非治療組是1 /(單電子(X)).IPTW沒有在兩組之間創建相似的傾向,而是創建了一個權重不等的加權分析,這很容易實現。因此,如果適當估計傾向評分,權重可以解釋治療組和非治療組觀察到的協變量分布的差異,ATE等於兩組結果差異的加權平均值,即:
當e (X)我)由機器學習估計,方差估計可能不存在明確的公式。為了更清楚地顯示權重,Imbens GW[30]為ATE提出了另一種標準化估計量,它被寫成
預測傾向分數的條件反射模型
邏輯回歸:邏輯回歸獲得傾向分數的過程非常簡單,易於理解和執行,但必須通過適當的連接函數(如logit函數[31])將模型轉換為線性模型。然而,當協變量與轉換變量之間的關係不滿足線性假設時,傾向得分的值往往是不可靠的。
廣義提高造型:GBM是一種基於回歸樹的現代非參數增強方法,它可以用回歸樹作為弱分類器擬合多個模型,然後使用增強算法合並來自每個模型的預測[32,33]。回歸樹可以應用於連續、正態、有序和缺失的自變量,自動得到非線性關係和相互作用[34]。與邏輯回歸相比,它不需要設置預測變量的函數形式。boost算法可以將許多簡單的模型組合成一個更複雜的模型。與簡單的回歸樹相比,boosting算法可以獲得平滑的擬合和良好的預測,並且在很大程度上可以避免對數據的過度擬合[35,36]。因此,使用GBM來合並大量測量的基線協變量來擬合條件反射模型。估計傾向分數的公式是g (X) =日誌它(e (X))日誌(e (X)/(單電子(X)))[37]。具體來說,GBM從回歸樹和集合開始ĝ0(X) = logw / (1 w)為初始值,其中w為樣本中處理變量的均值。然後,找到一個調整函數h(X)來提高模型的擬合程度。h(X)可以是任何形式:在這裏,它是通過將當前估計的logit(e(X))的殘差與X. log擬合得到的回歸樹它(e (X))更新的g hg (X) + λh(X)采用連續迭代的方法,每迭代一次,對數似然估計相應增加。λ是一個收縮係數:通常,λ越小,貼合越平滑。收縮係數範圍為0 ~ 1。McCaffrey建議,當測量基線協變量的平均標準化絕對平均差(ASAM)最小時,停止迭代次數[37]。在本研究中,收縮係數為0.01,停止規則是最小化跨協變量的ASAM。
仿真設計
沈陽市郭和馬克w弗雷澤在《傾向分數分析:統計方法和應用》一書中描述的模擬結構在本研究[1]中進行了輕微修改。首先,五個基線協變量(X1−X5)被認為是X1, X3.和X5為均值向量(3 11 6)和標準差向量(0.3 4.0 2.5)服從正態分布的連續變量,X2和X4為伯努利分布分類變量。建立了一個包含兩組治療暴露的二元治療變量,三個變量(X1, X2, X5)生成治療變量(W),定義每組治療分配的概率為公關(W = 1│ξ)= 1 / (1 +經驗(- (f (X)我,β)+ v))).函數f在不同情況下隨β係數的變化而變化,平均處理概率約為0.5。變量X1X4用於從以下回歸方程計算連續結果變量(Y):Y =α0+α我X我+τW + u.真正的處理效果(τ)等於1.5,這是事先知道的。治療變量(v)和結果變量(u)的誤差項表示在考慮自變量後的未解釋方差的量,均由均值為0、方差為1的正態分布生成。根據SITA,當X5與結果誤差(u)相關,但治療誤差(v)與結果誤差(u)不相關,在條件作用模型的指定上不存在隱性偏倚。X之間不同變量對的相關係數1, X3., X5和你是0.2 (rX1X3.), 0.15 (rX3.X5)而且0.5 (ruX5)其他變量之間的關係被設為零。變量之間的弱關係(X1−X5),以減少模擬數據的潛在變異性。本研究考慮使用IPTW估計ATE的兩種情況,並使用logistic回歸和GBM估計傾向性得分。兩種場景如下:
場景1:處理變量與基線協變量之間的關係為線性關係,即預測傾向得分的正確條件模型為W =[β0+β1X3.+β2X4+β3.X5+ v),結果回歸模型為Y =[α0+α1X1+α2 x2+α3.X3.+α4X4+αWW + u).
場景2:治療變量和基線協變量之間的關係是非線性的。此外,不存在交互效應和二次項,即預測傾向得分的正確條件模型為W =[β0+β1X3.+β2X4+β3.X5+β4X23.+β5X3.X5+β6X3.X4+ v),結果回歸模型為Y =[α0+α1X1+α2 x2+α3.X3.+α4X4+αWW + u).在這裏,α0= 100,α我=(0.7, 0.25, -0.4, 0.15),和β我=(0, -0.28, 0.15, 0.5, -0.042, 0.09, -0.056)。在1000個樣本數據集N=500和N=2000中模擬了這兩種場景。
統計分析
所有分析均在R軟件環境(版本3.5.3)和STATA(版本15.0)中進行。使用twang包中的ps函數實現了帶GBM的IPTW,使用dxwts函數實現了帶邏輯回歸的IPTW。所有其他分析均在STATA中進行。以下指標被用來評估不同的條件反射模型:
平均標準化絕對平均差:用於檢驗基線協變量的平衡性,ASAM較低表示兩組基線協變量的具體值相近;估計治療效果的表現:點估計(αW)、偏差、相對偏差(RB)和效應估計的標準誤差(SE);均方誤差(Mean Square Error, MSE):估計處理效果的采樣分布的變化,數值越小,模型精度越高,變化越小;95% CI覆蓋率:包含真實治療效果的模型估計的95%置信區間的百分比;權重分布:傾向得分範圍從0到1。接近0或1的值會導致極端權重,降低IPTW的準確性。
所有指標計算為1000個結果的平均值。
仿真結果
模型的處理效果和準確性:當條件條件模型為線性時,logistic回歸(N=500:0.20%, N=2000:0.17%)的RB略低於GBM (N=500:0.28%, N=2000:0.27%)。平均標準誤差、MSE和95% CI覆蓋率相似,且標準誤差和MSE隨樣本量增加而減小,95% CI覆蓋率隨樣本量增加而減小。當條件模型為非線性時,logistic回歸的RB (N=500:0.55%, N=2000:0.77%)顯著增加,且偏倚分布存在較多異常值,而GBM則保持穩定(N=2000:0.37%)。logistic回歸的平均標準誤差(N=500:0.1401, N=2000:0.0909)和邊際誤差(N=500:0.0428, N=2000:0.0175)顯著增加,且均高於相同樣本量下的GBM。95% CI覆蓋率(N=500:81.7%, N=2000:82.7%)顯著降低,低於GBM。樣本量越大,結果越好(表1和圖1)。
圖1:
答:情景1中,用兩種方法計算樣本容量為500(左)和2000(右)時的偏差分布。
b:情景2中兩種方法的樣本容量為500(左)和2000(右)的偏差分布。
樣本大小 | 方法 | αW | SE | 偏見 | RB | 均方誤差 | 95% CI覆蓋率 | ASAM | |
場景1 | N = 500 | 物流 | 1.4970 | 0.0950 | 0.0030 | 0.20% | 0.0103 | 93.2% | 0.048 |
“綠帶運動” | 1.4958 | 0.0950 | 0.0042 | 0.28% | 0.0100 | 93.5% | 0.121 | ||
N = 2000 | 物流 | 1.4975 | 0.0484 | 0.0025 | 0.17% | 0.0023 | 93.9% | 0.025 | |
“綠帶運動” | 1.4960 | 0.0475 | 0.0040 | 0.27% | 0.0022 | 94.9% | 0.073 | ||
場景2 | N = 500 | 物流 | 1.4918 | 0.1401 | 0.0082 | 0.55% | 0.0428 | 81.7% | 0.738 |
“綠帶運動” | 1.4786 | 0.1297 | 0.0214 | 1.43% | 0.0199 | 92.9% | 0.273 | ||
N = 2000 | 物流 | 1.4884 | 0.0909 | 0.0116 | 0.77% | 0.0175 | 82.7% | 0.452 | |
“綠帶運動” | 1.4944 | 0.0808 | 0.0056 | 0.37% | 0.0077 | 92.9% | 0.195 |
表1:兩種情景下的邏輯回歸和GBM的IPTW結果。
基線協變量的平衡:原樣本中ASAM在兩組間的分布高度不平衡(場景1:ASAM平均>0.2;場景2:平均ASAM>0.4)。當條件反射模型為線性時,可達到平衡的基線協變量。與GBM相比,logistic回歸的平均ASAM較低(N=500:0.048, N=2000:0.025)。當條件條件模型為非線性時,基於GBM的協變量平衡實現能力優於logistic回歸,logistic回歸的平均ASAM (N=500:0.738, N=2000: 0.452)顯著提高,甚至高於原始樣本(N=500:0.421, N=2000:0.273)。此外,邏輯回歸在兩種情況下都有大量高離群值(表1和圖2)。
圖2:
答:情景1中樣本容量為500(左)和2000(右)的ASAM的分布,采用兩種方法。
b:情景2中樣本容量為500(左)和2000(右)的ASAM分布,采用兩種方法。
權重的分配:當條件作用模型為線性時,在相同樣本量下,logistic回歸和GBM的權重分布相似,均以1為中心。當條件反射模型為非線性時,邏輯回歸在不同樣本量下會產生大量極高的權重。平均權重分別為22.07和5.79,平均最大權重分別為10126.87和7462.96。相比之下,GBM生成的權重保持穩定。平均權重分別為1.45和1.56,平均最大權重分別為16.17和44.09(表2)。
樣本大小 | 方法 | 分布的權重 | ||||||
最小值 | P25 | P50 | 的意思是 | 我 | 馬克斯 | |||
場景1 | N = 500 | 物流 | 1.01 | 1.24 | 1.53 | 1.99 | 2.12 | 20.2 |
“綠帶運動” | 1.02 | 1.21 | 1.43 | 1.74 | 1.90 | 8.67 | ||
N = 2000 | 物流 | 1.01 | 1.25 | 1.54 | 2.00 | 2.14 | 32.55 | |
“綠帶運動” | 1.02 | 1.23 | 1.47 | 1.85 | 2.02 | 13.63 | ||
場景2 | N = 500 | 物流 | 1.00 | 1.02 | 1.11 | 22.07 | 1.46 | 10126.87 |
“綠帶運動” | 1.00 | 1.04 | 1.12 | 1.45 | 1.38 | 16.17 | ||
N = 2000 | 物流 | 1.00 | 1.02 | 1.10 | 5.79 | 1.44 | 7462.96 | |
“綠帶運動” | 1.00 | 1.03 | 1.10 | 1.56 | 1.38 | 44.09 |
表2:兩種情景下的IPTW與logistic回歸及GBM權重分布。
案例研究
選取冠心病患者的門診資料,用不同的方法評估ATE,檢驗IPTW的性能。重慶某三甲醫院2016年1月至2018年12月的門診數據包括患者的人口信息和藥物費用。納入標準:根據國際疾病分類10首次診斷確定冠心病住院患者thI20-I25修訂版(ICD-10)規範。排除標準:合並其他疾病。本研究旨在分析不同類型醫療保險對門診冠心病患者藥物費用的獨立影響,因為費用還受其他人口統計學因素的影響,所以采用傾向評分加權來控製其他混雜因素。本研究的結局變量為冠心病門診患者的藥品費用,暴露變量為不同醫療保險類型,潛在混雜因素包括性別、年齡、藥品種類、藥品零利潤政策醫生職稱和科室類型,共納入16575人,其中15136人參加城鎮職工基本醫療保險,1439人參加城鄉居民基本醫療保險。
協變量和權重的平衡:加權前,ASAM最大值和平均值分別為0.393和0.179。除藥物種類外,其他變量在兩組間差異均有統計學意義(P<0.05)。經IPTW和logistic回歸分析,ASAM最大值和平均值分別為0.090和0.030。兩組平均權重為2.00,藥品種類和藥品零利潤政策差異有統計學意義(P<0.05)。經IPTW加GBM後,ASAM最大值和平均值分別為0.081和0.027。平均權重為1.95,兩組間各變量無差異(P>0.05)(表3)。GBM優於logistic回歸,故後續分析采用IPTW + GBM。
協變量 | 減重 | IPTW與邏輯回歸 | GBM IPTW | ||||||||||
UEBMI (n = 15136) | URRBMI (n = 1439) | ASAM | P | UEBMI (n = 15136) | URRBMI (n = 1439) | ASAM | P | UEBMI (n = 15136) | URRBMI (n = 1439) | ASAM | P | ||
性別 | 男性 | 62.1% | 57.1% | 0.103 | < 0.001 | 61.7% | 62.2% | 0.010 | 0.782 | 60.7% | 60.6% | 0.023 | 0.577 |
女 | 37.9% | 42.9% | 0.103 | 38.3% | 37.8% | 0.010 | 38.3% | 39.4% | 0.023 | ||||
類別的藥物 | 西方醫學 | 93.7% | 93.3% | 0.016 | 0.570 | 93.7% | 95.7% | 0.090 | 0.018 | 93.7% | 93.7% | 0.002 | 0.980 |
非西方的醫學 | 6.3% | 6.7% | 0.016 | 6.3% | 4.3% | 0.090 | 6.3% | 6.3% | 0.003 | ||||
藥物是零,利潤的政策 | 之前 | 58.8% | 74.5% | 0.321 | < 0.001 | 60.1% | 64.3% | 0.086 | 0.020 | 60.1% | 63.4% | 0.066 | 0.103 |
後 | 41.2% | 25.5% | 0.321 | 39.9% | 35.7% | 0.086 | 39.9% | 36.6% | 0.066 | ||||
醫生的標題 | 主要的 | 4.4% | 2.2% | 0.105 | < 0.001 | 4.2% | 3.8% | 0.017 | 0.343 | 4.2% | 3.2% | 0.051 | 0.491 |
中間 | 21.2% | 15.9% | 0.129 | 20.7% | 23.4% | 0.066 | 20.7% | 21.6% | 0.022 | ||||
高級副 | 34.5% | 28.0% | 0.136 | 33.9% | 31.2% | 0.057 | 33.9% | 32.4% | 0.033 | ||||
高級 | 40.0% | 53.9% | 0.283 | 41.2% | 41.6% | 0.008 | 41.2% | 42.9% | 0.034 | ||||
類型的部門 | 其他的 | 3.0% | 5.2% | 0.128 | < 0.001 | 3.2% | 3.2% | 0.001 | 0.812 | 3.2% | 3.4% | 0.013 | 0.554 |
內分泌和代謝 | 3.2% | 0.4% | 0.157 | 2.9% | 2.1% | 0.047 | 2.9% | 1.6% | 0.081 | ||||
普通內科醫學 | 5.5% | 3.9% | 0.069 | 5.3% | 4.7% | 0.025 | 5.3% | 5.4% | 0.003 | ||||
中醫治療 | 14.8% | 2.6% | 0.345 | 13.8% | 15.0% | 0.036 | 13.8% | 13.1% | 0.019 | ||||
心血管 | 66.1% | 84.7% | 0.393 | 67.7% | 67.9% | 0.004 | 67.7% | 70.1% | 0.051 | ||||
老年病學 | 7.4% | 3.2% | 0.162 | 7.1% | 7.0% | 0.004 | 7.1% | 6.4% | 0.025 | ||||
年齡(年) | 0~ | 1.8% | 6.3% | 0.033 | < 0.001 | 2.2% | 2.2% | 0.001 | 0.740 | 2.2% | 2.2% | 0.003 | 0.926 |
45 ~ 59歲 | 16.1% | 22.0% | 0.159 | 16.6% | 15.5% | 0.031 | 16.6% | 16.0% | 0.018 | ||||
60 ~ 74 | 56.8% | 47.0% | 0.197 | 55.9% | 56.7% | 0.016 | 55.9% | 56.2% | 0.006 | ||||
75 ~ | 25.3% | 24.7% | 0.012 | 25.2% | 25.7% | 0.009 | 25.2% | 25.6% | 0.008 | ||||
最大ASAM | 0.393 | 0.090 | 0.081 | ||||||||||
平均ASAM | 0.179 | 0.030 | 0.027 | ||||||||||
平均重量 | - | 2.000 | 1.950 |
表3:加權前後兩組協變量的ASAM和P值。
估計吃:加權後,UEBMI門診患者的藥品費用較URRBMI門診患者平均增加256.35元。差異有統計學意義(表4)。
GBM IPTW | ||||
β(se) | t | P | 95%可信區間 | |
類型的醫療 保險 |
256.35 (16.17) | 15.86 | < 0.001 | 224.66 - -288.04 |
表4:用GBM法估計IPTW後的ATE。
敏感性分析:對於敏感性分析,我們在排除傾向評分[38]分布尾部的患者後重複分析。結論與初步分析結果一致(表5)。
PS削減範圍 | GBM IPTW | |||
β(se) | t | P | 95%可信區間 | |
1% - -99% | 256.44 (16.42) | 15.62 | < 0.001 | 224.25 - -288.62 |
2.5% - -97.5% | 255.38 (17.02) | 15.00 | < 0.001 | 222.02 - -288.74 |
5% - -95% | 255.87 (17.62) | 14.52 | < 0.001 | 221.32 - -290.41 |
表5:用GBM法估計IPTW後ATE的靈敏度分析。
IPTW的主要目標是實現治療組和非治療組之間的協變量平衡,以獲得對治療效果的有效估計。大多數方法使用邏輯回歸預測傾向得分,但模型假設可能是無效的。因此,本研究的主要目的是比較logistic回歸和GBM在線性或非線性條件作用模型下評估傾向評分權重的治療效果和協變量平衡的能力。雖然Jacqueline M burgtte等、Xin M、Fullerton B等[39-41]將logistic回歸與GBM進行了比較,但沒有考慮到處理變量與協變量之間的交互效應和二次關係。此外,本研究評估了協變量的平衡和權重分布,使結果更加可靠。此外,該設計保證了條件反射模型的估計不存在隱藏偏差,即可以確定兩組間差異的來源,並通過傾向評分加權來控製偏差。
結果表明,無論樣本量大小,隻有主效應的邏輯回歸和GBM通常都能達到協變量平衡,並提供可接受的治療效果估計。權重集中分布,以1為中心,95% CI覆蓋率接近95%,模型精度相近。Abdia Y等人,Pirracchio R等人[42,43]也注意到,在線性模型下,邏輯回歸比機器學習產生更低的ASAM和更小的偏差。然而,當模型不考慮交互效應和二次項時,無論樣本量大小,邏輯回歸估計的ASAM值都高於未加權的ASAM值。而且,傾斜分布產生了大量的高離群值,未能達到平衡的協變量。這些結果與Abdia Y等人、Lee BK等人及其同事[42,44]觀察到的結果相似,但估計的權重高度分散。例如,當N=2000時,取值範圍為1 ~ 7462.96。主要原因可能是兩組之間的協變量重疊程度不高,任何組中隻有少數成員可以替代另一組中的其他成員。另一項研究表明,如果估計的權重變量較大,則權重可能導致ATE的準確性較差[45-48]。該情景下的偏差約為線性情景下的3倍,標準誤差約為2倍,均方誤差約為8倍,95% CI覆蓋率降低了10%。 By contrast, the ASAM estimated by GBM remained steady and had a more symmetrical distribution. GBM provided good performance in terms of covariate balance. The weight distribution remained stable (e.g., when N=500, the range was from 1 to 16.17), the 95% CI coverage rate was still greater than 90%, and other indicators were slightly worse. However, the performance of these indicators was better when N=2000, possibly because machine learning itself was more suitable for larger sample sizes. In addition, when the nonlinear relationship between covariates in the conditioning model was excessively complex, the logistic regression model could not be fitted. These results indicate that it may be important to balance covariates with interaction effects and quadratic terms, especially when the real model itself has interaction effects and quadratic terms. Alam S, et al., Franklin JM, et al., Lunt M and others [49-51] noted the importance of carefully selecting covariates and checking the balance of covariates with interaction effects, but because the treatment effect is not yet clear, this is seldom done in practice. Because IPTW directly uses propensity scores to control the bias caused by selection in outcome analysis, IPTW may be sensitive to model misspecification (i.e., when the covariates are inaccurate or omitted), and the distribution of weights and the covariate balance must be assessed. Some researchers have suggested that the distribution of weights (especially the average weight) should be evaluated to assess whether the conditioning model is correct and whether the model violates the relevant assumptions [45,52]. GBM is a strong nonparametric learning algorithm [53]. Many of its features are beneficial to propensity score methods. The regression tree, a basic classification algorithm, is iterated continuously to find the optimal function combination form and to prevent over fitting [54]. A smaller shrinkage coefficient can be used to reduce the variability. By optimizing the number of iterations and piecewise constant model, the variability of propensity score is reduced, and the generated weights are more uniform [44]. Therefore, it may be better to use IPTW with GBM to control confounding factors in the case of an unknown relationship between the treatment variable and covariates.
在實證研究中,在ASAM和IPTW的平均權重方麵,GBM優於logistic回歸。兩組間有2個變量經IPTW和logistic回歸均不平衡,而所有變量經IPTW和GBM均平衡。結果分析顯示,UEBMI的冠心病門診患者的藥物費用比URRBMI的門診患者平均高256.35元。城鎮職工醫療保險報銷比例高於城鄉居民,醫療服務需求較高。醫療保險的基本目的是減輕個人疾病的經濟負擔,體現公平[55,56]。因此,必須縮小不同類型醫療保險之間的差距[57,58]。醫務人員要規範診療行為,合理使用地毯,減輕患者負擔,特別是長期服藥的慢性病患者。在保證醫療服務質量的同時,負責幫助患者明確相關醫療保險政策,合理利用衛生資源。本研究在不考慮其他傾向評分方法的情況下,隻研究了logistic回歸和GBM在傾向評分加權中的表現,模擬研究隻考慮了交互效應和二次項,不考慮高階多項式。這些考慮必須在未來的研究中加以解決。
本研究獲得重慶市教委人文社科項目資助,項目編號:17SKG025。
- 郭碩,Fraser MW(2015)傾向得分分析統計方法及應用nd版本,Sage,加利福尼亞州,美國。[Ref。]
- Jupiter DC(2017)傾向評分匹配:回顧性隨機化?中華足踝外科雜誌56:417-420。[Ref。]
- body R, Larsen R, Warne RT(2018)分段傾向評分分析:一種多序數自變量進行傾向評分匹配的新方法。《心理科學》6:14。[Ref。]
- Benedetto U, Head SJ, Angelini GD, Blackstone EH(2018)統計入門:傾向得分匹配及其替代方法。《歐洲心肺外科雜誌》53:1112-1117。[Ref。]
- 趙鵬,蘇曉剛,葛婷婷,範娟娟(2016)基於隨機森林的傾向評分與鄰近匹配。當代臨床試驗47:85-92。[Ref。]
- Ripollone JE, Huybrechts KF, Rothman KJ, Ferguson RE, Franklin JM(2018)傾向得分匹配悖論在藥物流行病學中的意義。流行病學雜誌187:1951-1961。[Ref。]
- Shida D, Ochiai H, Tsukamoto S, Kanemitsu Y(2018)腹腔鏡與開放式D3清掃術治療II/III期結腸癌的長期結果:傾向評分分析結果。急診外科腫瘤科44:1025-1030。[Ref。]
- Linden A, Yarnold PR(2018)通過結合分類樹分析和傾向評分權重估計生存(時間到事件)結果的因果影響。臨床實用雜誌24:380-387。[Ref。]
- Andersen LW, Kurth T(2018)傾向評分——對複蘇研究人員的簡要介紹。125年複蘇:66 - 69。[Ref。]
- Ko JH, Lee NR, Joo EJ, Moon SY, Choi JK,等(2018)適當的非碳青黴烯類藥物作為產生廣譜β -內酰胺酶腸杆菌科菌血症的初始經驗治療並不低於碳青黴烯類藥物:一項傾向評分加權多中心隊列研究。中華臨床微生物感染雜誌37:305-311。[Ref。]
- Vetterlein MW, Gild P, Kluth LA, Seisen T, Gierth M,等(2018)圍術期異體輸血不會對膀胱癌根治性膀胱切除術後的腫瘤結局產生不利影響:一項傾向評分加權的歐洲多中心研究。BJU Int 121: 101-110。[Ref。]
- Moik F, Riedl JM, Winder T, Terbuch A, Rossmann CH等(2019)晚期膽道癌二線全身化療的療效:傾向評分分析。科學報告9:5548。[Ref。]
- Kuss O, Blettner M, Börgermann J(2016)傾向評分:一種分析治療效果的替代方法。Dtsch Arztebl Int 113: 597-603。[Ref。]
- Austin PC, Stuart EA(2017)利用傾向性評分的完全匹配估計治療對二元結果的影響。統計方法醫學文獻26:2505-2525。[Ref。]
- Ahl R, Sarani B, Sjolin G, Mohseni S(2019)顱內壓監測與死亡率的關係:孤立性嚴重鈍性創傷性腦損傷傾向評分匹配隊列。急診創傷休克雜誌12:18 -22。[Ref。]
- Schneeweiss S, Eddings W, Glynn RJ, Patorno E, Rassen J,等。(2017)分析醫療保健數據庫時高維協變量空間混雜調整的變量選擇。流行病學28:237 - 248。[Ref。]
- Jackson JW, Schmid I, Stuart EA(2017)藥物流行病學傾向評分:超越地平線。Curr流行病代表4:271-280。[Ref。]
- Ertefaie A, Asgharian M, Stephens DA(2017)因果推理中使用同步懲罰方法的變量選擇。J因果推理[Ref。]
- David Lenis, Benjamin Ackerman, Elizabeth A Stuart(2018)測量模型錯誤:在複雜調查數據傾向評分方法中的應用。計算統計數據肛門128:48-57。[Ref。]
- Waernbaum I, Pazzagli L(2017)逆概率加權和雙魯棒估計的模型錯誤規範和偏差。統計理論。[Ref。]
- Linden A, Yarnold PR(2017)使用分類樹分析生成傾向得分權重。評定臨床實用23:703-712。[Ref。]
- Harrell FE(2017)回歸建模策略:應用於線性模型、邏輯回歸和生存分析。施普林格330年。[Ref。]
- Gerasimovic M, Bugaric U(2018)招生管理模型:人工神經網絡與邏輯回歸。App人工智能32:153-164。[Ref。]
- Miller PJ, Lubke GH, McArtor DB, Bergeman CS(2016)使用多元樹增強發現數據中的結構。精神病學方法21:583-602。[Ref。]
- Ridgeway G(2007)廣義增強模型:gbm包指南。[Ref。]
- 丁建明,張曉忠,胡曉軍,陳海林,於敏(2017)西安市某三級醫院冠心病住院患者住院費用及影響因素分析:回顧性研究。醫學(巴爾的摩)96:e9341。[Ref。]
- 李晨,Young BR, Jian W(2018)老年心血管疾病患者社會經濟地位與疾病經濟負擔的關係:來自中國健康與退休縱向調查的證據。BMJ打開8:e018703。[Ref。]
- Rosenbaum PR, Rubin DB(1983)傾向評分在因果效應觀察研究中的中心作用。生物識別70:41 - 55。[Ref。]
- Lunceford JK, daviddian M(2004)因果治療效果評估中通過傾向評分進行分層和加權:一項比較研究。Stat Med 23: 2937-2960。[Ref。]
- Imbens GW(2004)外生性下平均處理效果的非參數估計:綜述。經濟統計86:4-29。[Ref。]
- McCarthy RV, McCarthy MM, Ceccucci W, Halawi L(2019)使用回歸的預測模型。應用預測分析。施普林格89 - 121。[Ref。]
- 屠C(2019)各種機器學習算法估計廣義傾向分數的比較。J Stat Comput Simul 89: 708-719。[Ref。]
- Biau G, Cadre B, Rouvìère L(2018)加速梯度助推。統計,機器學習,康奈爾大學1-18。[Ref。]
- Batra M, Agrawal R(2017)決策樹算法的比較分析。在:Panigrahi BK, Hoda MN, Sharma V, Goel S(編)自然啟發計算:CSI 2015的進程。施普林格31 - 36。[Ref。]
- Basha SM, Rajput DS, Vandhan V(2017)梯度上升和提升算法在分類中的影響。國際計算機工程學報11:41- 49。[Ref。]
- 李霞,陸傑,胡鬆,程克坤,De Maeseneer J,等(2017)中國初級衛生保健製度。《柳葉刀》390:2584 - 2594。[Ref。]
- McCaffrey DF, Ridgeway G, moral AR(2004)傾向評分估計與增強回歸評估觀察性研究的因果效應。精神病學方法9:403-425。[Ref。]
- Stürmer T, Rothman KJ, Avorn J, Glynn RJ(2010)存在未測混雜的治療效果:處理傾向得分分布尾部的觀察結果——一項模擬研究。流行病學雜誌172:843-854。[Ref。]
- Jacqueline M burgtte, John S Preisser, R Gary Rozier(2016)傾向評分加權:早期領先牙科研究的應用。《公共衛生雜誌》76:17-29。[Ref。]
- 辛敏(2018)傾向評分技術及其在藥物經濟學中的應用比較。重慶醫科大學。
- Fullerton B, Pöhlmann B, Krohn R, Adams JL, Gerlach FM,等(2016)在一項評估德國疾病管理項目對2型糖尿病患者長期預後影響的研究中,使用不同平衡度量的匹配方法的比較:收益和風險的例子。衛生服務第51號決議:1960-1980年。[Ref。]
- Abdia Y, Kulasekera KB, Datta S, Boakye M, Kong M(2017)基於傾向評分的平均治療效果和治療者平均治療效果估算方法:一項比較研究。Biom J 59: 967-985。[Ref。]
- Pirracchio R, Petersen ML, van der Laan M(2015)使用超級學習器提高傾向評分估計器對模型錯誤規範的魯棒性。中華流行病學雜誌181:108-119。[Ref。]
- Lee BK, Lessler J, Stuart EA(2010)使用機器學習改進傾向評分權重。Stat Med 29: 337-346。[Ref。]
- Austin PC, Stuart EA(2015)在觀察性研究中使用治療加權逆概率(IPTW)來估計因果治療效果的最佳實踐。Stat Med 34: 3661-3679。[Ref。]
- Austin PC, Stuart EA(2017)在評估治療對生存結局的影響時,存在模型錯誤時,治療加權逆概率和完全匹配對傾向評分的表現。統計方法醫學文獻26:1654-1670。[Ref。]
- Linden A(2017)使用結合傾向評分分層和加權的雙魯棒估計器改進因果推理。評定臨床實用23:697-702。[Ref。]
- Parast L, McCaffrey DF, burgtte LF, de la Guardia FH, Golinelli D等(2017)在TWANG包中優化方差-偏差權衡估計傾向得分。保健服務結果Res方法17:175-197。[Ref。]
- Alam S, Moodie EEM, Stephens DA(2019)傾向評分模型是否超級?綜合程序在因果調整中的效用。Stat Med 38: 1690-1702。[Ref。]
- Franklin JM, Shrank WH, Lii J, Krumme AK, Matlin OS等(2016)觀察與預測:充填的初始模式比高維建模技術更準確地預測長期粘附。衛生服務第51條:220-239。[Ref。]
- Lunt M (2014) Stata修訂中的傾向分析:1.1。[Ref。]
- Setodji CM, McCaffrey DF, burgtte LF, Almirall D, Griffin BA(2017)適合工作的工具:在協變量平衡和廣義增強模型傾向評分之間進行選擇。流行病學28:802 - 811。[Ref。]
- de Menezes SF, Liska GR, Cirillo MA, Vivanco MJF(2017)基於Boosting算法和邏輯回歸的二元響應數據分類。專家係統應用程序69:62-73。[Ref。]
- Griffin GA, McCaffrey D, Almirall D, Setodji C, burgtte L(2017)對改進非參數傾向評分模型的追逐平衡和其他建議。J因果推理5:20150026。[Ref。]
- 劉旭,劉錚,王剛,蔡錚,張輝(2017)集成遷移學習算法。IEEE Access 6: 2389-2396。[Ref。]
- 張穎,董東,徐亮,苗錚,毛偉,等(2018)新型農村合作醫療保險實施10年後的中國醫療衛生公平性:基於全國調查數據的分析。《柳葉刀》392:S35。[Ref。]
- 楊晨,黃誌,孫凱,胡燕,包雪(2018)中國有與無醫療保險2型糖尿病患者經濟負擔比較研究。醫學科學監測24:3098-3102。[Ref。]
- M勇,薛憲軍,李景虎,馮雲雲(2018)中國健康保險對缺血性腦卒中住院患者直接住院費用的影響。健康版442:39-44。[Ref。]
在此下載臨時PDF
文章類型:研究文章
引用:王豔,謝軍,劉旭,杜娟,吳敏等。(2019)治療權重逆概率的Logistic回歸和廣義boosting建模——基於冠心病門診患者的模擬與案例研究。J流行病學公共衛生版4(3):dx.doi。org/10.16966/2471 - 8211.178
版權:©2019王穎等。這是一篇開放獲取的文章,根據創作共用署名許可協議(Creative Commons Attribution License)發布,該協議允許在任何媒體上不受限製地使用、分發和複製,前提是注明原作者和來源。
出版的曆史: