流行病學和公共衛生評論

全文

研究文章
基於關聯規則挖掘的體檢數據庫疾病網絡研究

華陳1 #山胡2 #Zhixiao羅3#局域網唐3.清代曾1曉燕溫1Jiangpeng陳1萍,1本Peng11 * #

1 重慶醫科大學公共衛生與管理學院;醫學與社會發展研究中心;健康社會風險治理創新中心,重慶,中國
2 重慶總醫院預防保健科,重慶,中國
3. 重慶醫科大學第一附屬醫院體檢科,中國重慶
這些作者對這項工作做出了同樣的貢獻。

*通訊作者:彭斌,重慶醫科大學公共衛生與管理學院,中國重慶,電子郵件:pengbin@cqmu.edu.cn


摘要

關聯規則挖掘作為一種在大型數據庫中發現新的、有趣的知識的數據挖掘方法已經得到了很好的研究。本研究利用關聯規則挖掘技術,從體檢數據集中發現人類疾病關聯。這些疾病與疾病之間的聯係通過網絡可視化,這已經成為一種用於理解疾病之間複雜關係的整體方法。結果顯示,在247073名患者中,47%患有血脂異常,24%患有脂肪肝。此外,血脂異常與阻塞性睡眠呼吸暫停綜合征(confidence=0.83, lift=1.76)、異常高穀氨酰基轉移酶(confidence=0.82, lift=1.73)和高粘度(confidence=0.81, lift=1.72)等多種疾病和體征高度相關。在這一研究中發現的最有力的規律是(子宮占位性病變、子宮肌瘤),其置信度為0.99,升力為18.99。同時,提取了一些新的關係。例如,膽囊增大與前列腺增生密切相關。該規則的置信度為0.78,提升率為41.49,這意味著在膽囊腫大的患者中,78%的患者也患有前列腺增生。本文發現了許多新的關聯,其中一些關聯在以往的研究中鮮有報道,甚至有報道,但視角和結果仍不一致。 Therefore, disease association networks are valuable for clinicians and medical researchers to examine the relationships among diseases and physical signs.

關鍵字

疾病協會;疾病網絡;關聯規則挖掘;體格檢查數據庫


簡介

許多研究表明,人類疾病形成了一個相互關聯的格局[1-4]。一對疾病,即使是那些影響不同器官或具有不同症狀的疾病,也可能由於相同基因的功能障礙或其疾病相關蛋白可能在同一途徑起作用而相互關聯[1,3,5]。疾病相關性對疾病的預防、診斷和治療具有重要意義,也有助於相關研究。因此,越來越多的研究者通過觸及疾病關聯概念的醫學數據庫來研究疾病關聯,如遺傳關聯數據庫(GAD)[6]和人類在線孟德爾遺傳數據庫(OMIM)[7],它們通過構建基因關聯或蛋白質-蛋白質關聯[7]來產生疾病-疾病關聯。然而,這帶來了一些偏見。首先,很少有數據庫同時使用綜合組學和生物學文獻語料庫來預測疾病與疾病的關係。雖然一些研究考慮了從文獻中獲得的數據來檢測疾病基因的相關性,但它們隻包括了少數疾病,而不是全部疾病[8-10]。其次,對於心血管疾病、2型糖尿病、癌症等複雜疾病,獲得與疾病相關的基因目錄顯然是不夠的,因為不能僅根據基因型預測表型結果[11,12]。例如,幾個基因的改變可能對特定個體的易感性產生微妙的影響,這使得選擇候選基因或單核苷酸多態性(SNP)[13]變得困難。因此,尋找疾病-疾病關聯研究的新突破點和新方法是必要和重要的。 Association rule mining has been developed to extract high-quality relevant information [14-18]. In this paper, it was creatively used to discover disease associations from varieties of diagnosis based on large physical examination database.

目前,體檢在中國健康管理中所占的比例很高。可以說,在很多城市,健康管理行業基本上隻包含了體檢。體檢作為一種早期發現、早期診斷、早期治療的疾病預防措施,越來越受到人們的歡迎。為了優化體檢流程,提高醫療管理效率,體檢管理係統在醫院和健康管理公司得到了廣泛的應用。隨著體檢數據量的不斷增加,尋找有價值的信息或知識是一項非常有意義的任務,尤其是在大數據時代。然而,目前對體檢數據庫的研究僅限於少數疾病,如血脂異常、脂肪肝等[22,23]。因此,對疾病關聯進行更加多樣化和全球性的研究,從體檢數據庫中發現更多有趣和創新的信息是很重要的。

材料和方法
道德聲明

這些數據來自重慶醫科大學第一附屬醫院,該醫院是數據保護機構。對患者的體檢記錄進行匿名處理後再進行分析。本研究獲得了重慶醫科大學科研倫理委員會的批準。

數據源

本研究共納入重慶醫科大學第一附屬醫院報告的體檢記錄247073份。這些信息包括性別、年齡、血糖、血壓、輻射測試結果和醫療診斷。醫學診斷包含疾病和體征,能反映個體不同的健康問題,從中提取疾病-疾病關聯。

關聯規則挖掘

一種關聯規則,用阿瑪B表示,用來描述那些傾向於一起發生的事件,或反映一個事件和其他事件之間的相互依存和相關性[24]。這裏A或B是一係列事件。因此,如果兩個或多個事件之間存在關聯,我們可以通過其他事件預測其中一個事件。給定一組醫療診斷,關聯規則挖掘的問題是生成支持度和置信度大於或等於用戶指定的最小支持度和置信度水平的規則;這些規則稱為強關聯規則[25]。事件(即疾病)的支持度是數據集中包含該事件的醫療記錄的比例,它度量事件發生的頻率。一條規則a的置信度是B在給定a條件下的條件概率。或者,它是一種關於B在a中出現的陳述,用來衡量一條規則的置信度。另一種常用的關聯規則度量方法被解除,它可以解釋為在規則兩邊都支持的情況下,規則的支持度與在獨立性下期望的支持度的偏差。換句話說,承(A在B)=承(A在B)/承(B)。A lift 1左右意味著A的發生和B在同一交易中的發生是獨立事件,因此A和B不相關。 It is easy to show that the lift is greater than 1 indicates that the strength of the correlation between event set A and set B [26,27].

在本研究中,Apriori算法被用於發現總體疾病-疾病關聯。Apriori算法的核心思想是對數據庫進行多次遍曆。它在搜索空間中使用一種稱為廣度優先搜索的迭代方法,其中k個項目集用於搜索(k+1)個項目集。它標識數據庫中頻繁出現的單個項,並將它們擴展到越來越大的項集,隻要這些項經常出現在數據庫[28]中。關聯規則的挖掘已經提出了各種算法,如AIS算法、Apriori算法、Apriori-tid算法、Apriori- hybrid算法等,但每種算法都存在對數據庫進行各種掃描的共同缺點,其中Apriori算法是應用最廣泛、最經典的關聯規則算法[29]。為了挖掘頻繁和強關聯規則,將最小支持度和最小置信度分別設為0.001和0.2。為了應用關聯規則算法,使用了R-Studio 7.2。

疾病網絡的構建與可視化

這些基於網絡的方法提供了許多很好的可視化模型來研究節點和鏈接方麵的對象之間的關係[30-32]。為了更好地了解各種疾病的關聯關係,根據發現的關聯規則構建疾病網絡。在這些網絡中,一個節點代表一種疾病或一種體征;鏈接表示兩個節點之間的關係。它們使我們能夠全麵了解疾病和身體體征之間的關係。疾病網絡可以用三個基本不變量來表征:度、平均路徑長度和聚類係數,它們分別是與網絡的連通性、大小和密度有關的度量[33,34]。使用Cytoscape可視化疾病網絡,這是一個用於可視化複雜網絡的開源軟件平台[35]。

結果
疾病與體征的關聯規律

在247073名有一種或多種疾病或身體體征的人中,47%患有血脂異常24%的人患有脂肪肝23%的人超重。前20名的常見病和體征見表1。

疾病 頻率 百分比(%)
血脂異常 116310 47.08
脂肪肝 59883 24.24
超重 57204 23.15
高尿酸血 37601 15.22
乳腺增生 37004 14.98
肺紋理 34650 14.02
高血壓 29308 11.86
屈光異常 25960 10.51
不正常的尿液 24458 9.9
痔瘡 22528 9.12
子宮頸糜爛 22485 9.1
拿伯囊腫 20326 8.23
肝囊腫 19969 8.08
高血壓 19829 8.03
肝髒功能障礙 18228 7.38
白內障 15761 6.38
腎囊腫 15176 6.14
糖尿病 12958 5.24
子宮肌瘤 12940 5.24

表1:最常見的20種疾病。

從247073條記錄中,提取出143個常見病或體征,628條規則。在表2中,我們列出了23條關聯規則,其置信度值至少為0.7,提升值至少為1.5。如前所述,這兩個數字用於衡量規則的強度。例如,規則(子宮占位性病變:子宮肌瘤)暗示hystera占位性病變與子宮肌瘤關係密切,可信值為0.99,提升值為18;同樣,規則(肝占位性病變:肝血管瘤)提示肝髒占位性病變與肝血管瘤密切相關,可信值為0.97,提升值為49。這兩條規則表明子宮肌瘤而且肝血管瘤很有可能發生在那些患hystera占位性病變.我們還發現血脂異常為大部分關聯規則的結果集,如表2所示。這可能意味著血脂異常與多種疾病和體征高度相關,在疾病關聯中起著重要作用。

先行詞 順向 支持 信心 電梯
hystera占位性病變 子宮肌瘤 0.039 0.99 19.00
肝占位性病變 血管瘤 0.014 0.97 49.81
腎占位性病變 錯構瘤 0.005 0.96 139.43
主動脈瓣退行性變 心肌病心髒舒張 0.002 0.89 63.88
主動脈瓣退行性變 心室舒張功能 0.002 0.89 63.80
乳腺占位性病變 乳房腫脹 0.007 0.87 82.05
阻塞性睡眠呼吸暫停綜合征 血脂異常 0.007 0.83 1.76
異常高穀氨酰轉移酶 血脂異常 0.022 0.82 1.73
眼底動脈硬化 白內障 0.013 0.81 12.71
超高粘度 血脂異常 0.004 0.81 1.72
肥胖 脂肪肝 0.020 0.80 3.32
錯構瘤 腎占位性病變 0.010 0.79 139.43
左心室增大 心肌病心髒舒張 0.001 0.79 56.61
膽囊腫大 前列腺增生 0.004 0.78 41.49
高度近視 屈光異常 0.038 0.78 7.39
子宮肌瘤 hystera占位性病變 0.040 0.74 19.00
脂肪肝 血脂異常 0.180 0.74 1.58
冠狀動脈硬化性心髒病 高血壓 0.002 0.73 6.16
高ferroprotein 血脂異常 0.005 0.73 1.55
基底動脈血流量減少 血脂異常 0.002 0.73 1.54
肥胖 血脂異常 0.018 0.72 1.53
額擴大 肺紋理 0.012 0.71 5.04
血管瘤 肝占位性病變 0.014 0.70 49.81

表2:疾病關聯規則(置信>0.7,提升>1.5)。

表2中隻顯示了發現的關聯規則的一小部分。為了探究這些規則的強度,我們使用雷達圖來可視化每個規則的置信度和升力值(圖1,1(a))顯示,大多數關聯規則的置信度值大約在0.2到0.6之間,(圖1(b))顯示大多數升力值大約在1到51之間。(圖1(c))同時顯示了標準化置信度值和標準化升力值。標準化值是所有值減去其標準差的平均值。我們可以看到,以下四個規則的標準化升力值比其標準化置信度值更大:風疹⇒皰疹冠狀動脈硬化性心髒病、高血壓性心髒病、腎占位性病變、錯構瘤、錯構瘤、腎占位性病變.這說明左側疾病[26]的患者尤其出現了一種右側疾病。例如,皰疹尤其與風疹,高血壓心髒病尤其與冠狀動脈硬化性心髒病

圖1:(a)置信度,(b)升力和(c)疾病和體征之間關聯規則的標準化置信度和升力值的雷達圖。

網絡分析

關聯規則中的疾病網絡:根據發現的628條關聯規則構建疾病網絡(圖2)。將關聯規則中的右側疾病和左側疾病視為節點,其關聯用Cytospace中的一個鏈接表示。一個節點的顏色是由它的度決定的,度是連接到其他節點的鏈路的數量。度越高的節點顏色越深,這意味著在疾病網絡中可能是一個更重要的樞紐。度最高的五個紅節點分別是血脂異常脂肪肝、超重、高血壓而且肺紋理如圖2所示。此外,基本疾病和體征往往位於網絡的功能中心。一些物理標誌在網絡中起著不可或缺的作用,比如血脂異常、超重而且肺紋理

圖2:疾病-物理體征網絡從所有關聯規則。結代表疾病或體征;聯係代表疾病和身體體征之間的聯係。

網絡的結構特性可以通過網絡的平均路徑長度和聚類係數來衡量。平均路徑長度描述了所有可能的網絡節點對沿著最短路徑的平均步數。聚類係數,範圍從0到1,通常用來衡量網絡中節點傾向於聚集在一起的程度;值為1表示每個節點與其他每個節點[36]相連。該網絡的平均路徑長度為2.008,聚類係數為0.613。平均路徑長度為2.008,意味著從一個疾病到網絡中任何其他疾病的距離隻有兩步。因此,我們可以得出結論,疾病和生理體征在網絡中是密切相關的。此外,節點在網絡中的位置大多由節點的程度決定。的節點血脂異常最高的是141分,其次是超重而且脂肪肝同樣是85度。這意味著血脂異常與141種疾病或體征有關;超重而且脂肪肝疾病與85種疾病或體征有關。

為了突出疾病與體征之間的強相關性,提取置信值大於0.6的關聯規則,如圖3所示。從這張圖中,我們可以很容易地找到幾種疾病和身體體征的聯係血脂異常置信值在0.6 ~ 0.85之間。此外,乳房疾病(乳腺增生,乳腺纖維腺瘤,乳腺占位性病變)彼此高度相關,如圖3的左下角所示。

圖3:疾病體征網絡由具有置信度>0.6的關聯規則組成,邊緣標簽為關聯規則的置信度。數值越高,說明相關性越強。

特殊疾病的子網絡

一個聚焦於某一疾病的子網絡,它可以通過涉及該疾病的所有關聯規則來構建。通過疾病的子網絡,人們可以更好地了解其相關疾病之間的聯係。我們挑選了三種疾病,即。高血壓心髒病,動脈硬化而且腎功能異常,分別提取相應的關聯規則構建子網絡(圖4)。三種疾病被限製在關聯規則的左側集合中。高血壓心髒病血脂異常置信為0.59;高血壓心髒病也與動脈硬化而且超重置信值分別為0.56和0.51。因此,在高血壓性心髒病患者中,59%患有高血壓性心髒病血脂異常, 56%的人患有動脈硬化51%的人超重(圖4 (a))。許多疾病都與此高度相關動脈硬化以高度的自信,如白內障,脂肪肝,血脂異常,肺顆粒而且高血壓.在這些疾病中,要注意兩者之間的關係肺紋理而且動脈硬化,這一點沒有得到足夠的重視(圖4(b))。此外,聯想腎功能異常與其他疾病或身體體征很少報道。這項研究發現7種疾病與身體體征有關腎功能異常,包括血脂異常、脂肪肝、高血壓、超重、肺顆粒、腎囊腫而且動脈硬化(圖4 (c))。

圖4:(a)高血壓心髒病,(b)動脈硬化和(c)腎功能異常的子網絡。

值得注意的是,以上三種選定的疾病同時出現在三個網絡上,置信度很高。這種模式反映了它們在三個疾病網絡中的中心位置。此外,動脈硬化在這些疾病網絡中也很活躍;它與高血壓、心髒病和高血壓密切相關腎功能異常

討論

在我們的研究中,我們使用了一種新興的數據挖掘方法,稱為關聯規則挖掘,以構建疾病網絡,以進一步了解疾病關聯。與同類文章[37,38]相比,我們將數據挖掘與網絡相結合,可以發現疾病之間未知的、潛在的關聯。它提供了可能幫助我們了解高危疾病和複發之間的進展模式的見解。但是,關聯規則挖掘不能確定任何時間或因果關係。在今後的研究中,應嚐試將關聯規則與流行病學研究方法相結合。

值得注意的是,我們發現了幾種疾病之間的聯係,其中一些已經得到了很好的確認,而另一些尚未得到證實。例如,我們的結果顯示,85種疾病和身體體征與之相關脂肪肝.在這些關聯中,它們之間的關係高血壓、肥胖、血脂異常而且脂肪肝均得到了前人研究的驗證和國內外專家的認可[39-41]。此外,我們發現脂肪肝有關係脾腫大,前列腺增生,腎功能異常而且腎髒結石.的關係脂肪肝有腎功能異常及腎結石Einollahi B等人研究了[42]。他們的結果顯示,脂肪肝疾病可能是結石形成的一個危險因素,並與腎功能呈負相關。

在我們的研究中,我們共提取了628個關聯規則。然而,在疾病之間發現的許多聯係還沒有得到足夠的重視,如脾腫大,這與脂肪肝而且前列腺增生膽囊腫大。此外,本研究還包含疾病-疾病相關性、疾病-生理體征相關性和生理體征-生理體征相關性。許多研究人員在研究疾病關聯時忽略了身體體征。利用身體體征來徹底了解疾病關聯的想法可能會進一步改善疾病的診斷、預後和治療。

利用關聯規則挖掘方法和圖形網絡揭示疾病與體征之間的關聯模式。關聯規則挖掘是一種從複雜疾病關聯中發現隱含信息的有效方法。我們用支持度、信心度和提升度來評估這些規則的強度。特別是,關聯規則挖掘所提取的關聯具有指導性。每一種疾病都可能是前因和/或後果。例如,有兩個規則反映的關係白內障而且動脈硬化:白內障、動脈硬化,其置信度為0.32,提升度為7.57動脈硬化⇒白內障的可信度為0.48,提升度為7.57。兩個規則的置信度都很高,說明兩者之間的關係很密切動脈硬化而且白內障;這種關係往往比具有高置信值的規則更可靠。此外,由於本研究樣本量大,關聯規則可以更可靠,關聯規則生成的網絡可以提供疾病關聯的顯著特征。但值得注意的是,關聯規則挖掘隻描述了傾向於同時發生的疾病之間的關係;它不能明確地反映因果關係。因此,我們必須結合實驗、調查或分子生物學工具進一步研究有趣的聯係。

致謝

本研究得到國家自然科學基金(No. 81373103)和重慶市科委(No. 81373103)資助。cstc2013jcyjA10009)。本研究使用的體檢資料由重慶醫科大學體檢中心提供。所有基於這些數據的分析、解釋和結論都是作者的個人觀點。

相互競爭的利益

作者聲明他們沒有競爭利益。


參考文獻

  1. Hidalgo C.A, Blumm N, Barabási A.L, Christakis N.A(2009)研究人類表現型的動態網絡方法。公共科學圖書館編譯生物學5:e1000353。[Ref。
  2. 令虎博蘭,Evan S Snitkin,胡振軍,夏雨,Charles De Lisi(2009)從整合的人類功能鏈接網絡中確定疾病基因的全基因組優先級和疾病關聯。基因組生物學10:R91。[Ref。
  3. Rzhetsky Andrey, Wajngurt D, Park N, Zheng T(2007)探索複雜人類表現型的基因重疊。美國國家科學研究院104:11694-11699。[Ref。
  4. Lee DS, Park J, Kay KA, Christakis NA, oltai ZN,等。(2008)人類代謝網絡拓撲對疾病共病的影響。美國國家科學院學報105:9880-9885。[Ref。
  5. 劉春春,曾東濤,李偉,吳春春,Mayzus I,等(2014)基於機製的疾病-疾病連接的綜合web服務器——疾病連接。核酸Res 42: 137-146。[Ref。
  6. Becker KG, Barnes KC, Bright TJ, Wang SA(2004)遺傳關聯數據庫。Nat Genet 36: 431-432。[Ref。
  7. Joanna Amberger, Carol A. Bocchini, Alan F. Scott, Ada Hamosh (2009) McKusick的人類在線孟德爾遺傳(OMIM®)。核酸Res 37: 793-796。[Ref。
  8. Suthram Silpa, Dudley JT, Chiang AP, Chen R, hasttie TJ等(2010)基於網絡的人類疾病相似性分析揭示了多功能藥物靶點的共同功能模塊。公共科學圖書館編譯生物學6:e1000662。[Ref。
  9. Lewis SN, Nsoesie E, Weeks C, Qiao D, Zhang L(2011)全基因組關聯研究對疾病和表型關聯的預測。PLoS One 6: e27175。[Ref。
  10. 孫凱,Joana P Gonçalves, Chris Larminie, natia proulj(2014)通過生物網絡分析預測疾病相關性。生物信息學15:304。[Ref。
  11. Bauer-Mehren A, Bundschus M, Rautschka M, Mayer MA, Sanz F, et al.(2011)基因-疾病網絡分析揭示孟德爾、複雜和環境疾病的功能模塊。PLoS One 6: e20284。[Ref。
  12. Chu JH, Hersh CP, Castaldi PJ, Cho MH, Raby BA,等(2014)複雜疾病的表型網絡分析:方法和在COPD中的應用。BMC Syst Biol 8: 78。[Ref。
  13. 嚴世龍,顧德芳(2004)[關於複雜疾病關聯研究的若幹問題]《醫學報》31:533-537.][Ref。
  14. 王江,戴憲華,項茜,鄧洋洋,馮繼華等(2010)利用關聯規則挖掘識別酵母組蛋白修飾的組合效應。Evol Bioinform Online 6: 113-131。[Ref。
  15. Paul R1, Groza T, Hunter J, Zankl A(2014)通過骨發育不良領域的類關聯規則挖掘推斷特征表型。生物醫學雜誌48:73-83。[Ref。
  16. Schrom JR, Caraballo PJ, Castro MR, Simon GJ(2013)量化通過關聯規則挖掘發現的他汀類藥物在糖尿病前期表型中的作用。美國航空協會:1249-1257。[Ref。
  17. Simon GJ, Schrom J, Castro MR, Li PW, Caraballo PJ(2013)對2型糖尿病風險評估的生存關聯規則挖掘。[Ref。
  18. Lee DG, Ryu KS, Bashir M, Bae JW, Ryu KH(2013)用關聯規則挖掘方法發現年輕急性心肌梗死患者的醫學知識。中華醫學雜誌37:9896。[Ref。
  19. 李文靜(2008)中國體檢現狀與思考。中國衛生事業管理5:351-352。
  20. 黃超燕(2013)異常體檢結果與門診病曆關聯規則挖掘。他42:23 -30。
  21. Li D, Simon G, Chute CG, Pathak J(2013)使用關聯規則挖掘從電子健康記錄中提取表型。AMIA Jt峰會翻譯科學進展18:142-146。[Ref。
  22. 廖先華,曹旭,劉傑,謝曉華,孫豔紅等(2013)廣州地區體檢脂肪肝患病率及特征分析。世界胃腸病學雜誌19:5334-5339。[Ref。
  23. 喬森,葉青,竇玥,李明子,寇玉紅等(2013)體檢人群高血壓及相關危險因素分析。Int J臨床經驗醫學6:785-793。[Ref。
  24. 左,向珂,邢玉奎,王銳(2009)關聯規則挖掘算法綜述。微處理器。
  25. 劉杜宇,楊建軍,鍾碩(2006)關聯規則挖掘研究綜述。成都大學學報。[Ref。
  26. 楊東勳,薑誌勳,樸永培,樸永宰,吳煥燮等(2013)東方醫學關聯規則挖掘與網絡分析。PLoS One 8: e59241。[Ref。
  27. Merceron, Agathe, K. Yacef。(2008)教育數據關聯規則的興趣度度量。物理等離子體21:546。[Ref。
  28. Kumbhare, Trupti A, SV Chobe(2014)關聯規則挖掘算法綜述。國際計算機科學與信息技術學報5:927-930。[Ref。
  29. Pooja Agrawal, Suresh kashyap, Vikas Chandra Pandey, Suraj Prasad Keshri(2013)各種形式的Apriori關聯規則挖掘方法綜述。國際計算機與通信最新與創新趨勢雜誌1:462-468。[Ref。
  30. Jha, Ish Nath(2013)關聯規則挖掘技術分析。計算機科學基礎CCSN2012: 40-45。[Ref。
  31. 吳霞,馬哈桑,陳建勇(2014)蛋白質組學中的通路與網絡分析。中國生物學雜誌362:44-52。[Ref。
  32. O 'Neil, Serena E, Babusyte A, Krisiukeniene A, StravinskaiteBieksiene K,等(2011)哮喘支氣管的定量蛋白質組學網絡分析:吸入糖皮質激素治療的效果。呼吸Res 12: 124。[Ref。
  33. 付新軍,王錚,曲燕,王萍,周燕,等。基於關聯規則挖掘的中藥材“性質-科係成分”網絡研究。中華綜合醫學雜誌19:663-667。[Ref。
  34. Barajas Ramirez JG(2005)複雜網絡:拓撲、動力學和同步。DAAD撥款研究方案:1-42。[Ref。
  35. Barabási A, Gulbahce N, Loscalzo J(2011)網絡醫學:一種基於網絡的人類疾病治療方法。Nat Rev Genet 12:56 -68。[Ref。
  36. Su G, Morris JH, Demchak B, Bader GD (2014) Cytoscape生物網絡探索3。生物信息學47:8.13.1 - 8.13.24。[Ref。
  37. Khan A, Srinivasan U, Uddin S(2017)從基線網絡了解慢性疾病共病:利用管理醫療數據的知識發現。澳大利亞計算機科學周會議ACM 57[Ref。
  38. Khan A, Srinivasan U, Uddin S(2016)在醫療保健數據中應用圖論和社會網絡度量:了解慢性疾病進展的新框架。1 - 7。[Ref。
  39. 惠娥,徐安,楊海紅,林克鬆(2013)肥胖作為非酒精性脂肪肝和糖尿病的共同土壤:脂肪因子的作用。中華糖尿病雜誌4:413-425。[Ref。
  40. Ryoo JH, Suh YJ, Shin HC, Cho YK, Choi JM,等(2014)非酒精性脂肪肝與高血壓發展的臨床關係。中華消化內科雜誌29:1926-1931。[Ref。
  41. Kim EJ, Kim BH, Seo HS, Lee YJ, Kim HH,等(2014)全身炎症加重的膽固醇性非酒精性脂肪肝和動脈粥樣硬化。Plos One 9: e97841。[Ref。
  42. Einollahi B, Naghii MR, Sepandi M(2013)非酒精性脂肪肝(NAFLD)與尿石症的相關性。箴言47:27 -32。[Ref。

在此下載臨時PDF

PDF

條信息

文章類型:研究文章

引用:陳宏,胡鬆,羅錚,唐磊,曾強等(2017)基於關聯規則挖掘的體檢數據庫疾病網絡研究。J流行病學公共衛生版2(6):doi http://dx.doi.org/10.16966/2471-8211.157

版權:©2017陳浩等。這是一篇開放獲取的文章,根據創作共用署名許可協議(Creative Commons Attribution License)發布,該協議允許在任何媒體上不受限製地使用、分發和複製,前提是注明原作者和來源。

出版的曆史:

  • 收到日期:2017年10月20日

  • 接受日期:2017年11月07

  • 發表日期:2017年11月13日