病毒學與新發疾病- Forschen

全文

研究文章
基於NS5B區域的丙型肝炎病毒分子進化研究

Amjesh R1、2 *Achuthsankar S Nair1克ydF4y2BaSugunan VS1克ydF4y2Ba

1克ydF4y2Ba印度喀拉拉邦大學計算生物學和生物信息學係
2印度特裏瓦南塔普蘭的帕拉亞拉姆大學學院動物學係

*通訊作者:印度喀拉拉邦大學計算生物學和生物信息學係,電子郵件:amjesh@gmail.com


摘要

丙型肝炎病毒(HCV)感染是導致肝硬化和肝細胞癌的主要健康問題。據估計,全世界有超過2.7億至3億人感染了這種病毒。HCV是一種陽性意義的單鏈RNA病毒,利用其自身的RNA依賴RNA聚合酶(RdRp)在肝細胞的細胞質內複製。RdRp沒有讀取證據的能力,因此產生病毒的突變體,導致慢性感染,最終導致肝細胞癌。這種突變產生了幾種基因型、亞型、品係和變異,在疾病結局方麵有顯著差異。突變率因基因型、亞型、菌株甚至基因組的不同部位而異。然而,異質性的程度通常是適度的,因此可以計算出分化時間的估計。變異的進化似乎受到宿主的遺傳組成和免疫反應的影響,並具有地理意義。我們利用係統發育分析和計算分子年代測定技術得出結論,其祖先基因型為7a,起源於363年前的加拿大。分子定年是基於這樣一個事實,即所有進化譜係的突變速率隨著時間的推移是恒定的。 Surprisingly, our analyses show that genotype 1d isolated from Canada 5 is the most recent with an evolutionary date of just 33 years. It is evident that HCV is still an emerging virus and demographical parameters seem to have a very strong influence in its evolution. We believe that this emphasizes the need for developing drugs that are customized to act against strains that evolve and become geographically endemic.

關鍵字

丙型肝炎病毒;依賴RNA的RNA聚合酶;分子進化;進化距離。


簡介

盡管丙型肝炎病毒在25年前就被發現了,但由於沒有發現與之密切相關的病毒,其起源一直不明確。它隻感染人類,在實驗條件下黑猩猩也會感染。了解其進化史將有助於洞察其致病性,預測其未來的進化趨勢將有助於製定管理新出現的病毒毒株的戰略。了解病毒的起源和進化非常重要,因為它不僅對這種疾病,而且對其他病毒性疾病都具有重要的醫學意義。通過計算分子定年技術對病毒的進化進行年表記錄也將有助於追蹤病毒的起源。對病毒多樣性的了解將有助於確定長期慢性感染的適當治療方案,以及開發成功的抗病毒藥物。分子定年方法也可以外推來預測病毒新毒株的進化。

一個類似的假設是HIV的情況,它被認為是從恒河猴[1]傳播給人類的。與這些猴子生活密切的非洲部落,也將它們作為生的或未煮熟的食物食用,被認為是第一批感染艾滋病毒的人。根據這一觀察結果,許多攻擊人類的病毒被認為是從密切相關的動物或其他低等生物傳播的。最近新出現的病毒在不同種類的生物體中傳染給人類,如禽流感病毒、豬流感、猴熱等,都是加強這些觀察的典型例子。雖然有可能發生跨物種的傳播,從黑猩猩到人類,有能力感染黑猩猩的事實支持(實驗證明),但沒有這樣的發生率或線索的自然傳播的報道或證明。

但是Kapoor等人[2]報道了一種屬於屬的單鏈RNA病毒Hepacivirus感染人類非常親密的朋友“狗”,並導致狗肺部感染。這些病毒被稱為犬hepacivirus(CHV)與HCV有同源序列。這一信息為了解HCV的起源開辟了新的途徑。Kapoor等人也對CHV的全基因組進行了測序。CHV及其與HCV同源性的發現非常有趣,足以促使人們尋找HCV相關基因型的存在,從而將其與CHV或任何其他祖先病毒聯係起來。這是通過對數據庫中可用的不同基因型和亞型的分子年代測定研究完成的。這項工作的主要目的是通過從目前所有可用的序列中回溯當前HCV基因型的前身來確定HCV的祖先基因型。

材料與方法
NS5B基因

確定丙型肝炎病毒的基因型對適當的疾病管理至關重要。它還有助於監測該病毒的流行病學趨勢和生物學特征。為了確定病毒的基因型和亞型,需要進行全基因組測序和測序後分析。某些保守區域如核、包膜和NS5B的核苷酸序列也被用於HCV[3]基因型。進化關係也與這些區域的核苷酸序列有關。

序列數據的彙編

為了找到HCV的祖先基因型,我們選取了所有可用基因型的NS5B區。使用洛斯阿拉莫斯國家安全局、美國能源部國家核安全局[4]操作的序列搜索接口從HCV序列數據庫中收集NS5B基因序列。選擇了65個序列(每個可用子類型中的單個序列),並從Genbank中以FASTA格式下載。這些基因的采樣日期、采樣國家和基因識別號如表1所示。從Genbank(登錄代碼:JF744991)中檢索CHV全基因組,用於追蹤與HCV的進化關係。

Sl。 樣本地理位置 取樣日期 加入不。 基因索引號 基因型
1克ydF4y2Ba 柏林 2001 AF037244 胃腸道| 3170059 二維
2 喀麥隆 1995 L38361 胃腸道| 1066643 1 e
3 gydF4y2Ba 喀麥隆 1998 AY257087 胃腸道| 30525610 1 h
4 gydF4y2Ba 喀麥隆 1998 AY257091 胃腸道| 30525618 1 l
5 喀麥隆 2003 AY265435 胃腸道| 30385487 4 e
6 喀麥隆 1995 L29596 胃腸道| 476675 4 f
7 喀麥隆 2004 AY743211 胃腸道| 54632752 4 k
8 喀麥隆 1998 AY265429 胃腸道| 30385475 4 p
9 喀麥隆 1998 AY265430 胃腸道| 30385477 4 t
10 加拿大 2007 EF115984 胃腸道| 134038120 1 c
11 加拿大 2007 EF115989 胃腸道| 134038130 1 d
12 加拿大 2007 AY434129 胃腸道| 38147572 1 j
13 加拿大 2007 AY434113 胃腸道| 38147545 1 k
14 加拿大 2007 EF116024 胃腸道| 134038200 2 e
15 加拿大 2007 AY754634 胃腸道| 54610706 2米
16 加拿大 2007 EF116059 胃腸道| 134038270 2 r
17 加拿大 2000 AF279121 胃腸道| 9230780 3 b
18 加拿大 2007 EF116087 胃腸道| 134038326 3 g
19 加拿大 2000 AF279120 胃腸道| 9230778 3 h
20. 加拿大 2007 AY434138 胃腸道| 38147587 3我
21 加拿大 2007 EF116138 胃腸道| 134038428 4 b
22 加拿大 2007 EF116139 胃腸道| 134038430 4 l
23 加拿大 2007 AY434126 胃腸道| 38147567 4問
24 加拿大 2007 EF116196 胃腸道| 134038544 6 e
25 加拿大 2007 EF116156 胃腸道| 134038464 6小時
26 加拿大 2007 EF116159 胃腸道| 134038470 6 l
27 加拿大 2007 AY894524 胃腸道| 60477635 6 o
28 加拿大 2007 EF116153 胃腸道| 134038458 6 r
29 加拿大 2007 EF116169 胃腸道| 134038490 6 s
30. 加拿大 2007 AY434115 胃腸道| 38147548 7一個
31 中國 2002 AY834974 胃腸道| 56123633 2 f
32 中國 2002 AY834938 胃腸道| 56123561 6 k
33 中國 2002 AY834939 胃腸道| 56123563 6 n
34 埃及 2002 EF694452 胃腸道| 158146862 1克
35 埃及 1999 AB103457 胃腸道| 40714114 4
36 埃及 2002 EF694517 胃腸道| 158146992 4米
37 埃及 2002 EF694422 胃腸道| 158146805 4 o
38 法國 1999 AF515988 胃腸道| 29365804 1 b
39 法國 1996 L48495 胃腸道| 1237395 1我
40 法國 1999 AF515981 胃腸道| 29365790 2攝氏度
41 法國 1997 AF515968 胃腸道| 29365764 2我
42 法國 2006 DQ220919 胃腸道| 82704304 2 j
43 法國 2005 AJ291258 胃腸道| 11322297 4 d
44 法國 2005 AJ291249 胃腸道| 11322279 4 h
45 法國 2004 AY743101 胃腸道| 54632532 4 n
46 加蓬 1995 L29614 胃腸道| 476686 4攝氏度
47 加蓬 1995 L29618 胃腸道| 476688 4 g
48 幾內亞 2001 AF037235 胃腸道| 3170041 1米
49 日本 2008 D10648 胃腸道| 221674 2
50 老撾 2004 AY735101 胃腸道| 52547281 6問
51 馬提尼克島 2004 AY257465 胃腸道| 30720399 2 l
52 緬甸 2007 AB103135 胃腸道| 47826476 6米
53 巴基斯坦 2009 AB444475 胃腸道| 225380383 3 k
54 南非 2001 DQ164544 胃腸道| 76576168 5
55 台灣 1993 DQ666241 胃腸道| 110430931 2 b
56 台灣 2005 DQ663603 胃腸道| 111082412 3
57 泰國 1999 AB027610 胃腸道| 6136892 6攝氏度
58 泰國 2006 DQ640386 胃腸道| 109676985 6 f
59 泰國 2006 DQ640367 胃腸道| 109676947 6我
60 泰國 1999 AB027608 胃腸道| 6136888 6 j
61 烏幹達 2006 AY577585 胃腸道| 48995479 4 r
62 我們 1984 AF268586 胃腸道| 13344980 1
63 烏茲別克斯坦 2002 AB081066 胃腸道| 22122154 2 k
64 越南 2006 DQ155517 胃腸道| 73765290 6 d
65 越南 2006 DQ155504 胃腸道| 73765264 6 p

表1:本研究包括HCV NS5B區域的詳細信息。

進化距離計算

進化距離是通過跟蹤在不同時間采樣的核苷酸序列之間的變化數量得到的[5,6]。成對距離測量給出了根據核苷酸取代數的進化距離估計。

利用MEGA軟件[8]實現的木村2參數[7]計算遺傳距離。這是通過估計核苷酸序列的躍遷和橫轉差異來完成的。過渡型試圖得到嘌呤和嘧啶的區別(T↔C, A↔G)。對後一種情況,它計算其中一種嘌呤和一種嘧啶的距離(T↔a, T↔G, C↔a, C↔G)。計算方法定義如下式。

\ [K = - \壓裂{1}{2}lo {g_e} \{\離開(1 - {\ rm {}} {2 p - Q {\ rm {}}} \) \ sqrt {1 - 2 Q \}} \]

這兩個序列的核苷酸轉位和轉位位點的部分用P和Q表示。

係統發育分析

係統發育分析被用來估計生物群之間或物種內部的進化關係。進化關係通常被描述為樹狀圖,稱為係統發生樹。所有65個序列對齊後使用Clustal W[9]轉換為PHYLIP格式。由於發現HCV的突變率很高,因此使用PHYLIP包[10]中實現的DNA簡約(Dnapars)程序構建了HCV樹。Dnapars假設不同的譜係是獨立進化的。為了驗證係統發育樹的可靠性,使用Seqboot程序進行了1000次引導重采樣試驗。它生成的是樹的集合,而不是對最優樹的點估計。由於這種沒有測量可靠性的樹不是特別有幫助,我們使用Consense程序從Dnapars的樹文件中構建了共識樹。這棵樹是由程序Drawgram繪製的。然後,通過追溯HCV進化開始的假設基因序列,計算HCV的祖先基因型。

分子的約會

係統發生樹各節點的假設祖先序列由Phylip中實現的Dnaml程序估計。然後利用MEGA 4中實現的鄰域連接樹和最小進化樹估計各品係與祖先序列的距離。平均距離然後估計距離值從MEGA鄰居連接樹和

最小進化樹。分子日期通過校準率(每年每個位點的核苷酸替換)對遺傳距離進行簡單的分割來估計。HCV核苷酸取代率估計為0.67*103每個站點每年[11]。

估計HCV與CHV的進化關係

由HCV所有65個NS5B區域和CHV全基因組組成的新序列數據集進行多重序列比對。到目前為止,隻有CHV的核心、NS3和多蛋白區域被分離和測序,這些區域在Genbank中可用。在本研究中,使用HCV全基因組進行分析。這些對齊文件被用於預測2.2.3中提到的進化距離。利用MEGA軟件[12]實現的Neighbor-Joining方法構建了係統發育樹。

結果

利用HCV NS5B區所有現有序列數據計算HCV的進化距離,如表2所示。使用鄰居連接方法和最大進化樹推斷的進化曆史如圖1和圖2所示。這些樹是按比例繪製的,其分支長度與用來推斷係統發育樹的進化距離的單位相同。從這些樹的所有品係到它們最近的共同祖先的距離被記錄下來。由於NJ樹和ME樹的差異很大,因此采用兩種方法對結果進行驗證。NJ距離和ME距離有微小的變化,因此取平均值來估計散度時間。使用鄰居連接樹的均值和最大進化樹計算的發散時間如表2所示。

圖1:基於HCV NS5B區域的鄰居連接樹。

圖2:基於HCV NS5B區域的最大進化樹。

Sl。 基因型 加入不。 新澤西* Dist。 我* Dist。 平均值 散度的時間
1克ydF4y2Ba 二維 AF037244 0.057 0.036 0.047 70
2 1 e L38361 0.068 0.086 0.077 115
3 gydF4y2Ba 1 h AY257087 0.093 0.096 0.095 142
4 gydF4y2Ba 1 l AY257091 0.056 0.026 0.041 61
5 4 e AY265435 0.031 0.026 0.028 42
6 4 f L29596 0.071 0.042 0.056 84
7 4 k AY743211 0.044 0.021 0.032 47
8 4 p AY265429 0.027 0.026 0.026 39
9 4 t AY265430 0.064 0.053 0.058 87
10 1 c EF115984 0.061 0.031 0.046 68
11 1 d EF115989 0.030 0.015 0.023 33
12 1 j AY434129 0.046 0.020 0.033 49
13 1 k AY434113 0.054 0.026 0.040 60
14 2 e EF116024 0.109 0.096 0.103 153
15 2米 AY754634 0.085 0.075 0.080 119
16 2 r EF116059 0.086 0.057 0.072 107
17 3 b AF279121 0.068 0.064 0.066 98
18 3 g EF116087 0.069 0.042 0.055 83
19 3 h AF279120 0.174 0.132 0.153 228
20. 3我 AY434138 0.120 0.086 0.103 154
21 4 b EF116138 0.088 0.069 0.078 117
22 4 l EF116139 0.039 0.021 0.030 44
23 4問 AY434126 0.062 0.052 0.057 86
24 6 e EF116196 0.040 0.031 0.035 53
25 6小時 EF116156 0.081 0.058 0.069 103
26 6 l EF116159 0.101 0.053 0.077 115
27 6 o AY894524 0.098 0.098 0.098 146
28 6 r EF116153 0.072 0.047 0.059 89
29 6 s EF116169 0.014 0.097 0.056 83
30. 7一個 AY434115 0.217 0.270 0.243 363
31 2 f AY834974 0.059 0.047 0.053 79
32 6 k AY834938 0.096 0.080 0.088 131
33 6 n AY834939 0.117 0.074 0.096 143
34 1克 EF694452 0.069 0.047 0.058 86
35 4 AB103457 0.043 0.036 0.040 59
36 4米 EF694517 0.067 0.059 0.063 94
37 4 o EF694422 0.063 0.052 0.058 86
38 1 b AF515988 0.050 0.047 0.048 72
39 1我 L48495 0.072 0.042 0.057 85
40 2攝氏度 AF515981 0.055 0.058 0.056 84
41 2我 AF515968 0.062 0.047 0.054 81
42 2 j DQ220919 0.066 0.031 0.048 72
43 4 d AJ291258 0.052 0.063 0.058 86
44 4 h AJ291249 0.043 0.036 0.040 59
45 4 n AY743101 0.087 0.063 0.075 112
46 4攝氏度 L29614 0.048 0.042 0.045 67
47 4 g L29618 0.076 0.086 0.081 120
48 1米 AF037235 0.031 0.026 0.028 42
49 2 D10648 0.051 0.015 0.033 50
50 6問 AY735101 0.128 0.114 0.121 181
51 2 l AY257465 0.116 0.079 0.098 146
52 6米 AB103135 0.111 0.042 0.076 114
53 3 k AB444475 0.140 0.097 0.118 177
54 5 DQ164544 0.166 0.138 0.152 227
55 2 b DQ666241 0.088 0.058 0.073 108
56 3 DQ663603 0.124 0.097 0.111 165
57 6攝氏度 AB027610 0.104 0.098 0.101 151
58 6 f DQ640386 0.082 0.058 0.070 104
59 6我 DQ640367 0.041 0.026 0.033 49
60 6 j AB027608 0.064 0.052 0.058 87
61 4 r AY577585 0.069 0.058 0.063 95
62 1 AF268586 0.050 0.036 0.043 65
63 2 k AB081066 0.076 0.081 0.078 117
64 6 d DQ155517 0.056 0.036 0.046 69
65 6 p DQ155504 0.082 0.042 0.062 92

表2:HCV的鄰居連接(NJ)距離、最大演化、平均距離和發散時間。

根據以上資料,推測該基因型為7a (Accession No。AY434115)大約起源於363年前的加拿大。基因型1d (Accession No.;EF115989)似乎是一個從加拿大分離的新/仍在出現的毒株,其進化時間計算為33年。使用相同的數據集以及CHV的全基因組進行了另一組係統發育分析。令人驚訝的是,結果顯示CHV在基因上更接近於基因型7a,這被解釋為HCV的祖先基因型。毫不奇怪,基因型7a是加拿大的流行菌株。圖3清楚地顯示了HCV基因型7a與CHV的關係。

圖3:描述HCV和CHV之間係統發育關係的無根極大似然樹。HCV基因型7a和CHV用紅色標記。

討論

盡管醫學取得了巨大的進步,但人類仍無法通過藥物來戰勝病毒感染的禍害。自然免疫是克服病毒感染的唯一途徑。任何聲稱有效的藥物或治療程序都是通過增強或幫助免疫係統克服病毒感染而起作用的。

在致病性病毒與人類免疫係統之間的戰鬥中,病毒采取的一種有效策略是不斷進化為新的物種或品係。這種物種或毒株被稱為"新發/新發病毒種/毒株",所引起的疾病被定義為新發病毒病。

新報告的幾種疾病,如禽流感(H5N1)、豬流感(H1N1)、猴熱(Kyasanur森林病)等,都是由新出現的病毒引起的疾病的例子,這些病毒具有從一個屬傳染到另一個屬,特別是傳染給人類的驚人能力。

然而,目前這些新出現的病毒還沒有成功地從一個人傳播到另一個人,或者即使它們傳播了,它們也被削弱到在這種跨人感染中不會造成傷害的程度。

丙型肝炎病毒是最可怕的新興病毒之一,盡管它在1990年被發現和描述,但迄今為止一直逃避所有類型的醫療幹預。來自這部分研究的數據表明,HCV也有一個從狗到人的跨屬感染階段,並在大約363年前進化為一種新興病毒,這在進化時間中是一個極短的時期。它現在是一種新興病毒,具有不斷進化的傾向,從而擊敗所有已知的治療過程和免疫係統的防禦機製。

因此,研究出HCV的進化路徑是非常重要的。在這項研究中,使用了現有的數據,得出了合乎邏輯和科學的結論,即人類丙型肝炎病毒起源於大約363年前感染人類的跨屬毒株(犬轉人)[13]。

基因型7a (Accession no.;AY434115)大約在363年前起源於加拿大的狗。基因型1d(登錄號;EF115989)是最近出現的一個,它們的進化日期被校準為33年。在1995年的一份早期報告中,J Mellor等人使用貝葉斯分析提出HCV基因型在大約300-400年前進化[14]。本研究的結果也與梅勒的報告吻合得很好,更加科學和現實。

因此,這項研究證明了HCV是從CHV進化而來的,獲得了通過它們最好的伴侶“狗”傳播給人類的能力,後者進化成一種獨特的病毒物種,可以在人與人之間傳播,唯一的障礙是它需要血液接觸。

它是否會繼續發展,並出現危險的壓力,越過這一障礙,是一個有效但危險的命題。這種情況突出表明,需要確定新的藥物和治療程序,最終成功地徹底根除病毒。

確認

作者非常感謝喀拉拉邦大學計算生物學和生物信息學係生物信息學研究團隊成員的討論和建議,他們的討論和建議有助於完成這項工作。


參考文獻

  1. AL Chenine, F Ferrantelli, R Hofmann-Lehmann, MG Vangel, HM McClure, et AL .(2005)“年齡較大的恒河猴嬰兒比新生兒更容易口腔感染猴-人免疫缺陷病毒88.6 p”。中國生物技術學報(英文版)[Ref。
  2. A Kapoor, Simmonds P, Gerold G, Qaisar N, Jain K,等(2011)“一種犬類丙型肝炎病毒同係物的表征”。中國科學院學報108:11608-11613。[Ref。
  3. Stuyver L, Wyseur A, van Arnhem W, Lunel F, Laurent-Puig P等人(1995年)“對不可分型樣本進行5′-UR/核心線探針測定和分子分析的丙型肝炎病毒基因分型”。病毒版本38:137-157。[Ref。
  4. K Yusim, Richardson R, Tao N, Dalwani A, Agrawal A,等(2005)洛斯阿拉莫斯丙型肝炎免疫數據庫。應用生物信息學4:217-225。[Ref。
  5. Ogata N, Alter HJ, Miller RH, Purcell RH(1991)丙型肝炎病毒H株的核苷酸序列和突變率。美國科學院學報88:3392-3396。[Ref。
  6. Abe K, Inchauspe G, Fujisawa K(1992)從一名在日本非甲、非乙型肝炎流行期間感染肝炎的患者中分離的丙型肝炎病毒的基因組特征和突變率。中國生物技術學報(英文版)[Ref。
  7. 通過核苷酸序列的比較研究估計堿基取代進化速率的一種簡單方法。J Mol Evol 16: 111-1120。[Ref。
  8. Tamura K1, Dudley J, Nei M, Kumar S (2007) MEGA4:分子進化遺傳學分析(MEGA)軟件4.0版本。Mol Biol Evol 24: 1596-1569。[Ref。
  9. Larkin MA, Blackshields G, Brown NP, Chenna R, McGettigan PA,等人(2007)Clustal W和Clustal X 2.0版本。生物信息23:2947-2948。[Ref。
  10. J Felsenstein (2005) PHYLIP(係統發育推斷包)由作者分發,“華盛頓大學基因組科學係,西雅圖。”
  11. Y Tanaka, Hanada K, Mizokami M, Yeo AE, Shih JW, et al.(2002)美國和日本丙型肝炎病毒分子鍾的比較預測未來20年美國的肝細胞癌發病率將增加。美國科學院學報99:15584-15589。[Ref。
  12. 齊頭N, Nei M(1987)鄰接法:一種重建係統發生樹的新方法。Mol Biol Evol 4: 406-425。[Ref。
  13. Revikumar A, Nair AS, Sugunan VS(2011)丙型肝炎病毒的地理和時間起源與演化。Nat prec。[Ref。
  14. Mellor J, Holmes EC, Jarvis LM, Yap PL, Simmonds P(1995)不同地理區域丙型肝炎病毒序列多樣性模式的調查:對病毒分類的影響。J Gen virus 76: 2493-2507。[Ref。

在此下載臨時PDF

PDF

條信息

Aritcle類型:研究文章

引用:Amjesh R(2017)基於NS5B區域的丙型肝炎病毒分子進化研究。J新興疾病病毒3(3):doi http://dx.doi。org/10.16966/2473 - 1846.137

版權:©2017 Amjesh R,等人。這是一篇開放獲取的文章,根據創作共用署名許可協議(Creative Commons Attribution License)發布,該協議允許在任何媒體上不受限製地使用、分發和複製,前提是注明原作者和來源。

出版的曆史:

  • 收到日期:2017年11月14日

  • 接受日期:11月28日

  • 發表日期:04 12月2017