圖1:經典中心法則:DNA, mRNA,蛋白質(monicistronic)。
全文
Stephen Winters-Hilt*
美國新倫敦康涅狄格學院計算機科學係*通訊作者:Stephen Winters-Hilt,康涅狄格學院計算機科學係,新倫敦Mohegan大街270號,美國康涅狄格州06320電子郵件:swinters@conncoll.edu
真核轉錄組分析使用BLAST驗證的來自Genbank的mrna。每個mRNA轉錄本都用一個簡單的ORF查找器進行遍曆,在正向讀取時有三個幀傳遞,在反向補充讀取時有三個幀傳遞。通過這樣做,我們得到了真核核酸(轉錄組)序列的編碼重疊拓撲分析,與之前的原核核酸(dsDNA基因組)序列分析相似(在附錄中總結)。原核基因組的反向幀傳遞是必要的,因為序列信息隻是參考ssDNA鏈,需要反向補充ssDNA的第二個三向幀傳遞來完成實際的dsDNA原核基因組。當對真核轉錄本進行反向幀傳遞時,可以看到重疊編碼拓撲,就像在無內含子的原核基因組中看到的那樣。即使真核轉錄本中的反義重疊編碼是完全無功能的,它也表明一個無內含子的古生菌/原核生物進化人工產物與病毒真核發生假說一致(概述在附錄中)。在討論中,一些真核生物的反向補體轉錄本編碼被認為具有功能性,因為它們有很長的miRNA信號區域,這表明真核生物中依賴RNA的RNA聚合酶可能具有非rnai作用。
轉錄組分析;RdRp;信息學;病毒Eukaryogenesis;RNAi;基因內區最早
已知健康的真核細胞具有依賴RNA的RNA聚合酶(RdRp’s)[1-8]。特化RdRp在sirna產生中的原生作用已經被廣泛了解[1-4],特別是在植物轉錄組的分析[1,3,4]。研究發現,植物有規律地使用RdRp來擴增siRNA,用於RNAi防禦過程[4](可能是轉座子控製的基本機製)。rdrp控製在轉錄後基因沉默(作為比例限製因子)中的複雜作用也已被證實,如N. crassa和D. melanogaster[9-11]。然而,自20世紀80年代初以來,真核生物中RdRp的研究一直很複雜,因為在許多情況下,它們的來源可以簡單地歸因於病毒起源[12]。一些生物中RdRp真核來源之謎的一部分被發現隻是RdRp由現有的依賴dna的RNA聚合酶(DdRp)誘導而來,正如在越來越多的生物[1]中發現的那樣(也有一些情況下,RdRp可以通過轉錄因子控製[2]發揮DdRp的作用)。Pol II是一個可以轉變為RdRp的DdRp的例子,就像在植物中看到的那樣。在人類中,Pol II RdRp活性允許新的調節機製[13]。在酵母(S. cerevisiae)中,Pol II甚至參與了轉錄激活複雜早期階段的基因環拓撲結構,其中Pol II DdRp在激活時結合並並放置轉錄啟動子端和終止子端,這表明轉錄單元的兩端必須通過在轉錄開始[14]時與Pol II進入一個環配置來正確識別。
RdRp的作用可能在許多方麵對真核生物至關重要,包括強健發育,一些植物需要RdRp才能健康、有競爭力的生長[3]。同樣,酵母(S. pombe, N. crassa, S. cerevisiae)和低等真核生物(C. elegans, A. thaliana, D. melanogaster)也具有RdRp活性[9-11]。RdRp在大鼠腦細胞[15]和兔網狀細胞[16]中也有活性報道。在對蠑螈[8]的研究中,觀察到一種具有RdRp性質的進化保守酶活性,但不包括RdRp II或III。在蝙蝠中,甚至似乎出現了一個從病毒[5]“最近”采用RdRp基因的實例。即使之前的蝙蝠RdRp非病毒來源,也有許多實例被認為是存在的,即真核生物中的酶被(更好的)病毒對應物[17]所取代。
在布氏錐蟲(引起非洲昏睡病的單細胞寄生蟲動質體)中有大量RdRp活性的記錄[18,19]。在布魯氏菌中發現了許多基因的mrna的負鏈,包括:細胞色素b,細胞色素氧化酶I,細胞色素氧化酶III和MURF 2[19],表明顯著的RdRp活性導致反義轉錄產物的產生。這是一個反義編碼與已經存在的正義編碼產生的轉錄重疊的例子。消極意義鏈的進一步指示使用,例如,與參考“積極”轉錄本相關的反向補體編碼,在結果中進行了描述。討論了這對真核生物中的RdRp處理、剪接體處理和病毒起源的影響(前麵的兩種方法可能已經介紹過)。
最後的真核生物共同祖先(LECA)與病毒真核發生
Iyer LM等人在[6]的研究中描述了真核生物中RNA聚合酶可能的古代病毒起源,假設古代細胞係中RdRp的丟失在後來的真核細胞係中從病毒中恢複,以獲得細胞質RNAi支持(通過核生產)。RdRp過程在原真核細胞係的胞漿和細胞核中都有可能被引入通過假設形成原真核細胞核的病毒內共生體,例如,RdRp的采用可能是假設的病毒真核發生事件本身的殘餘。許多關鍵的核酸處理酶的起源,特別是核酸處理方法的轉移,似乎主要是由病毒將它們的方法轉移到細胞宿主,很少有其他方法轉移到[17]。也許剪接體在起源上也是病毒,或者至少與古代的古菌/原核生物宿主共同進化。然而,如果是後者,我們會期望在古菌/原核生物中看到剪接體活動,但沒有證據證明這一點。因此,更簡單的假設是,假設病毒起源的核酸處理方法列表,如RdRp, mRNA capping,和mRNA聚腺苷酸化,也包括剪接體機製。支持這一觀點的細節包括spliceosomal內含子(例如,不是自我剪接的I組和II組內含子)在原核生物或古生菌中看不到,但在大到足以幹擾複雜性[20]的病毒中看到,其中巨型病毒科病毒包括比某些細胞基因組更大的病毒基因組[20-22]Mollivirus(感染Acanthamoeba例如,約有4%的基因帶有spliceosomal內含子。
以病毒為基礎的將病毒分子(包括病毒基因組)傳遞到目標細胞核的生物分子機製得到了充分的研究,因為這是所有真核病毒的基本特征[23-29],但例外的是那些通常非常小的病毒,它們在有絲分裂期間進行攻擊,當時核膜被暫時拆卸(例如,細小病毒隻有大約5000個堿基長)[23-29]。所以,核運輸的病毒機製是眾所周知的它可能在互惠共生的環境中普遍存在並被吸收,一個宿主細胞有多個大病毒和多個原核內端共生體可能存在於一個原真核生物中就像現在的阿米巴變形蟲一樣。病毒控製進入大型細胞宿主[20]中的現代真核核膜[23-29]或可能的另一種病毒的核樣包膜;病毒控製剪接體[30,31]和病毒編碼剪接體分子[20,32]以優化處理需要剪接體處理的病毒編碼基因[20,32],都為真核細胞中剪接體可能的病毒起源奠定了基礎。
在非病毒真核發生假說中,關於剪接體起源的標準假設是,它是從原核內共生體導入的自剪接內含子(第I組和第II組)進化而來。在病毒真核發生的背景下,也有人認為剪接體的這種非病毒起源[33]。這裏提出的結果似乎有利於a病毒剪接體的起源通過病毒真核發生假說。結果表明,當非核基因組信息被“采用”時,原核膜中存在一個可操作的剪接體,例如,在原真核生物攝取非核(古生菌和原核)基因組材料時,剪接體受原核控製。剪接體很可能是由I和II組自剪接內含子進化而來,正如其他人[33]所暗示的那樣,但這種剪接體的發展可能發生在比病毒真核發生更早的時間。考慮到真核生物轉錄組的相當大的比例(5% - 15%的mRNA),這是假設的情況成績單)的重疊編碼,這些編碼工件在起源上是“無內含子”的,例如,可能發生在具有雙編碼轉錄組物質(由雙編碼無內含子基因組印跡)的古生菌/原核生物祖先。考慮到它們的長ORF編碼(大於300個堿基)和長3'UTR區域(大於200個堿基),一些重疊編碼工件甚至似乎是功能性的,這表明RdRp使用了非rnai。轉錄水平(無內含子)重疊編碼通過剪接體處理從未剪接的內含子前體中獲得。剪接體及其可能的病毒起源[34-55]的進一步細節和微妙之處將在補充部分進行描述。
病毒真核發生理論幾乎沒有給測試留下機會,因為它涉及一個假設的曆史事件,因此,測試病毒真核發生理論與其他假設的內共生事件,如導致線粒體和葉綠體[56]的內共生事件。然而,病毒真核發生假說涉及到核心(非真核細胞質)基因組數據轉移到新形成的生物體細胞核,因此可能在基因組序列信息中留下比細胞器所能獲得的更多的進化人工產物。
反義編碼的mRNA信息已知存在[19],但在結果中,我們看到異常數量的重疊反義編碼,在一些原核生物和古生菌中有重疊的轉錄組編碼。即使反義編碼本身不是功能性mrna,它們也是這樣的人工製品,而且數量足夠多,表明非真核生物(非剪接體)基因組信息通過轉錄組采用的方式輸入到原真核生物核中,顯然有利於顯性轉錄本的攝取。如果任何反義編碼是功能性的,那麼就需要使用RdRp。RdRp的這種使用已經是眾所周知的,但是,對於更短的部分轉錄本,它被用來獲得用於RNAi調控的siRNA。因此,研究結果中建議RdRp發揮與RNAi無關的作用,以便從古老的原核/古祖先中獲取“幽靈”反義轉錄本,並允許一般的重疊編碼。
為了理解從原核/古基因組/轉錄組到真核轉錄組的印跡工件的本質,首先回顧基因組和轉錄組編碼拓撲的一些背景知識(如在基因組和轉錄組編碼拓撲和中心信條),以及古菌/原核生物的整體經典中心信條。由於古生菌/原核生物很少顯示內含子(然而,有些確實有自剪接內含子,有些病毒也有),它們的轉錄組結構幾乎直接映射到基因組結構。
基因組和轉錄組編碼拓撲和中心原則
經典的生物學中心信條描述了以DNA聚合物(或DNA聚合物的集合,如染色體)的形式編碼的信息如何轉錄到信使RNA (mRNA)聚合物,然後使用三堿基編碼方案翻譯成蛋白質(單順子示例見圖1,多順子示例見補充圖1和圖2)。對於三堿基編碼方案的簡單信息學檢測,請參見原核dsDNA中的補充部分-ORF重疊拓撲和補充圖3)。三堿基編碼方案可發現異常長的ORF編碼(如在原核dsDNA中的補充部分-ORF重疊拓撲和補充圖4中所述),這是方法部分中描述的ORF查找算法的基礎(對mRNA或EST數據進行了修改)。
圖2:mRNA轉錄組拓撲示意圖:重疊的monicistronic
圖3:(左)改良中樞法則(含逆轉錄酶和RdRp)).如圖所示,在進化過程中,逆轉錄酶和RdRp都存在,早期細胞被假設失去了剪接體和RdRp過程,以到達熟悉的原核細胞。(右)原核細胞標準中樞法則.最小的拚接表示,很多為零。早期細胞最終失去剪接體和RdRp,但仍有一定程度的自剪接內含子。
對於生物體的基因組DNA信息庫,從DNA到mRNA的轉錄可以通過多種方式從同一段DNA完成,例如,當不同的三堿基密碼子框架跨越DNA時,可能會有不同的重疊讀取相同DNA編碼區(圖2和補充圖5)。對於一些原核生物來說,這種重疊編碼可能相當重要(補充圖6和7,這與Winters-Hilt S(2006)[57]的研究結果有關),這種通過幀移位進行的重疊編碼對於雙鏈DNA基因組(在補體鏈中編碼)以及雙鏈RNA基因組來說是有效的兩倍。以及具有反義(反向補體)編碼的ssDNA和ssRNA基因組,通過中間雙工形式[42]讀出。因此,對於原核生物來說,無論基因組是單鏈的還是雙鏈的,還是基於dna的還是基於rna的,高程度的重疊編碼在基因組層麵已經很普遍了(補充圖5-7)。
圖4:病毒中心法則(有RdRp)病毒的細胞質很少,沒有核糖體,也不產生蛋白質,因為這是從細胞中提取的,DNA的大部分過程也是如此。病毒保留RdRp和逆轉錄酶(RdDp、DdDp)、RdRp(核酸聚合酶)和剪接體。
在附錄圖7中,經Winters-Hilt S(2006)[57]的研究許可而轉載,我們看到c . trachomatis基因組一半在正向鏈上編碼,一半在反向鏈上編碼,幾乎沒有雙重重疊編碼。在Winters-Hilt S(2006)[57]的研究表1中,orf >中的200個堿基訴霍亂基因組中,雙編碼的比例為6.57%(雙編碼發生在相反的閱讀方向重疊時,如補充圖6和圖7中的11000、12000和21000)。對於耐輻射球菌(補充圖7),雙編碼的數量為69.4%。
物種 | # mrna | 下載日期 | 源 |
小家鼠(老鼠) | 98484 | 8/19/2016 | NCBI基因庫 |
ThunnusThynnus(金槍魚) | 10163 | 7/5/2016 | NCBI基因庫 |
鮭魚(大西洋鮭魚) | 498523 | 7/7/2016 | NCBI基因庫 |
Caenorhabditiselegans(蠕蟲) | 8327 | 8/18/2016 | NCBI基因庫 |
表1:mRNA數據集下載日期/版本
一旦原核轉錄到mRNA完成,基於rna的編碼區域的選擇就有效地完成了,獨特的蛋白質產物就直接被指示出來了(見圖3和圖4中心原理指示的變化)。可以有多個蛋白質產物,因為原核生物可以有多順順子轉錄本,其中一個mRNA可能有多個順序定位(非重疊)的區域,每個區域編碼自己的蛋白質產物(也稱為操作子,補充圖1)。由於內含子和可選剪接(如在真核生物可選剪接部分和補充圖8-10中提到的詳細信息),真核轉錄本處理更複雜。另一方麵,一旦真核生物達到具有“成熟”mRNA的相同階段,由此產生的編碼通常是單順式的(順式調控隻控製一個編碼區域)。簡單的真核生物,比如秀麗隱杆線蟲,已知具有顯著數量的兩種編碼類型(單順子和多順子)[42]。
DNA / mRNA /蛋白質的產生過程在轉錄和翻譯聚合酶兩個階段都受到調控。順式調控在DNA′′mRNA聚合酶階段占優勢,反式調控在mRNA′′蛋白質多肽產生階段占優勢。在多順子編碼的情況下,有一個針對多個編碼區域的順式調控區域(補充圖1)。在mRNA′′蛋白質階段,跨調控機製的主導地位是顯著的,因為所有的生命過程,包括病毒過程,都可以在這個階段被調控,許多調控過程涉及簡單的反義核酸分子識別,這表明可能是一個常見的和古老的(RNA世界)生物分子過程。在真核生物中,DNA / mRNA /蛋白質的產生過程也在剪接體水平上受到調節(在Section-RNAi中給出了簡要背景)。真核生物中反式調控的主要機製是RNAi。反式調控在原核生物中的作用涉及一個非rnai過程它不使用RdRp進行siRNA擴增,使用了一種明顯獨立發展的方法:CRISPR/cas[45,46,58,59]。
病毒是一個眾所周知的例外,當涉及到逆轉錄酶的作用時,病毒已經修改了中央原則(圖4)。使用逆轉錄酶,顧名思義,可以從RNA返回到DNA,改變細胞的基因組信息庫(即使在多細胞真核生物中,如果基因組DNA碰巧在配子細胞中,也可以通過遺傳的方式)。病毒也有自己的方式生產(或複製)RNA信息,通過上述RNA依賴的RNA聚合酶(RdRp),而從DNA生產pre-mRNA在中心信條是通過DNA依賴的RNA聚合酶(DdRp)。因此,病毒信息處理包括中心原理中的一切,直到蛋白質生產(細胞質)階段,如圖4所示。在Winters-Hilt S[34]的研究中給出了與這裏提出的病毒真核發生假說形式一致的早期細胞/病毒假說的進一步背景。
RNAi
盡管RNAi是最近才被發現的[60,61],而且被認為是隨著真核生物的引入才變得重要起來,但RNAi的某些方麵似乎是古老的,甚至符合RNA世界的範式。RNAi似乎是真核生物及其病毒使用的普遍過程,但原核生物不使用。RNAi過程的一個關鍵組成部分是miRNA的使用,miRNA被納入到稱為RISC複合體的一組argonaute蛋白中[61]。miRNA提供核酸序列模板,用於調節特定的反義相關mrna(圖5)[62]。miRNA的導鏈對其mRNA目標提供反義匹配,並在調節或完全抑製(如果目標ssRNA是病毒或轉座子)中發揮作用。miRNA可能具有早期(RNA世界)的sirna的作用,因為miRNA的一個簡單的生物發生途徑的發現:“mirtrons”是內含子,曾經拚接到自己退火形成miRNA。Mirtrons和基於Mirtrons的RNA幹擾也與“跟隨內含子”分析(補充文件和[34])一致,該分析表明內含子可能是基本的和古老的。RNAi在整個真核生物中的出現表明了它的起源至少是古老的真核生物,如果不是更古老的話。
圖5:真核生物中RNA幹擾(RNAi)的防禦與表達調控.Drosha將pre-miRNA從mRNA形式剪輯到pre-miRNA形式,輸出到Dicer。Dicer針對dsRNA中間體(轉座子、病毒和pre-miRNA),創建miRNA或siRNA模板,並招募RISC複合體保存ssRNA特異性結合模板。當與模板結合的RISC複合體結合RNA靶時,根據模板匹配的特異性/穩定性發生切割或結合。中央miRNA模板和miRNA結合位點(miRNA)不匹配導致基因下調,而完全匹配則導致基因或ncRNA敲除。強結合位點匹配區長度為7-8個堿基。強匹配,匹配長度,vs.不匹配。細胞的表觀遺傳機製在一定程度上是由一組被稱為外顯miRNAs的miRNAs亞群調節的[63]。
RNAi是一種RNA幹擾方法,需要形成dsRNA中間體。在1998年[60]的ssRNA基因沉默實驗中,發現dsRNA在沉默方麵不如ssRNA有效,而且ssRNA的沉默“太好了”,少量的ssRNA就能完成完全沉默,表明是酶催化的沉默過程。RNAi過程在2001年被闡明[61],Dicer描述了其在製備22bp dsRNA片段以將ssRNA模板加載到rna誘導沉默複合體(RISC)中的作用。RNAi通過使用與感興趣的ssRNA靶標(如mRNA或逆轉錄轉座子RNA中間體)反義的ssRNA鏈來幹擾特異性。目前的RNAi形式可能並不存在於早期的真核生物中。早期的真核生物可能已經有了一個僅以mirtron為基礎的原tornai,並且可能還沒有發展出一個顯著的RISC複合體[63]。
在病毒真核發生假說部分將要討論的病毒真核發生假說中,我們看到,假設當古生菌/類原核細胞(可能帶有線粒體)被膜結合的病毒內共生體入侵時,RNAi幹擾CRISPR/cas前體存在於該細胞中,病毒的膜結合入侵涉及到RNA幹擾軍備競賽(病毒膜可以在釋放到類原核細胞宿主的細胞質之前保護並完成關鍵的mRNA處理)。因此,病毒內共生可能是在RdRp使用和RNAi共同進化的基礎上產生的互惠共生(互惠共生),最終導致了假設的病毒真核發生中病毒機製和獨立核處理的大規模采用(在病毒真核發生假說一節中進一步討論)。
數據來源/版本
轉錄組分析中使用的mRNA數據來自NCBI Genbank條目,並標明了下載日期。文件可從www.ncbi.nlm.gov下載,其中選擇了mRNA數據庫,並對指定的生物體進行搜索,並選擇了作為文件下載選項。對於金槍魚和鮭魚的數據,當天可用的全部序列集合都用於分析(金槍魚在2016年7月5日隻有10163個轉錄本)。數據集下載日期/版本見表1。對於小鼠和蠕蟲數據,它們都涉及可用的完整mRNA數據集的測試子集(來自最新的mRNA列表),其中分析中使用的序列數量如下所示。對於小鼠,實際的全套mrna數量大約是檢測結果的50倍,接下來將進行更全麵的分析。對於蠕蟲,測試塊也是可用的mrna的一小部分,主要是為了觀察當更豐富的操作子結構(orf通常小於300個堿基)開始流行時,3'UTR區域的獲取如何失敗(如蠕蟲)。蠕蟲的結果表明一個非常簡單的修複通過第二次處理(但這是單獨分析的一部分,因此不在這裏進一步討論)。目前正在對所有真核生物和轉錄組ORF重疊拓撲進行更廣泛的調查,以提供一個比較轉錄組分析,類似於對原核ORF重疊拓撲[57]所做的比較基因組學分析,因此將不再進一步討論。
計算方法
用計算機程序處理每個mRNA入口,ORFfinder有三個正向幀傳遞和三個反向補幀傳遞。對mRNA條目進行過濾,隻保留至少一個ORF長度≥300個堿基的mRNA條目,其中ORF右側邊界指示的3'UTR區域長度至少為200個堿基,並以給定的ORF長度的唯一35個堿基的初始3'UTR序列開始(允許alt-splice變體通過)。該方法僅適用於操作子編碼的轉錄本,如果操作子中的最後一個ORF≥300。因此,它意味著應用於低操縱子百分比的基因組(這有利於較長的orf),以最小化操縱子識別失敗的錯誤。在結果中顯示了3'UTR識別問題是如何發生在秀麗隱杆線蟲(蠕蟲)的轉錄組,正如預期的那樣,由於高操縱子百分比,這被發現在較小的程度上是蠑螈的情況(沒有顯示),出於類似的原因。對於蠕蟲和蠑螈,使用一個簡單的算法修複來重新處理ORF≥300傳遞的轉錄本,重新掃描ORF≥50的3'UTR,從而消除大部分長度低於300堿基的遺漏操作子結構,這將幹擾3'UTR區域的正確劃分(在操作子結構中正確識別的ORF集合中的最後一個ORF之後)。然而,這篇論文的重點不是蠕蟲和蠑螈,所以這些結果在另一篇論文中。在Winters-Hilt S(2006)[57]的研究中描述了ORF重疊拓撲表的軟件,並在補充部分-原核dsDNA中的ORF和ORF重疊拓撲中進行了簡要總結(補充圖3-7)。
小鼠、金槍魚、鮭魚和蠕蟲轉錄組的mRNA數據通過6次ORF處理進行檢查:對ssRNA轉錄本上可能的不同密碼子框架進行3次ORF傳遞,對ssRNA序列的反向補體重複3次ORF傳遞。選擇ORF長度大於或等於300個堿基的轉錄本。然後將從不同ORF通道識別的ORF合並到一個多軌跡索引方案[57]中,如補充部分-原核dsDNA中的ORF和ORF重疊拓撲中所述,從而可以量化ORF重疊拓撲。非重疊orf也可用於確定操縱子編碼的數量。一旦操縱子編碼被解析,3 ' UTR區域可以被識別為操縱子的最後一個ORF之後的轉錄本(對於多順子轉錄本),或簡單地在要執行的轉錄本中的(單個)ORF之後(對於monicistronic轉錄本)。然後在這個節點進行進一步的選擇,將轉錄本限製為長度至少200個堿基的3 ' UTR區域。像orf長度一樣,3'UTR長度也有重尾分布,其中重尾區域是基因(如果orf)或miRNA調控區域(如果3'UTR)經常駐留的地方。詳見表2。圖6給出了這樣確定的3 ' UTR區域上的長度分布圖,並用於幫助指導選擇長度200的截止點,即進入分布的尾部的位置,此時所有事件的隨機性開始發生顯著偏差。
圖6:所選orf的小鼠、金槍魚和鮭魚3 ' UTR區域的長度分布(從左到右),如表2所示。
物種 | # mrna (基因庫) |
#ORFs > 300 (和獨特的35長度) |
#子 (tranlen≥200) |
# Uniq mrna |
% mrna 雙 |
%羊痘瘡 操縱子 |
ORFs向前重疊 |
鼠標 | 98484 | 36654 | 8907 | 7303 | 12.7 | 0.70 | 15.0 |
金槍魚 | 10163 | 5366 | 1739 | 1541 | 9.5 | 0.63 | 11.8 |
大馬哈魚 | 498523 | 232014 | 96084 | 82007 | 8.0 | 0.86 | 13.5 |
蠕蟲 | 8327 | 13864 | 8590 | 4660 | 30.4 | 12.9 * | ----- |
表2:用於轉錄組分析的mrna數量及其ORF拓撲特征
*由於ORF≥300的約束,蠕蟲結果大大低估了操縱子的範圍
很容易想象,每一條ORF≥300編碼的鏈如何具有不同幀的部分重疊ORF≥300編碼(如背景中所述),在一個給定的轉錄組樣本中,這種ORF重疊的百分比如表2所示(在幀移重疊分析中考慮了轉錄本和逆轉錄本)。給定鏈上的某些orf不重疊,如果具有相同的全局框架,或者具有其他密碼子框架上的可分離性(從其他兩個密碼子框架中的一個通道),這種情況是必然的。在同一條鏈上(轉錄本序列“原樣”或轉錄本序列的反向補體)沒有重疊的orf可以被分組為假設的“操縱子”。這是在所示的估計會計中完成的。這就得到了真實操縱子百分比的上限估計值,如表2所示。這是一種估計,因為一些ORF可能不適合一個操作子組,因為隻有它們的編碼區域和小的非平移區域必須適合,也就是說,當涉及到將片段組裝在一起以擁有一個操作子時,ORF片段通常在其左端被修剪。對ORF軌跡放置的不同程度的左ORF邊界“修剪”的快速分析允許操作子百分比為上界的方法,並發現≥300 ORF轉錄本中小於1%的操作子結構的估計最多為1.5%。然而,這是假設,當長度小於300堿基的orf本身被忽略時,任何操作子結構的末端都被正確識別。從圖6中的3'UTR分布數據中我們可以看到,這是低操縱子結構基因組的情況,它們都很少出現大於600個堿基的3'UTR區域。
任何錯過最後一子一個操縱子將大大增加3 'utr區域的長度從而錯誤地抵達,並將導致失真的長度分布3 'utr地區,操縱子識別失敗的第一指示在截止最大3 'utr開始滑移值超過600個堿基(其他基因組,沒有顯示,也分享3 'utr區域的特征通常很少在長度大於600基地)。然而,對於蠕蟲,我們預計操作子處理是不夠的,因為它是操作子豐富的,這與orf < 300長度的可能發生一起是現在更重要的錯誤來源。蠕蟲的長度分布剖麵有3'UTR長度的顯著數字,長度約為1200個堿基(圖7),這表明由於過濾了ORF < 300,而轉到分析中選擇的已識別ORF≥300,因此操作子邊界識別失敗。由於這個原因,表中一些蠕蟲的數字被省略,因為它們完全無效,或者在隻提供某種估計時將其標記為下界。
圖7:蠕蟲3 ' UTR區域的長度分布。
ORF≥300和3'UTR≥200的非operonic轉錄組重疊結構被強烈證實是功能性的,因為它們的ORF和3'UTR區域異常長。現在考慮一下,同樣的分析已經應用到抄本的反向補中,並對通過同樣嚴格的截斷的任何編碼構造進行選擇。在表2中,具有直接和反向互補功能編碼的轉錄本被稱為“雙編碼”,雙編碼轉錄本的百分比在8%到13%之間,如圖所示。圖2中沒有顯示的是,類似的雙重編碼百分比如何也出現在大量的魚類轉錄組中,這些轉錄組目前正在一個專注於魚類種群多樣性評估的單獨努力中進行研究(將在另一篇論文中描述)。
蠕蟲轉錄組分析中操作子識別的失敗並不會直接影響雙信使rna的比例,因此可以進行估計,蠕蟲中3'UTR≥200轉錄本上的雙編碼約為30%。請記住,這個結果並不一定適用於百分比整個蠕蟲轉錄組(類似於其他轉錄組),因為有3'UTR≥200轉錄本的限製。無論如何,無論雙編碼的數量是8%還是30%,它仍然是顯著的,問題是沒有標準的rdrp類機製來訪問所指示的雙基因,或檢查它們可能的獨特疾病關聯(作為一個可能更不穩定的監管群體)。因此,我們推測RdRp在真核生物中具有更積極、更顯著的非rnai作用。這修改了生物分子處理(DNA′′mRNA′′蛋白質)的中心原則,現在考慮到RdRp時考慮到更多的路徑(類似於采用逆轉錄酶時所做的標準模型的擴展,以允許從mRNA返回DNA的路徑)。RdRp和逆轉錄酶都被認為是病毒起源,在真核生物中積累這兩種病毒屬性,而不是原核生物,根據這一新的信息,導致了病毒真核發生假說的重申,這將在後麵的討論和結論部分進行討論。
值得注意的是真核轉錄本中編碼重疊結構的出現,有正向重疊或特別是雙重重疊,這與原核轉錄本中出現的編碼重疊結構相似(從dsDNA基因組派生,例如,雙重編碼)。這就好像病毒核的內共生使類原核基因組信息隨著時間的推移被“提升”到基於病毒的原核中通過它們的mRNA轉錄本,其中有反向補體信息通過RdRp。
作為對分析中使用的轉錄本的進一步驗證,這些轉錄本受到orf≥300和3 ' utr≥200的選擇限製,我們對3 ' utr區域的7′基序統計數據進行了分析(表3)。由於RNAi使用7′miRNA/RISC結合位點基序作為3 ' utr區域RNAi控製的基因座,由於RNAi的選擇壓力,預計7′基序計數將是一個結構豐富的統計數據。對16,384種可能的7mer計數的檢查顯示了各種7mer計數的平均計數和標準偏差,如小鼠、金槍魚、鮭魚和鱈魚所示。大西洋鱈魚很少有高頻的7mer結構(不到其他包括老鼠的一半),強烈表明大西洋鱈魚的轉錄組受損,這將與已知的過度捕撈和北大西洋鱈魚漁業的長期崩潰相一致。然而,對於本文的結果來說,7mer的結果僅僅是為了進一步驗證轉錄組采樣過程,特別是非常大樣本量的Atlantic Salmon數據,從而得出雙編碼顯著的結論,在轉錄組水平上、清晰。
物種 |
平均非零 計數(µ) |
標準 標準差(σ) |
O /µ |
鼠標 |
162 | 118 | 0.728 |
金槍魚 |
30.7 | 22.9 | 0.745 |
大馬哈魚 |
1821 | 1280 | 0.703 |
鱈魚 |
794 | 919 | 1.157 |
表3:7次3'UTR統計剖麵驗證
討論從“真核生物中非傳染性和非rnai RdRp作用的指征”一節開始——新的中心理論,有強有力的證據表明在轉錄組水平上存在雙編碼,並由此得出真核生物中RdRp具有非傳染性作用的推論。在病毒真核發生假說一節中,根據真核生物RdRp的長期作用,對病毒真核發生假說進行了重新審視和改進。雙重編碼的印跡也表明在病毒細胞核中存在一個預先存在的剪接體。對病毒和其他自私基因組結構的長期基本作用的重新評估,如Winters-Hilt S[34]的研究中討論的轉座子和內含子,其中內含子最早假說被提出。
真核細胞中非傳染性和非rnai RdRp作用的跡象——新的中樞信條
本文的結果表明,真核生物在成熟mRNA產物水平上進行內源性病毒樣RNA依賴RNA聚合酶(RdRp)的酶促加工,從而產生反向互補mRNA轉錄本。當某些核酸處理酶(如轉座酶)最常見的化身或最初的發現是病毒起源時,它們似乎再次發揮了關鍵作用。這樣的處理方法是可以引入的通過從噬菌體到原核祖先的基因轉移,最終分支成生物體的真核群體。例如,RdRp可以被引入真核生物,通過病毒真核發生過程(如在病毒真核發生假說一節中討論的),通過漸進的進化過程,病毒感染的古菌/原核生物可能被選擇為共生,然後是互惠共生,然後是病毒-古菌/原核生物的內共生關係,包括采用病毒類型的RdRp。
膜結合生物的內共生產生細胞器,如線粒體或葉綠體,而沒有包封的自私基因生物(病毒或轉座子)的內共生則產生基因或自私基因組結構的采用。後一種情況在許多已查明的內源性逆轉錄病毒中可見一斑,這些病毒如果沒有其他好處,至少可以提供對外源性寄生逆轉錄病毒攻擊的競爭性抑製。這裏提出的是,導致真核生物采用RdRp的內共生可能與膜結合病毒建立互惠關係,最終導致病毒與病毒膜的內共生包括,病毒膜然後成為原真核細胞的核膜(在病毒真核發生假說一節中進一步討論)。
如果RdRp是真核生物可遺傳的生物分子信息處理補體的一部分,那麼需要進一步修改中心原則,如圖8所示,其中更明確的剪接體階段也顯示出來。
圖8:RNA/DNA/蛋白質世界信息處理的中心法則.根據核糖體和其他關鍵酶的發育與細胞包埋發生的時間的不同,RNA/DNA/蛋白質世界可能有一個細胞前階段。細胞封裝可以大大加快從核酶到酶的轉換(優化),因此,一旦你有了一個細胞(和病毒),你就可能達到熟悉的RNA/DNA/蛋白質信息編碼方案。上麵的完整圖表可能適用於早期普遍的前體細胞(原核生物和真核生物的祖先),而沒有最後兩個階段的相同圖表將描述早期普遍的前體細胞病毒(使用宿主的細胞液實現病毒的最後兩個階段)。對更優化的細胞和病毒的選擇通過它們的共同進化而加速,所以共同進化本身是有效的選擇。**所謂係統,我們指的是在“係統”層麵上可能引發突發現象(或表現型)的任何情況,其中噪聲的作用可以是這樣一種表現型。
病毒真核發生假說
考慮到RdRp在真核生物中可能廣泛和古老的使用,這將表明原始真核細胞係的開始將以采用原生RdRp能力為標誌。再考慮一下,在真核細胞係的初始階段,采用了細胞核(根據定義),可能大規模采用了受核膜保護的剪接體機器,以及可能受該膜邊界保護的任何其他核酸處理。原真核生物也被認為比原核生物具有更豐富的能量代謝能力。因此,參與病毒真核發生的古生菌/原核樣生物可能已經采用了原線粒體內共生體,允許它在線粒體膜上而不是細胞膜上進行明顯更多的ATP生產,使細胞膜變得更簡單(例如,沒有壁,隻有一個膜),允許更多的細胞通信(以及更容易受到膜結合病毒的入侵)。現在考慮一下古生菌/類原核細胞在病毒和細胞之間一場古老的進化戰鬥的共同進化背景下的情景。隨著古生菌/類原核細胞發展出越來越精細的RNA幹擾防禦能力,它迫使共同進化的病毒進行補償,通過學習如何利用這些防禦能力為自己服務,並通過采用膜邊界作為內部(核)邊界(在某些情況下,如痘病毒[39])來保護其RNA處理免受幹擾。宿主病毒係統向互惠主義發展所需要的是一種權衡,例如宿主獲得RdRp的使用,而病毒在哪裏獲得通常訪問宿主細胞機製的機會。因此,在這幅圖中,病毒真核發生被假設為給出當時生物體及其相互作用的最簡單描述。
正如在結果中提到的,在我們今天看到的真核轉錄組中,有一個來自原核樣前體的基因組/轉錄組的顯著“指紋”。這是因為古生菌/類原核生物基因組信息的保留似乎是通過采用古生菌/類原核生物的轉錄本,其中攜帶有重疊編碼的特定基因的轉錄本被采用,重疊信息完整,進入原真核生物的轉錄組處理,並最終(可能)通過逆轉錄酶)被寫入病毒/核dsDNA基因組(假設是dsDNA病毒)。因此,高度緊密的重疊,operonic,和雙原核基因的編碼不是印跡的通過基因組-基因組轉移,但是通過transcriptome-genome轉移。給定拚接得到轉錄本;然而,這些結果在轉錄本中隻產生來自一條鏈的基因組信息,而另一條(雙鏈)信息必須被訪問通過RdRp。然而,假設的病毒互惠主義已經存在,RdRp的可及性就不是問題了。
有許多假設導致了上述病毒真核發生的具體形式假設。“已確定的階段”的一部分涉及到原始古生菌/原核細胞和古代病毒在當時的共同進化。無論病毒已經有剪接體處理(這是古老的),還是核酸剪接是一個非常晚的發明,這是另一個影響病毒真核基因模型的假設。在Winters-Hilt S[34]的研究中,提出了內含子最早的假說,這樣,病毒到達病毒真核發生時已經存在剪接,這是它們的選擇壓力之一,通過采用“特洛伊木馬”內吞攻擊的膜包圍來防止RNA幹擾(當進入互利關係時,最終導致內共生)。在內含子最早假說中,剪接體的處理是古老的,並在病毒係中進行,因為原核生物的選擇壓力導致內含子的丟失(以及對剪接體的需要的丟失)。RdRp同樣被認為是古老的,在病毒係中攜帶,在原核係中丟失,因為轉移到DNA和更大的基因組(和宿主複雜性)導致細胞中轉移到DdRp。
病毒真核發生理論也提出了減數分裂和性[56]的可能起源,該理論提出有絲分裂周期是從具有永久溶原存在的病毒進化而來的,減數分裂周期(和性)是從病毒轉移到新宿主的過程進化而來的。Bell P[56]的研究還討論了病毒-細胞核主導的細胞控製導致原核轉錄/翻譯機製重組為典型的真核過程,其中mRNA在擠壓進入細胞質之前被封,帽結合蛋白指導被封mRNA的翻譯。重組涵蓋了原真核生物的進化細化過程,在這個過程中,非核基因組信息被“提升”到細胞核中。也許在細胞核中參與剪接體活動的相同蛋白質,在從胞漿生產和組裝進入細胞核的過程中結合胞漿中的核酸[30,31],允許反向運輸,內含子的反向剪接已經在細胞核中偶爾發生,然後逆轉錄酶(RT)將成為將“內含子化”的轉錄信息永久地拉入病毒/核基因組所需要的全部。這很容易發生,因為RTs是病毒的常見組成部分,即使是最簡單的病毒。在概述的進化提升過程中,一個古生菌/原核宿主轉錄本將被映射到一個“內含子化”的病毒-細胞核基因組序列。這被假設已經發生了,因為在結果中可以看到獨特的統計假象。,真核mRNA轉錄本的編碼信息與它們的反向補體reads相重疊(追溯到具有這種重疊編碼的非真核mRNA轉錄本,然後直接與非真核mRNA轉錄本的相同重疊編碼相關)intronlessdsDNA基因組水平)。因此,這些結果支持了一種形式的病毒真核發生假說與基因組吸收通過“內含子化”,進一步表明病毒核已經控製了剪接體機製。研究結果還表明,RdRp的作用可能比純rna相關的更大
對mRNA數據的分析表明,通過嚴格驗證條件的mRNA轉錄本,至少有一個ORF長度≥300個核苷酸,3'UTR長度≥200個核苷酸,具有大量的反向補體編碼結構,通過類似的嚴格測試。ssRNA的重疊編碼是如果反向補體mRNA可以產生的結果,例如通過RNA依賴的RNA聚合酶(RdRp),這類似於原核dsDNA基因組上可能存在的重疊編碼。這表明了三件事:(i) RdRp可能在真核生物中發揮比支持RNAi更大的作用,與中心信條相關的變化;(ii)在基因組/轉錄組水平上的古生菌/原核生物重疊編碼印跡的古老殘餘出現在原真核生物的轉錄組上,從而在真核生物的轉錄組水平上產生重疊編碼;(iii)提出了一種特定形式的病毒真核發生假說,即病毒祖先提供了RdRp和剪接體。
作者要感謝康涅狄格學院的研究支持。
- 謝錚,範斌,陳超,陳震(2001)誘導RNA依賴的RNA聚合酶在植物抗病毒防禦中的重要作用。美國科學院學報98:6516-6521。[Ref。]
- Siegel RW, Bellon L, Beigelman L, Kao CC(1999)病毒RNA依賴的RNA聚合酶對DNA、RNA和嵌合模板的使用:從RNA向DNA世界過渡的進化意義。病毒學報73:6424-6429。[Ref。]
- Pandey SP, Gaquerel E, Gase K, Baldwin IT (2008) RNA定向RNA聚合體3煙草attenuata則是自然環境中競爭成長所必需的。植物學報147:1212-1224。[Ref。]
- Di Serio F, de Alba AEM, Navarro B, Gisel A, Flores R (2010) RNA依賴的RNA聚合酶6延遲聚集並阻止在細胞核中複製的類病毒的分生組織入侵。病毒學報84:2477-2489。[Ref。]
- Horie M, Kobayashi Y, Honda T, Fujino K, Akasaka T, et al.(2016)蝙蝠基因組中來自一種古老負鏈RNA病毒的RNA依賴RNA聚合酶基因。科學報告6:25873。[Ref。]
- Iyer LM, Koonin EV, Aravind L (2003) dna依賴性RNA聚合酶和真核RNA依賴性RNA聚合酶的催化亞基之間的進化聯係和RNA聚合酶的起源。BMC結構生物學3:1。[Ref。]
- Crombach A, Hogeweg P (2011) RNA依賴的RNA聚合酶是轉座子控製的必要條件嗎?BMC Syst Biol 5: 104。[Ref。]
- Pelczar H, Woisard A, lemaajtre JM, Chachou M, Andeol Y(2010)蠑螈和爪螈卵提取物中RNA聚合活性的證據。PLoS ONE 5: e14411。[Ref。]
- Nolan T, Cecere G, Mancone C, Alonzi T, Tripodi M,等。(2008)crassa神經孢菌轉錄後基因沉默所必需的RNA依賴RNA聚合酶與複製蛋白a相互作用。[Ref。]
- Forrest EC, Cogoni C, Macino G(2004)依賴RNA的RNA聚合酶QDE-1是神經孢子菌轉錄後基因沉默的速率限製因子。核酸Res 32: 2123- 2128。[Ref。]
- Lipardi C, Paterson BM(2010)果蠅RNA依賴RNA聚合酶的鑒定確立了RNA沉默的共同主題。蒼蠅(奧斯汀)4:30 -35。[Ref。]
- Conrat FH(1983)植物RNA依賴性RNA聚合酶。美國科學院學報80:422-424。[Ref。]
- 王豔,曲娟,季鬆,Wallace AJ,吳娟,等。(2016)一種陸地植物特異性轉錄因子通過dna依賴的RNA聚合酶II直接增強致病非編碼RNA模板的轉錄。植物細胞28:1094-1107。[Ref。]
- O 'Sullivan JM, Tan-Wong SM, Morillon A, Lee B, Cole J, et al.(2004)酵母中的基因環並置啟動子和終止子。自然遺傳學36:1014-1018。[Ref。]
- Mikoshiba K, Tsukada Y, Haruna I, Watanabe I(1974)大鼠大腦中RNA依賴的RNA合成。自然雜誌249:445-448。[Ref。]
- Downey KM, Byrne JJ, Jurmark J S, So AG(1973)網織細胞RNA依賴性RNA聚合酶。中國環境科學學報70:3400-3404。[Ref。]
- 質粒或病毒的功能類似物取代細胞蛋白質可以解釋許多DNA信息蛋白令人困惑的係統發育。Mol Microbiol 33: 457-465。[Ref。]
- Volloch V, Schweitzer B, Rits S (1990) COIII RNA編輯和未編輯合成的解耦錐蟲屬brucei.自然343:482-484。[Ref。]
- Volloch V, Schweitzer B, Zhang X, Rits S(1991)細胞色素氧化酶亞基III RNA負鏈補體的鑒定錐蟲屬brucei.中國科學院學報88:10671-10675。[Ref。]
- Legendre M, Lartigue A, Bertaux L, Jeudy S, Bartoli J,等(2015)感染棘阿米巴的一種新的3萬年巨病毒Mollivirus sibericum的深入研究。美國國家科學促進會112:E5327-E5335。[Ref。]
- Iyer LM, Balaji S, Koonin EV, Aravind L(2006)核-細胞質大DNA病毒的進化基因組學。病毒版本117:156-184。[Ref。]
- Oliveira GP, Andrade AC, Rodrigues RA, Arantes TS, Boratto PV等(2017)NCLDVs中的啟動子基序:一個進化的視角。病毒9:16。[Ref。]
- Kobiler O, Drayman N, butin - israel V, Oppenheim A(2012)通過核膜屏障的病毒策略。核3:526-539。[Ref。]
- Fay N, Pante N (2015) DNA病毒的核進入。前方微生物學6:467。[Ref。]
- Cohen S, Au S, Pante N(2011)病毒如何進入細胞核。生物化學生物物理學報1813:1634-1645。[Ref。]
- 萬剛,Shimada E,張傑,洪傑,Smith GM,等(2012)靶向RNA導入糾正人類線粒體突變。美國科學院學報109:4840-4845。[Ref。]
- Shaheen HH, Hopper AK(2005)細胞內trna從細胞質到細胞核的逆行運動釀酒酵母.美國科學院學報102:11290-11295。[Ref。]
- O 'Neill RE, Jaskunas R, Blobel G, Palese P, Moroianu J(1995)流感病毒RNA的核輸入可由病毒核蛋白和蛋白質輸入所需的轉運因子介導。生物化學雜誌270:22701-22704。[Ref。]
- Marfori M, Mynott A, Ellis JJ, Mehdi AM, Saunders NF,等(2011)核導入特異性的分子基礎和核定位預測。生物化學生物物理學報1813:1562-1577。[Ref。]
- Bryant HE, Wadd SE, Lamond AI, Silverstein SJ, Clements JB(2001)單純皰疹病毒IE63 (ICP27)蛋白與剪接體相關蛋白145相互作用並在第一個催化步驟前抑製剪接。病毒學報75:4376-4385。[Ref。]
- Dubois J, Terrier O, Rosa-Calatrava M(2014)流感病毒和mRNA剪接:事多事少。mBio 5: e00070-e00114。[Ref。]
- De Maio FA, Risso G, Iglesias NG, Shah P, Pozzi B,等(2016)登格病毒NS5蛋白侵入細胞剪接體並調節剪接。PLoS Pathog 12: e1005841。[Ref。]
- Rogozin IB, Carmel L, Csuros M, Koonin EV(2012)剪接體內含子的起源和進化。Biol Direct 7:11。[Ref。]
- Winters-Hilt S(2017)內含子最早的假說。準備中的論文。
- Forterre P(2001)基因組學和早期細胞進化。DNA世界的起源。中國科學院科學III 324: 1067-1076。[Ref。]
- Forterre P(2006)核糖體譜係的三個RNA細胞和複製其基因組的三個DNA病毒:細胞結構域起源的假設。美國科學院學報103:3669-3674。[Ref。]
- 宗傑,姚旭,尹傑,張東,馬紅(2009)RNA依賴性RNA聚合酶(RdRP)基因的進化:主要真核類群分化前後的複製和可能的丟失。基因447:29-39。[Ref。]
- Sigova A, Rhind N, Zamore PD(2004)一個Argonaute蛋白介導了裂糖酵母的轉錄和轉錄後沉默。基因Dev 18: 2359-2367。[Ref。]
- Takemura M(2001)痘病毒和真核細胞核的起源。分子生物學雜誌52:419-425。[Ref。]
- 病毒真核發生:細胞核的祖先是複雜DNA病毒嗎?J Mol Evol 53: 251-256。[Ref。]
- 魏偉萊,高科,魏達(1998)真核生物起源和進化的新視角。分子生物學雜誌46:499-507。[Ref。]
- Winters-Hilt S(2011)基於機器學習的序列分析,生物信息學和納米孔轉導檢測。露露出版。[Ref。]
- Gaudin M, Krupovic M, margaret E, Gauliard E, cvirkate -Krupovic V等。(2014)攜帶病毒基因組的細胞外膜囊泡。環境微生物學16:1167-1175。[Ref。]
- Forterre P, Gaia M(2016)巨型病毒與現代真核生物的起源。微生物學雜誌31:44-49。[Ref。]
- Hale CR, Zhao P, Olson S, Duff MO, Graveley BR,等(2009)利用CRISPR RNA- cas蛋白複合體進行RNA引導的RNA切割。139號牢房:945-956。[Ref。]
- Makarova KS, Aravind L, Wolf YI, Koonin EV (2011) Cas蛋白家族的統一和CRISPR/ Cas係統起源的一個簡單場景。biool Direct 6: 38。[Ref。]
- Kostyrka G(2016)病毒在生命起源場景中扮演什麼角色?。生物學雜誌59:135-144。[Ref。]
- Tessera M(2011):進化起源與生命起源:範式的轉變。國際分子生物學雜誌12:3445-3458。[Ref。]
- Boyer M, Yutin N, Pagnier I, Barrassi L, Fournous G, et al. (2009) Giant Marseillevirus強調了變形蟲在嵌合微生物出現中的熔爐作用。美國科學院學報106:21848-21853。[Ref。]
- Boyer M, Madoui MA, Gimene G, La Scola B, Raoult D(2010)基因組信息基因的係統發育和係統發育研究強調了包括巨型病毒在內的4個生命域的存在。PLoS One 5: e15530。[Ref。]
- Nasir A, Kim KM, Caetano-Anolles G(2012)巨型病毒與細胞祖先共存,與古菌、細菌和真核生物等超級王國一起代表了一個獨特的超群。BMC Evol Biol 12: 156。[Ref。]
- Yutin N, Wolf YI, Raoult D, Koonin EV(2009)真核大型核胞質DNA病毒:同源基因簇和病毒基因組進化的重建。病毒j6: 223。[Ref。]
- Iyer LM, Aravind L, Koonin EV(2001)四個不同的大型真核DNA病毒家族的共同起源。病毒學報75:11720-11734。[Ref。]
- Saini HK, Fischer D (2007) Mimivirus orfan的結構和功能洞察。BMC基因組學8:115。[Ref。]
- 賈格斯,巴切瓦洛夫,喬西TR B, Place AR,(2012)原生生物真核翻譯起始因子eIF4E的多樣性。Comp Funct Genomics 2012: 134839。[Ref。]
- Bell P(2013)減數分裂:根據病毒真核發生理論的起源。在:伯恩斯坦C,伯恩斯坦H (eds)減數分裂。InTech出版商。[Ref。]
- Winters-Hilt S(2006)隱馬爾可夫模型變量及其應用。生物信息學7:S14。[Ref。]
- Hale C, Kleppe K, Terns RM, Terns MP(2008)火球菌的原核沉默(psi) rna。RNA 14: 2572-2579。[Ref。]
- van der Oost J, Brouns SJ (2009) RNAi:原核生物參與其中。139號房:863-865。[Ref。]
- Fire A, Xu S, Montgomery MK, Kostas SA, Driver SE, et al.(1998)雙鏈RNA在植物中的作用秀麗隱杆線蟲.自然391:806-811。[Ref。]
- Bernstein E, Caudy AA, Hammond SM, Hannon GJ(2001)雙齒核糖核酸酶在RNA幹擾起始步驟中的作用。自然409:363-366。[Ref。]
- Valeri N, Vannini I, Fanini F, Calore F, Adair B,等。(2009)表觀遺傳學、mirna和人類癌症:人類基因調控的新篇章。哺乳動物基因組20:573-580。[Ref。]
- Winters-Hilt S, Lewis AJ(2016)使用多軌跡團分析的Alt-splice基因預測器:多細胞真核生物基因組建模的統計支持驗證。信息學4:3。[Ref。]
在此下載補充資料
在此下載臨時PDF
文章類型:研究文章
引用:Winters-Hilt S(2017)真核轉錄組中RNA依賴的RNA聚合酶編碼偽影。Int J Mol基因et Gene Ther 2(1): doi http://dx.doi.org/10.16966/2471-4968.108
版權:©2017 Winters-Hilt S.這是一篇開放獲取的文章,根據創作共用署名許可協議發布,該協議允許在任何媒體上不受限製地使用、發布和複製,前提是注明原作者和來源。
出版的曆史: