自身免疫與傳染病

全文

研究文章
自身免疫和感染性疾病中NGS免疫球蛋白(IG)和T細胞受體(TR)成分的IMGT- ontology到IMGT/HighVQUEST

薇羅尼卡Giudicelli帕特裏斯Duroux阿瑟·拉瓦Safa Aouintimarie - paule Lefranc索非亞Kossida

IMGT®國際免疫遺傳學信息係統®法國蒙彼利埃大學,實驗室'ImmunoGénétique Moléculaire LIGM,研究所Génétique Humaine IGH, UPR CNRS 1142

*通訊作者:瑪麗-保羅·勒弗朗和索菲亞·科西達,IMGT®國際免疫遺傳學信息係統®,實驗室'ImmunoGénétique Moléculaire LIGM,研究所Génétique Humaine IGH, UPR CNRS 1142,蒙彼利埃大學,141 rue de la Cardonille, 34396蒙彼利埃cedex 5;電話號碼:33-434-359965;傳真:33-434-359901;電子郵件:Marie-Paule.Lefranc@igh.cnrs.fr Sofia.Kossida@igh.cnrs.fr


摘要

自身免疫性疾病和感染性疾病的適應性免疫組分的分析是一個有趣的挑戰,因為抗原受體是免疫球蛋白或抗體和T細胞受體的天然多樣性,分別由B細胞和T細胞表達。由下一代測序技術產生的高通量分析為表達譜提供了寶貴的大規模表征,從而更好地了解保護性和致病性免疫反應。IMGT®國際免疫遺傳學信息係統®(國家科學研究中心和蒙彼利埃大學)是免疫遺傳學和免疫信息學的全球參考。IMGT成立於1989年®標誌著免疫信息學的出現,它出現在免疫遺傳學和生物信息學的交界麵。IMGT®專門研究人類和其他脊椎動物物種的免疫球蛋白或抗體、T細胞受體、主要組織相容性蛋白,以及任何物種的免疫球蛋白超家族和主要組織相容性超家族的蛋白質。IMGT®建立在IMGT-ONTOLOGY公理和概念的基礎上,彌合了基因、序列和三維結構之間的鴻溝。這些概念包括IMGT®標準化關鍵詞(識別),IMGT®標準化標簽(描述),IMGT®標準化命名法(分類法),IMGT唯一編號法和IMGT Colliers de Perles(編號法)。IMGT®包括7個數據庫、1.5萬頁網絡資源和17個工具,包括從魚類到人類的數據,用於基礎研究到獸醫、醫學和轉化研究。IMGT/HighV-QUEST是IMGT/V-QUEST和IMGT/Junction Analysis的高通量版本,創建於2010年,是第一個也是迄今為止唯一一個從下一代測序中獲得的免疫球蛋白和T細胞受體組分分析的在線門戶。高質量的結果有助於對抗原受體組分的大範圍觀察和對適應性免疫反應(接種疫苗時具有保護性,癌症和感染時具有致病性,自身免疫時具有致病性)的理解,以用於診斷、預後和治療。

關鍵字

IMGT;免疫遺傳學;Immunoinformatics;IMGT-ONTOLOGY;免疫球蛋白(IG);T細胞受體(TR);免疫曲目;IMGT獨特的編號;新一代測序

IMGT®免疫信息學的誕生

IMGT®國際免疫遺傳學信息係統®[1,2], 1989年由法國蒙彼利埃的Marie-Paule Lefranc(法國國家科學研究中心和蒙彼利埃大學)創立。IMGT的成立®標誌著免疫信息學的出現,這是一門新興的科學,出現在免疫遺傳學和生物信息學之間。免疫球蛋白(IG)或抗體和T細胞受體(TR)可變基因(V)、多樣性基因(D)、連接基因(J)和恒定基因(C)首次被正式承認為與傳統基因一樣的“基因”[3-6]。這一重大突破使得複雜和高度多樣化的適應性免疫反應的基因和數據可以在基因組數據庫和工具中進行管理。

這種適應性免疫反應是由下頜脊椎動物獲得的有頜類),從魚類到人類,所有現存的下頜脊椎動物物種都有這種基因。它的特點是具有顯著的免疫特異性和記憶性,這是B細胞和T細胞的特性,因為它們的抗原受體具有極大的多樣性。特異性抗原受體包括B細胞和漿細胞[3]的IG或抗體,以及TR[4]。IG識別其原生(未加工的)形式的抗原,而TR識別加工過的蛋白抗原,這些蛋白抗原通過高度多態的主組織相容性(MH,在人類HLA中為人類白細胞抗原)蛋白以多肽的形式呈現。

每個個體的潛在抗原受體庫估計約為2 × 1012不同的IG和TR,而限製因素隻是生物基因編程產生的B細胞和T細胞的數量[3,4]。這種巨大的多樣性源於IG和TR鏈的複雜分子合成,特別是其n端可變結構域(V-DOMAIN)的複雜分子合成,V-DOMAIN識別和結合抗原[3,4]。IG和TR合成包括幾種發生在DNA水平的獨特機製:編碼V- domain的V、D和J基因的組合重排(V-(D)-J被拚接到轉錄本中編碼C- region的C基因上);V、D和J基因末端的外切酶修飾和由DNA核苷酸酰轉移酶(DNTT,末端脫氧核苷酸酰轉移酶,TdT)隨機添加核苷酸,從而創建連接的n多樣性區域,隨後在B細胞分化過程中,對IG、體細胞高突變、基因轉換(例如在鳥類中)和高等脊椎動物的類或亞類切換[3,4]。

IMGT®管理IG和TR的多樣性和複雜性以及人類和其他脊椎動物MH的多態性。IMGT®還專門研究脊椎動物和無脊椎動物的免疫球蛋白超家族(IgSF)和MH超家族(msf)的其他蛋白質以及免疫係統相關蛋白(RPI)[2]。IMGT®提供了對基因組、蛋白質組、遺傳學和二維(2D)和三維(3D)結構的標準化數據的通用訪問。IMGT®是免疫遺傳學中公認的研究免疫功能基因組學的優質綜合知識資源。IMGT®包括7個數據庫(用於序列、基因和3D結構)[7-12]和17個在線工具[13-28],以及超過15,000頁的web資源(例如,IMGT科學圖表、IMGT知識庫、IMGT教育> Aide-mémoire[29]、IMGT醫學頁麵、IMGT獸醫頁麵、IMGT生物技術頁麵、IMGT免疫信息學頁麵)[2]。IMGT®是免疫遺傳學和免疫信息學的全球參考文獻[30-45]。自1995年以來,其標準已得到世界衛生組織-國際免疫學會聯盟(WHOIUIS)命名委員會的認可(第一IMGT)®第九屆國際免疫學大會(San Francisco, CA, USA)[46,47]和世衛組織國際非專利名稱(INN)規劃[48,49]在線訪問。

IMGT的準確性和一致性®數據基於IMGT-ONTOLOGY[50-52],這是免疫遺傳學和免疫信息學的第一個也是迄今為止唯一的本體[50-69]。IMGT-ONTOLOGY通過七個公理管理免疫遺傳學知識的不同方麵:識別、描述、分類、計數、定位、定位和獲取[51,52,56]。由這些公理產生的概念導致了IMGT的細化®構成IMGT科學圖表的標準:例如,IMGT®標準化關鍵詞(識別)[57],IMGT®標準化標簽(描述)[58],IMGT®標準化基因和等位基因命名法(CLASSIFICATION) [59], IMGT唯一編號[60-65]及其標準化圖形2D表示或IMGT Colliers de Perles [66-69] (NUMEROTATION)。

以IG和TR免疫序列為重點,我們首先回顧了由這些IMGT-本體論概念產生的基礎信息,這些概念導致了IMGT科學圖表規則,然後回顧了IMGT/ HighV-QUEST [18,23,24], IMGT/ HighV-QUEST是用於分析下一代測序(NGS)重排IG和TR序列核苷酸序列的在線門戶網站。IMGT/HighV-QUEST是IMGT/V-QUEST[13-18]的高吞吐量版本,綜合了IMGT/ JunctionAnalysis[19,20]和IMGT/Automat[21,22]的結果。IMGT/HighVQUEST在IMGT/LIGM-DB[7]中注釋的序列構建的IMGT參考目錄上運行®核苷酸數據庫(2015年7月來自347個物種的176,948個序列),以及IMGT/GENE-DB [8]®基因數據庫(來自22種植物的3567個基因和5258個等位基因,其中有715個基因和1469個等位基因智人869個基因和1319個等位基因畝骶2015年7月)。

統一IMGT®該方法對於連接生理學和病理情況下IG和TR的知識具有重要意義[70-75],對於指導抗體的發現、人源化和工程[76-86],以及為自身免疫和感染性疾病中的NGS序列提供相同的標準化結果具有重要意義。

NGS的基本imgt -本體概念
標識:IMGT®標準化的關鍵字

超過325 IMGT®標準化關鍵詞(序列189個,三維結構137個)被精確定義為[57]。它們表示注釋過程中分配的受控詞彙表,並支持查詢IMGT的標準化搜索標準®數據庫和提取序列和3D結構。它們已於2010年進入國家生物醫學本體中心(NCBO)的生物門戶[87]。

在合成IG分子的每一步都指定標準化的關鍵詞。在IMGT/ LIGM-DB文件[7]的“DE”(定義)和“KW”(關鍵字)行中可以找到分配給核苷酸序列的那些。例如,它們表征了基因類型、配置類型和功能類型[57]。有六種基因類型:可變基因(V)、多樣性基因(D)、聯結基因(J)、恒定基因(C)、常規有前導基因和常規無前導基因。其中4個基因(V, D, J和C)識別了IG和TR基因,並與免疫遺傳學有關。有四種配置類型:種係(DNA重排前的V、D和J基因)、重排(DNA重排後的V、D和J基因)、部分重排(隻有一次DNA重排後的D基因)和未定義(C基因和未重排的常規基因)。功能類型取決於基因配置。種係或未定義構型的基因功能類型為功能性(F)、開放閱讀框(ORF)或假基因(P)。重排或部分重排構型的基因功能類型為多產型(V-(D)- j區無終止密碼子和幀內結)或非多產型(V-(D)- j區無終止密碼子和/或幀外結)。

20種常用氨基酸(AA)被劃分為11個IMGT理化類(IMGT®[1], IMGT教育> Aide-mémoire >氨基酸)。氨基酸的變化按親水性(3類)、體積(5類)和IMGT理化類(11類)[29]進行描述。例如Q1 > E(+ +−)表示在氨基酸變化(Q > E)中,密碼子1上的兩個氨基酸屬於相同的親水性(+)和體積(+)類,但屬於不同的IMGT理化性質(−)類[29]。IMGT®中確定了四種類型的AA變化:非常相似(+ + +),相似(+ +−,+−+),不相似(−+,−+−,+−),非常不相似(−−)。

描述:IMGT®標準化的標簽

超過560 IMGT®標準化標簽(序列標簽277,3D結構標簽285)被精確定義為[58]。它們用大寫字母(不是複數)書寫,以便在不創造新術語的情況下被識別。分配給序列描述的標準化標簽可以在IMGT/LIGM-DB文件[7]的“FT”(特征)行中找到。與通用數據庫(GenBank/歐洲核苷酸檔案(ENA)/日本DNA數據庫(DDBJ))相比,查詢這些標簽是一個很大的優勢。因此,可以查詢人類重排列的IG-Heavy-Gamma生產序列的“CDR3-IMGT”(例如,獲得1828 CDR3-IMGT,其序列在核苷酸或氨基酸水平)。核心標簽包括V- region、D- region、J- region、C- region,分別對應V、D、J、C基因的編碼區。IG鏈和域的IMGT結構標簽允許描述3D結構的鏈和域(參見例如http://www.imgt)。org/3Dstructure-DB/cgi/details.cgi ? pdbcode = 1 hzh)。IMGT科學圖表(見http://www.imgt.org/IMGTScientificChart/SequenceDescription/ IMGT3Dkeywords.html)詳細介紹了人體IG結構標簽與序列標簽的對應關係、IMGT/PROTEIN-DB和IMGT/3Dstructure-DB中用於識別的標準化關鍵詞與用於描述的標準化標簽之間的鏈接和對應關係。這些標簽對於在數據庫和工具[58]中對IG序列和結構進行標準化描述是必要的。

在結構域的特定位置高度保守的氨基酸具有IMGT標記[58]。因此,在V和C結構域有三個共同的氨基酸標記:1 - cys(半胱氨酸C在23號位置)、conservative vedtrp(色氨酸W在41號位置)和2 - cys (C在104號位置)[60-63,65]。另外兩個標簽是V-DOMAIN的特征,對應於由J-REGION編碼的標準F/W-G-X-G基序的第一個氨基酸(F為苯丙氨酸,W為色氨酸,G為甘氨酸,X為任何氨基酸):J-PHE或J-TRP (F或W位於118位)[60- 62,65]。

分類:IMGT®標準化基因和等位基因

imgt -本體分類公理是免疫信息學誕生[45]的導火索。事實上,IMGT®分類概念允許我們第一次對抗原受體基因(IG和TR)進行分類,適用於任何位點(例如,重免疫球蛋白(IGH), T細胞受體(TRA)),適用於任何基因配置(種係,未定義或重排)和任何物種(從魚類到人類)。在高等脊椎動物中,有三個IG主位點(其他位點對應染色體孤子集,其基因為孤子,不用於IG鏈合成)。IG的主要位點包括免疫球蛋白重鏈(IGH),輕鏈包括高等脊椎動物的免疫球蛋白kappa (IGK)和免疫球蛋白lambda (IGL)以及魚類的免疫球蛋白iota (IMGT)®[1], IMGT曲目)。

自IMGT成立以來®1989年,在紐黑文舉行的第十屆人類基因組圖譜繪製研討會(HGM10)期間,人類和其他脊椎動物物種的IG和TR的標準化分類和命名由IMGT命名委員會(IMGT- nc)負責。

IMGT®基因和等位基因的名稱是基於“組”、“子組”、“基因”和“等位基因”[59]的分類概念。“組”允許對屬於同一多基因家族、同一物種內或不同物種之間的一組基因進行分類。例如,高等脊椎動物的IG分為10組:IGHV、IGHD、IGHJ、IGHC、IGKV、IGKJ、IGKC、IGLV、IGLJ、IGLC。“亞組”允許對屬於同一組的基因子集進行分類,並且在給定物種中,在核苷酸水平上至少具有75%的同一性,例如,智人的IGHV1亞組。亞群、基因和等位基因總是與一個物種的名字相關。等位基因是基因的多態變異,其特征是其序列在核苷酸水平上的突變,在其核心序列中被識別出來,並與基因等位基因參考序列進行比較,稱為等位基因01.例如,智人IGHV1 - 201是等位基因01的智人IGHV1-2基因屬於智人該子組本身屬於IGHV組。對於IGH位點,常量基因由編碼的同型(IGHM, IGHD, IGHG3…)對應的字母(和最終的數字)指定,而不是使用字母c。IG和TR基因和等位基因在任何物種中都是大寫字母,在出版物中沒有斜體。IMGT-ONTOLOGY分類概念已被納入NCBO生物門戶[87]。

的IMGT®IG和TR基因名[3-6]於1999年由人類基因組組織(HUGO)命名委員會(HGNC)批準[88,89],並由WHO-IUIS IG和TR命名小組委員會批準[46,47]。的IMGT®IG和TR基因名是官方國際參考,因此已被輸入IMGT/ gene - db[8]、基因組數據庫(GDB)[90]、美國國家生物技術信息中心(NCBI)的LocusLink[91]、Entrez gene (NCBI)當該數據庫(現命名為“基因”)取代LocusLink[92]、NCBI MapViewer、歐洲生物信息學研究所(EBI)的integrbl[93]、以及英國威康信托基金會桑格研究所的脊椎動物基因組注釋(Vega)瀏覽器[94]。HGNC、NCBI基因、ensemble和Vega與IMGT/ Gene - db[8]直接相關。IMGT®人類IG和TR基因也被整合到NCBO生物門戶的imgt -本體中,並在同一地點整合到HUGO本體和國家癌症研究所(NCI)的mettathesaurus中。的畝骶繼IMGT之後,IG和TR基因於2005年被提供給小鼠基因組數據庫(MGD) [95]®在法國斯特拉斯堡舉行的第19屆國際小鼠基因組會議(IMGC)上介紹了7個小鼠IG和TR基因座。2008年,UniProt提供了人類IG和TR常量基因(如Homo sapiens IGHM, IGHG1, IGHG2)的氨基酸序列[96]。自2007年以來,IMGT®IG基因和等位基因名稱已用於描述WHO-INN規劃的治療性單克隆抗體(-mab後綴)和免疫應用融合蛋白(ffia) (-cept後綴)[48,49]。

編號:IMGT唯一編號和IMGT Collier de Perles編號

IMGT-本體數論公理被公認為“IMGT”®“羅塞塔石碑”,它連接了生物信息學的生物學和計算領域。的IMGT®數字概念包括IMGT唯一編號[60-65]及其圖形2D表示,IMGT Collier de Perles[66-69]。這些概念是為“領域”開發的,並由“領域”開發的,它們將序列、結構和相互作用集成到功能基因組學的標準化領域中心知識中。對變量V域(IG和TR的V- domain, IG和TR以外的IgSF的V- likedomain)[60-62]、常量C域(IG和TR的C- domain, IG和TR以外的IgSF的C- like - domain)[63]和槽G域(MH的G- domain, MH以外的msf的G- like - domain)[64]定義了IMGT唯一編號。因此,IMGT唯一編號和IMGT Collier de Perles為IG、TR、MH、IgSF和msf的V、C和G結構域的序列和結構提供了一個確定的、通用的跨物種係統,包括無脊椎動物[65,69,84]。

NGS的IMGT/HighV-QUEST參考門戶網站
IMGT / HighV-QUEST概述

IMGT/HighV-QUEST[23]創建於2010年10月,是IMGT/V-QUEST的高吞吐量版本。它是迄今為止唯一的在線工具,可直接從NGS中分析完整的IG和TR V-DOMAIN核苷酸序列。IMGT/HighV-QUEST每次運行最多分析50萬個序列,並對結果進行統計分析[23,24],具有與IMGT/V-QUEST[13-18,70]和IMGT/JunctionAnalysis[19,20]相同的分辨率和高質量結果。實際上,IMGT/HighV-QUEST使用相同的算法,並針對相同的IMGT參考目錄運行。2015年7月,IMGT/HighV-QUEST[18,23,24]對超過66.2億序列進行了分析,來自41個國家的1157名用戶(44%的用戶來自美國,37%來自歐盟,19%來自其他國家)。

IMGT/HighV-QUEST功能和結果

IMGT/HighV-QUEST功能與IMGT/ V-QUEST[13-18]基本相同®用於IG和TR V-DOMAIN核苷酸序列分析的在線工具(表1)。IMGT/HighV-QUEST根據IMGT唯一編號對用戶序列進行編號[62],並相應地引入間隙。它識別了重排IG和TR序列中的變量(V)、多樣性(D)和連接(J)基因,並通過與IMGT/V- quest參考目錄的比較,描述了IG中由體細胞超突變引起的核苷酸(nt)突變和氨基酸(AA)變化[224,24]。該工具集成了IMGT/ JunctionAnalysis[19,20]用於V-D-J或V-J連接的詳細描述,IMGT/Automat[21,22]用於完整的序列注釋和描述IMGT標簽的劃分。默認情況下,IMGT/ HighV-QUEST識別插入/刪除(indels),這是均聚物雜交引起的NGS錯誤,並糾正它們[24]。IMGT克隆型(AA)[24]的統計分析和表征是特定於IMGT/HighV-QUEST的功能(表1)。

IMGT / HighV-QUEST參考目錄

IMGT/HighV-QUEST使用與IMGT/ V-QUEST[2]相同的參考目錄。它按種和位點組織,由IMGT參考序列組成。它包括所有功能(F)基因和等位基因的核心區域(V- region, D- region和J- region)的種係V, D和J核苷酸序列,所有開放閱讀框(ORF)和所有框架內假基因(P)等位基因,來自IMGT/GENE-DB[8]。對應“F+ORF+幀內P”集合,在“高級參數”中默認選擇。其他選項允許從參考目錄中排除假基因(“F+ORF”),或者,例如,在基因組分析中,包括位於主位點外的孤子基因(“F+ORF包括孤子”或“F+ORF+框內P包括孤子”)。

根據定義,IMGT/V-QUEST參考目錄包含每個等位基因的一個參考序列。默認情況下,用戶序列將與所選集合的所有基因的等位基因進行比較。然而,“高級參數”選項“With allele *01 only”是有用的,如果用戶序列需要與不同的基因比較;和/或使用相同基因的用戶序列是否需要對齊在一起(獨立於等位基因多態性)。

IMGT/V-QUEST參考目錄已經為被廣泛研究的物種建立,例如人類和老鼠,它們的基因命名法已經確定。這也適用於其他具有臨時命名法的IMGT參考目錄集不完整的物種或分類單元。

IMGT / HighV-QUEST更新

IMGT/HighVQUEST使用的每個IMGT/V-QUEST程序版本都由一個帶日期的數字標識(IMGT/V-QUEST程序版本頁麵中的更新和修改列表見http://www.imgt.org/IMGT_vquest/share/textes/programversions.html)。IMGT/HighV-QUEST使用的每個IMGT/V-QUEST參考目錄都類似地由一個帶日期的數字標識(IMGT/V-QUEST參考目錄發布頁麵中的更改列表在http://www.imgt.org/ IMGT_vquest/share/textes/datarelease .html)。

IMGT/HighV-QUEST自己的版本號反映了特定於係統的功能的更新。

IMGT/HighV-QUEST歡迎和搜索頁麵

至於另一個IMGT®數據庫和工具,IMGT/HighV-QUEST是免費提供給學術界。然而,IMGT/HighV-QUEST歡迎頁麵需要用戶標識,並為新用戶提供一個注冊鏈接。已經設置了用戶標識,以避免服務器的非相關使用和過載,並在需要時與用戶聯係。用戶標識提供了訪問IMGT/HighV-QUEST Search頁麵的權限(圖1)。

IMGT/HighV-QUEST Search頁麵允許啟動序列批量分析。頁麵頂部的菜單欄回顧了登錄,並提供了一個到“分析曆史”的鏈接,以跟蹤批處理的過程並下載結果(另外兩個菜單,“啟動統計”用於對序列批處理結果進行統計,“統計曆史”用於下載相應的統計結果,這裏不詳細說明)。

在IMGT/HighV-QUEST搜索頁麵的頂部,用戶必須為分析提供一個標題,以選擇物種(例如,智人)和受體類型(IG或TR)或位點(例如,IGL)的下拉列表。上傳的文件必須包含FASTA中IG或TR重排的核苷酸序列,必須為文本格式。當分析在本地分析隊列中排隊時和/或當分析提交給計算機處理時和/或當分析完成時和/或當結果可以下載時和/或分析過期前5天時,用戶可以選擇接收電子郵件通知。

在顯示結果中,用戶可以為輸出選擇結果文件:A.“詳細視圖”(每個序列的單獨結果文件),這是可選的,隻對包含少於150000個序列的批次可用。B.“CSV文件”,如果全部選中,則最多包含11個文件(選項與IMGT/V-QUEST的“Excel文件”相同)。

在“高級參數”中,用戶可以選擇參數(與IMGT/V-QUEST相同)。“搜索插入和刪除”(IMGT/V-QUEST中的一個選項)在IMGT/HighVQUEST中默認選中。

IMGT / HighV-QUEST輸出

通過IMGT/HighV-QUEST得到的結果與IMGT/V-QUEST得到的結果完全相同,前提是這些序列使用相同的IMGT/V-QUEST程序版本,相同的IMGT/V-QUEST參考目錄版本,相同的物種和受體類型或位點選擇,在高級參數中選擇相同的選項。結果被提供在一個。txz歸檔文件中,其中包含一個包含11個CSV文件的主文件夾(如果全部被選中),並且可能包括一個子文件夾,其中包含每個提交序列的單個文件,以文本形式(如果在IMGT/HighV-QUEST搜索頁麵中選擇了“詳細視圖”的選項“包含單個結果文件”)。選擇文本和CSV格式是為了方便進行進一步解釋和提取知識的統計研究。IMGT/HighV-QUEST結果的格式與IMGT/V-QUEST的“Excel文件”顯示的選項“下載在壓縮包中”的格式相同。

表2總結了11個CSV文件的內容。CSV文件中每個分析的序列包含一行,一個完整的結果報告可以包含多達539列。

1.“總結”文件# 1(29列用“插入和刪除搜索”默認情況下,沒有它或25)提供的合成分析,即序列名稱,序列功能,最接近的名字V, D和J和等位基因,基因的排列分數和身份V的百分比和J D層閱讀框,FR-IMGT CDR-IMGT長度,氨基酸(AA)結(轉移(s)所示#如果有的話)提供的IMGT / JunctionAnalysis,對插入和刪除的描述(如有),與V和J基因及其等位基因的識別有關的警告,序列的功能,序列在提交時的方向(“-”表示相反,“+”表示直接),以及直接方向的核苷酸序列(如有插入則用大寫字母插入)。IMGT/HighV-QUEST“Summary”文件#1的結果與IMGT/V-QUEST“results Summary”文件的結果相同(圖2)。

表1:IMGT/HighV-QUEST功能和結果*通用於IMGT/HighV-QUEST和IMGT/V-QUEST(相同的算法和相同的IMGT參考目錄)。
在IMGT / V-QUEST * *選項。
* * *具體IMGT / HighV-QUEST。

圖1所示。IMGT / HighV-QUEST搜索頁麵。

2.“IMGT-gap -nt-sequences”文件#2(18列)包括根據標簽V-D-J-REGION, V-J-REGION, V-REGION, FR1-IMGT, CDR1-IMGT, FR2-IMGT, CDR2-IMGT, FR3-IMGT的IMGT唯一編號進行間隙的核苷酸(nt)序列,以及CDR3-IMGT, JUNCTION, J-REGION和FR4- IMGT的核苷酸序列。“nt -sequences”文件#3(66、81、102或114列,取決於標識的D(0、1、2或3)的數量)包括IMGT/Automat自動分隔的所有標簽(未分隔的nt序列)。“IMGTgapped-AA-sequences”文件#4(18列)和“AA-sequences”文件#5(18列)分別包括與文件#2相同標簽的AA序列,間隙(根據IMGT唯一編號)和未間隙。文件#2到#5的結果與IMGT/VQUEST“7”中所示的結果相同。V-REGION翻譯”(圖3A)和“13。IMGT/Automat注釋”(圖3B)。

3.“Junction”文件#6包括IMGT/JunctionAnalysis的所有結果(40列IGL, IGK, TRA和TRG序列(沒有D), 53(如果一個D), 73(如果兩個D)或84(如果3d)列IGH, TRB和TRD序列)。連接中描述的所有標簽都包含了它們的核苷酸序列和長度(nt的數量),以及3 ' v - region, 5 '和3 ' D-REGION和5 ' J-REGION的修剪nt的數量,CDR3-IMGT的翻譯和junction的翻譯(包括2 - cys (C104)和J-PHE (F118)或J-TRP (W118))的翻譯,如果有移框,則用#表示,沒有移框。“Junction”文件#6的結果與IMGT/V-QUEST“4”的結果相同。IMGT/聯結分析的結果”(圖4)。

4.“V-REGION-mutation-and-AA-change-table”文件#7(11列)包括V-REGION、FR1- IMGT、CDR1-IMGT、FR2-IMGT、CDR2-IMGT、FR3-IMGT和CDR3- IMGT的nt突變和AA更改列表。文件#7的結果與IMGT/V-QUEST”9的結果相同。“V-REGION突變和AA變化表”(圖5)。對於每個FR-IMGT和CDR-IMGT,其nt和密碼子位置根據IMGT唯一編號[62]描述nt突變和對應的AA變化,AA變化根據IMGT AA類[29](IMGT Education > Aidemémoire)描述。

5.“V-REGION-nt-mutation-statistics”文件#8(130列)和“V-REGION-AA-change-statistics”文件#9(109列)分別報告nt突變和AA變化的統計數據。文件#8包括突變的總數、靜默和非靜默突變的數量、躍遷和轉換的數量。文件#9包括AA類變化類型(+++、++-、+-+、+——、-+-、——+、——)的AA類變化次數,以及AA類相似度(Nb of Very similar, Nb of similar, Nb of different, Nb of Very different)的AA類變化次數。在這兩個文件的結果給出了V-REGION, FR1-IMGT, CDR1-IMGT, FR2-IMGT, CDR2-IMGT, FR3- IMGT和CDR3-IMGT。文件#8和#9的結果分別等同於IMGT/V-QUEST“10”的“核苷酸(nt)突變”和“氨基酸(AA)變化”。V-REGION突變和AA變化統計”(圖6)。

表2:十一份CSV格式的IMGT/HighV-QUEST結果文件的內容(結果等同於在線IMGT/V-QUEST的“Excel文件”)。*: 1號至10號文件包括係統的序列識別,即序列名稱、功能、最近的V基因和等位基因的名稱,1號至6號文件還包括D和J基因和等位基因。報告突變分析的7號至10號文件主要用於免疫球蛋白(IG)。文件#1到#10包含每個提交序列的一行。

圖2。IMGT/HighV-QUEST“摘要”文件#1(29列)的結果與IMGT/V-QUEST“結果摘要表”的結果相同,其中選項為“搜索插入和刪除”(seq1: IMGT/LIGM-DB的登錄號AF013616)。

圖3。IMGT/HighV-QUEST文件#2、#4和#5(各18列)和文件#3(66、81、102或114列,取決於識別的D(0,1,2或3)的數量)的結果與IMGT/V-QUEST“7”的結果相同。“V-REGION翻譯”(A)和“13”。IMGT/ Automat的注釋”(B)如圖所示(seq 2: IMGT/LIGM-DB的登錄號AB012909)。

圖4。IMGT/HighV-QUEST“Junction”文件#6的結果(40,53,73或84列,取決於識別的D(0,1,2或3)的數量)與IMGT/V-QUEST“4”的結果相同。IMGT/連接分析的結果”顯示在這裏。裁剪nt的數量(這裏的“JUNCTION分析”中的點)在CSV文件的專用列中表示,例如,對於一個D基因和等位基因序列,在“3’v - region裁剪-nt nb”、“5’D- region裁剪-nt nb”、“3’D- region裁剪-nt nb”和“5’j - region裁剪-nt nb”中表示。與種係相比,突變nt的數量(在這裏的“JUNCTION分析”中劃線)在CSV文件的專用列中表示:“3’v - region mutt -nt nb”,“D-REGION mutt -nt nb”,“D1-REGION mutt -nt nb”,“D2-REGION mutt -nt nb”,“D3-REGION mutt -nt nb”,“5’j - region mutt -nt nb”(seq 2: IMGT/LIGM-DB的登錄號AB012909)。

圖5。IMGT/HighV-QUEST“V-REGION-mutation-and-AA-change-table”文件#7(11列)的結果與IMGT/VQUEST“9”的結果相同。V-REGION突變和AA變化表”。例如,在FR1-IMGT列中,c1>g, Q1>E(++-)意味著nt 1處的nt突變(c>g)導致密碼子1處的AA變化(Q>E),具有相同的水親和(+)和體積(+)類,但不同的IMGT物理化學(-)類[29](IMGT/LIGM-DB的登錄號AB012909)。

6.“V-REGION-突變熱點”第10號文件(8列)包括熱點基序((a/t)a, t(a/t), (a/g)g(c/t)(a/t) (a/t), (a/t)(a/g)c(c/t))在最近的V-REGION種係中識別,並具有CDR-IMGT和FR-IMGT定位。文件#10的結果與IMGT/V-QUEST“11”的結果相同。V-REGION突變熱點”(圖7)。

7.第11號“參數”文件包括分析日期、IMGT/V-QUEST程序版本、IMGT/V-QUEST參考目錄發布以及用於分析的參數:物種、受體類型或位點、IMGT參考目錄集、“帶有等位基因*01”(如果選中)、“搜索插入和刪除”,以及在V-REGION的3’中添加(或排除)的核苷酸數量,用於評估校準評分,以及在V-REGION的5’中排除的核苷酸數量,用於評估突變數量,如果這兩個數字不為0(默認值)。

結論

IMGT-ONTOLOGY和IMGT®數據和信息係統是免疫信息學[45]的起源,為IG和TR基因組分析的標準化分析提供了概念、知識和信息學框架。IMGT- ontology允許在IMGT中對人類IG和TR基因及其等位基因進行識別、描述和分類®[3-6],在人類基因組發表之前[97,98]。IMGT庫和IMGT參考目錄不斷更新脊椎動物物種的新測序IG和TR[99-105],最近由於對人類不同單倍型和CNV的分析,IMGT庫和IMGT參考目錄增加了新的人類IG基因和等位基因[106,107]。這些生物生成的數據和標準化的IMGT®分析工具是保持在基礎和臨床研究前沿的高質量數據的免疫譜的探索的關鍵。事實上,IMGT®IG和TR標準用於臨床應用。IMGT/V-QUEST常被臨床醫生用於鑒定抗病原體的成分和分析白血病、淋巴瘤和骨髓瘤,特別是慢性淋巴細胞白血病(CLL)中的IG體細胞高突變[16,72 - 75],在這種情況下,白血病克隆的VH中重排IGHV基因的突變百分比對患者的預後具有價值。對於該評價,IMGT/V-QUEST是歐洲CLL研究倡議(ERIC)推薦的實驗室間比較分析標準[72]。通過IMGT/結分析[19,20]確定的V-(D)- j結的序列也被用於CLL的刻板模式表征[73,74]和合成該結的特異性探針,用於白血病和淋巴瘤中微量殘留疾病(MRD)的檢測和隨訪。隨著NGS用於克隆分析和MRD識別,以及IMGT的產生,血液腫瘤學的一個新時代正在開啟®標準的使用比以往任何時候都需要。這些標準也用於治療性抗體的開發和描述[40- 44,82 -86],人源化和人源抗體[48]在INN提交時需要最接近的人V、J和C基因和等位基因(使用IMGT/DomainGapAlign工具獲得的結果[25-26],經WHO/IUIS IG和TR氨基酸序列命名小組委員會批準)。這些標準與IMGT/HighV-QUEST使用的標準相同。生理條件[108,109]、疫苗接種[24]、自身免疫性疾病[110-111]和傳染病[112-115]中IG和TR的NGS分析為理解保護性和致病性適應性免疫反應提供了新的視角。目的是對許多個體中B和T亞群的IG和TR序列進行特征分析,確定免疫缺陷或自身免疫疾病中B和T細胞序列的傾斜,探索針對HIV-1的廣泛中和抗體(bnAbs)的誘導,了解人類免疫係統產生保護性和致病性抗體的潛力。最終的目標是找到特異性抗體和T細胞受體,這對診斷、預後、疫苗開發和新型免疫療法都有很大的價值。

圖6。IMGT/HighV-QUEST文件#8(130列)和文件#9(109列)的結果與IMGT/V-QUEST“10”的結果相同。V-REGION突變和AA變化統計”兩個表。給出了V-REGION、FR-IMGT和CDR-IMGT的計算結果。統計數據計算到輸入序列中確定的V-REGION的3 '端(包括最後3 '的兩個與最近的種係V-REGION相同的核苷酸)。括號中的V-REGION和CDR3-IMGT列中的數字對應到最近的種係V-REGION的3 '端為止的統計數據,因此可能包括由於結多樣性(IMGT/LIGM-DB的登錄號AB012909)而產生的nt和AA差異。

圖7。IMGT/HighV-QUEST“v - region -突變-熱點”文件第10號(8列)的結果與IMGT/V-QUEST“11”的結果相同。v區突變熱點”。

致謝

我們感謝Joumana Jabado-Michaloud, Géraldine Folch, Mélanie Arrivet, Pascal Bento, Emilie Carillon, Hugo Duvergey, Amélie Houles, Typhaine Paysan-Lafosse, Marine Peralta, Souphatta Sasorith,感謝他們的專業知識和不斷的激勵,Gérard Lefranc感謝他的有益意見,以及IMGT的所有前任成員®團隊,感謝他們的寶貴貢獻。我們感謝冷泉港議定書出版社提供IMGT參考手冊的pdf格式。IMGT®是CNRS的注冊商標。IMGT®是國際醫學信息協會(IMIA)和全球基因組學與健康聯盟(GA4GH)的成員。IMGT®由歐盟生物醫學1 (BIOCT930038)、生物技術BIOTECH2 (BIO4CT960037)、第5期PCRDT生活質量和生物資源管理(QLG2-2000-01287)和第6期PCRDT信息科學與技術(免疫網格,FP6 IST-028069)項目部分資助。IMGT®是生物信息研究所Français de Bioinformatique IFB的ELIXIR免疫信息學主題節點。IMGT®目前由國家科學研究中心(CNRS)、Ministère de l 'Enseignement Supérieur et de la research (MESR)、蒙彼利埃大學、國家研究機構(ANR) Labex MabImprove (ANR-10- labx -53-01)、蒙彼利埃生物校園、Région Languedoc-Roussillon(大高原研究技術(GPTR))支持。這項工作被授予訪問HPC@LR和高性能計算(HPC)資源的國家情報中心Supérieur (CINES)和Très大計算中心(TGCC)的國家糧食委員會à l '原子能源和替代能源(CEA),分配036029(2010-2015)由GENCI(國家計算大設備)。

可用性和引用

使用IMGT的作者®數據庫和工具被鼓勵引用這篇文章和引用IMGT®主頁,http://www.imgt.org。在線訪問IMGT®數據庫和工具可以免費提供給學者,也可以通過許可證和合同提供給公司。

的利益衝突

作者聲明沒有利益衝突。

參考文獻
  1. IMGT®國際免疫遺傳學信息係統®.http:// www.imgt.org [Ref。
  2. Lefranc MP, Giudicelli V, Duroux P, Jabado-Michaloud J, Folch G,等(2015)IMGT®國際免疫遺傳學信息係統®25年過去了。核酸Res 43: D413-422。[Ref。
  3. Lefranc M-P, Lefranc G(2001)《免疫球蛋白知識手冊》,學術出版社:英國倫敦,1-458。[Ref。
  4. Lefranc M-P, Lefranc G(2001)《T細胞受體手冊》,學術出版社:倫敦,英國,1-398。[Ref。
  5. Lefranc M-P(2000)人類免疫球蛋白基因的命名法。在:Coligan JE, Bierer BE, Margulies DE, Shevach EM, Strober W (eds)免疫學當前協議。約翰·威利父子,霍博肯,美國新澤西州,1-37。[Ref。
  6. Lefranc M-P(2000)人類T細胞受體基因的命名法。在:Coligan JE, Bierer BE, Margulies DE, Shevach EM, Strober W (eds)免疫學當前協議。約翰·威利父子,霍博肯,美國新澤西州,1-23。[Ref。
  7. Giudicelli V, Duroux P, Ginestoux C, Folch G, jabato - michaloud J等(2006)IMGT/LIGM-DB®免疫球蛋白和T細胞受體核苷酸序列的綜合數據庫。核酸Res 34: D781-D784。[Ref。
  8. Giudicelli V, Chaume D, Lefranc M-P (2005) IMGT/GENE-DB:人類和小鼠免疫球蛋白和T細胞受體基因的綜合數據庫。核酸Res 33: D256-D261。[Ref。
  9. Kaas Q, Ruiz M, Lefranc M- p (2004) IMGT/3Dstructure-DB和IMGT/ strucalquery,一個免疫球蛋白、T細胞受體和MHC結構數據的數據庫和工具。核酸Res 32: D208-D210。[Ref。
  10. Ehrenmann F, Kaas Q, Lefranc M-P (2010) IMGT/ 3d結構- db和IMGT/DomainGapAlign:免疫球蛋白或抗體、T細胞受體、MHC、IgSF和MhcSF的數據庫和工具。核酸Res 38: D301-D307。[Ref。
  11. Ehrenmann F, Lefranc M-P (2011) IMGT/3D結構- db:查詢IMGT數據庫中免疫學和免疫信息學(IG或抗體、TR、MH、RPI和ffia)的3D結構。冷泉港協議6:750-761。[Ref。
  12. Poiron C, Wu Y, Ginestoux C, Ehrenmann F, Duroux P等。(2010)IMGT/mAb-DB: IMGT®治療性單克隆抗體數據庫。見:the Proceedings of 11èmes Journées Ouvertes de Biologie, Informatique et Mathématiques (JOBIM),法國蒙彼利埃,2010年9月,7-9。[Ref。
  13. Giudicelli V, Chaume D, Lefranc M-P (2004) IMGT/V- quest,免疫球蛋白和T細胞受體V- j和V-D- j重排分析的集成軟件。核酸Res 32: W435-W440。[Ref。
  14. Giudicelli V, Lefranc M-P(2005)交互式IMGT在線工具用於免疫球蛋白和T細胞受體成分分析。In: Veskler BA (ed)免疫學的新研究。新星科學出版公司,紐約,紐約,美國77-105。[Ref。
  15. brochoet X, Lefranc M-P, Giudicelli V (2008) IMGT/V- quest:用於IG和TR標準化V- j和V- d - j序列分析的高度定製和集成係統。核酸Res 36: W503-W508。[Ref。
  16. Giudicelli V, Lefranc M-P (2008) IMGT®免疫球蛋白重排序列的標準化分析。見:Ghia P, Rosenquist R, Davi F (eds)慢性淋巴細胞白血病免疫球蛋白基因分析。Wolters Kluwer健康意大利有限公司:米蘭,意大利,第2章,33- 52。
  17. Giudicelli V, Brochet X, Lefranc M-P (2011) IMGT/V- quest: IMGT對免疫球蛋白(IG)和T細胞受體(TR)核苷酸序列的標準化分析。冷泉港協議6:695-715。[Ref。
  18. 李曉燕,李曉燕,李曉燕(2012)®免疫球蛋白(IG)和T細胞受體(TR) V-(D)- j序列、多態性和IG突變的核苷酸分析工具:NGS的IMGT/VQUEST和IMGT/HighV-QUEST。在:Christiansen FT, Tait BD(編)免疫遺傳學:方法和應用在臨床實踐。Humana出版社,施普林格科學+商業媒體:美國紐約,紐約,第32章,569-604。[Ref。
  19. Yousfi Monod M, Giudicelli V, Chaume D, Lefranc M- p (2004) IMGT/連接分析:免疫球蛋白和T細胞受體複合物V- j和V-D- j連接的第一個分析工具。生物信息學20:i379-i385。[Ref。
  20. Giudicelli V, Lefranc M-P (2011) IMGT/連接分析:重新排列的免疫球蛋白(IG)和T細胞受體(TR)的V- j和V- d - j連接的IMGT標準化分析。冷泉港協議6:716-725。[Ref。
  21. Giudicelli V, Protat C, Lefranc M-P (2003) IG和TR cDNA序列自動注釋的IMGT策略:IMGT/ Automat。見:法國巴黎國家信息與自動化研究所。歐洲計算生物學會議論文集(ECCB 2003),數據和知識庫,ECCB 2003,巴黎,法國,2003年9月27-30日,103-104。
  22. Giudicelli V, Chaume D, Jabado-Michaloud J, Lefranc M-P(2005)免疫遺傳學序列注釋:基於IMGT- ontology的IMGT策略。種馬健康技術信息1 15:3 -8。[Ref。
  23. Alamyar E, Giudicelli V, Shuo L, Duroux P, Lefranc M-P (2012) IMGT/ HighV-QUEST: IMGT®免疫球蛋白(IG)或抗體和T細胞受體(TR)分析的NGS高通量和深度測序。免疫組文獻8:1-15。[Ref。
  24. Li S, Lefranc M-P, Miles JJ, Alamyar E, Giudicelli V,等(2013)T細胞受體IMGT克隆型多樣性和下一代免疫譜分析的IMGT/ HighV-QUEST模式。Nat通信4:1 -13。
  25. Ehrenmann F, Lefranc M-P (2011) IMGT/DomainGapAlign:可變、恒定和凹槽結構域(IG、TR、MH、IgSF、msf)氨基酸序列的IMGT標準化分析。冷泉港協議6:737-749。
  26. Ehrenmann F, Lefranc M-P (2012) IMGT/DomainGapAlign: IMGT®分析IG、TR、MHC、IgSF和MhcSF結構域氨基酸多態性的工具。在:Christiansen FT, Tait BD(編)免疫遺傳學:方法和應用在臨床實踐。Humana出版社,施普林格科學+商業媒體:紐約,紐約,美國,第33章,605-633。[Ref。
  27. Ehrenmann F, Giudicelli V, Duroux P, Lefranc M-P (2011) IMGT/Collier de Perles: IMGT域的標準化表示(IG, TR和IgSF變量和常量域,MH和msf槽域)。冷泉港協議6:726-736。[Ref。
  28. Lane J, Duroux P, Lefranc M-P(2010)從IMGT-本體到IMGT/LIGMotif: IMGT®大基因組序列中免疫球蛋白和T細胞受體基因識別和描述的標準化方法。BMC Bioinform 11:1 -16。[Ref。
  29. Pommié C, Levadoux S, Sabatier R, Lefranc G, Lefranc MP(2004)免疫球蛋白V-REGION氨基酸性質統計分析IMGT標準化標準。J Mol recognition 17: 17-32。[Ref。
  30. Lefranc M-P (2003) IMGT,國際免疫遺傳學信息係統。見:Bock G, Goode J(編)免疫信息學:更好地理解免疫功能的生物信息學策略。諾華基金會研討會。約翰·威利和兒子們:奇切斯特,英國,卷254:126-142。[Ref。
  31. Lefranc M-P, Giudicelli V, Ginestoux C, Chaume D (2003) IMGT,國際免疫遺傳學信息係統:在免疫信息學中的參考。種馬健康技術通知95:74-79。[Ref。
  32. Lefranc M-P(2003)免疫球蛋白和T細胞受體序列分析的IMGT數據庫、網絡資源和工具。白血病17:260 - 266。[Ref。
  33. Lefranc M-P (2004) IMGT,國際免疫遺傳學信息係統®.見:Lo BKC (ed)抗體工程方法和協議,第2版,Humana出版社:Totowa, NJ, USA, 27-49。[Ref。
  34. Lefranc M-P(2004)免疫遺傳學和免疫信息學的IMGT- ontology和IMGT數據庫、工具和Web資源。Mol Immunol 40: 647-660。[Ref。
  35. Lefranc M-P (2005) IMGT,國際免疫遺傳學信息係統:免疫遺傳學和免疫信息學的標準化方法。免疫組Res 1:1 -11。[Ref。
  36. Lefranc M-P (2007) IMGT®國際免疫遺傳學信息係統®immunoinformatics。IMGT的查詢方法®免疫信息學背景下的數據庫、工具和Web資源。在:花DR (ed)免疫信息學:預測矽的免疫原性。Humana出版社,施普林格:Totowa, NJ,美國,第2章,19-42。[Ref。
  37. Lefranc M-P (2008) IMGT-本體,IMGT®免疫信息學數據庫、工具和網絡資源。見:Schoenbach C, Ranganathan S, Brusic V(編)免疫信息學。施普林格科學和商業媒體有限責任公司係列免疫組學評論;施普林格:紐約,紐約,美國,第1卷,第1-18章。[Ref。
  38. 呂福朗M-P, Giudicelli V, Regnier L, Duroux P (2008) IMGT®是生物信息學中連接生物學和計算領域的係統和本體。生物通報9:263-275。[Ref。
  39. Lefranc M-P (2008) IMGT®國際免疫遺傳學信息係統®immunoinformatics。IMGT的查詢方法®免疫信息學背景下的數據庫、工具和Web資源。摩爾生物技術40:101-111。[Ref。
  40. Lefranc M-P(2009)抗體數據庫和工具:IMGT®體驗。在:Z (ed)治療性單克隆抗體:從實驗到臨床。John Wiley和Sons: Hoboken, NJ, USA,第4章,91-114。[Ref。
  41. Lefranc M-P(2009)抗體數據庫:IMGT®這是一個全世界都感興趣的法語平台。基地de données anticorps: IMGT®, une plate-forme française d 'intérêt mondial。醫學科學25:1020-1023。[Ref。
  42. Ehrenmann F, Duroux P, Giudicelli V, Lefranc M-P(2010)抗體用IMGT進行標準化序列和結構分析®.在:Kontermann R, Dübel S (eds)抗體工程。斯普林格-韋爾實驗室:柏林,海德堡,德國,2010;第二卷,第二章,11-31。[Ref。
  43. Lefranc M-P (2011) IMGT國際免疫遺傳學信息係統。冷泉港協議6:595-603。[Ref。
  44. Lefranc M-P (2013) IMGT®信息係統。在:Dubitzky W, Wolkenhauer O, Cho K-H, Yokota H(編)係統生物學百科全書。施普林格科學+商業媒體,LLC012:美國紐約959-964。[Ref。
  45. Lefranc M-P(2014)免疫球蛋白(IG)和T細胞受體基因(TR): IMGT®以及免疫信息學的誕生和興起。前免疫5:1-22。[Ref。
  46. Lefranc M-P (2007) WHO-IUIS免疫球蛋白和T細胞受體命名小組委員會報告。免疫遺傳學59:899- 902。[Ref。
  47. Lefranc M-P(2008) WHO-IUIS免疫球蛋白和T細胞受體命名小組委員會2007年8月報告。第十三屆國際免疫學大會,巴西,裏約熱內盧,Dev Comp Immunol 32:461-463。[Ref。
  48. 世界衛生組織。生物和生物技術物質國際非專有名稱(INN)(綜述)。[Ref。
  49. Lefranc M-P(2011)抗體命名:從IMGT-ONTOLOGY到INN定義。馬伯3:1 - 2。[Ref。
  50. Giudicelli V, Lefranc M-P(1999)免疫遺傳學本體論:IMGTONTOLOGY。生物信息學15:1047 - 1054。[Ref。
  51. Giudicelli V, Lefranc M-P (2012) IMGT-ONTOLOGY 2012。生物信息學與計算生物學前沿。前Genet 3: 1-16。[Ref。
  52. Giudicelli V, Lefranc M-P (2013) imgt -本體論。在:Dubitzky W, Wolkenhauer O, Cho K-H, Yokota H(編)係統生物學百科全書。施普林格科學+商業媒體,LLC012:美國紐約964-972。[Ref。
  53. Giudicelli V, Lefranc M-P (2003) imgt -本體論:Gestion et découverte de connaissances au sein d 'IMGT(法語)。見:Hacid M-S, Kodratoff Y, Boulanger D (eds)萃取和討論(EGC ' 2003)。Hermès科學出版物,拉瓦錫:卡尚,巴黎,法國13-23。[Ref。
  54. Lefranc M-P, Giudicelli V, Ginestoux C, Bosc N, Folch G,等(2004)免疫遺傳學和免疫信息學的IMGT-ONTOLOGY。在《二氧化矽生物》4:17-29。[Ref。
  55. Lefranc M-P, Clément O, Kaas Q, Duprat E, Chastellan P,等(2005)免疫遺傳學和免疫信息學的IMGT-Choreography。在矽生物5:45-60。[Ref。
  56. Duroux P, Kaas Q, Brochet X, Lane J, Ginestoux C等(2008)imgt萬花鏡,正式的IMGT-ONTOLOGY範式。Biochimie 90: 570 - 583。[Ref。
  57. Lefranc M-P(2011)從IMGT-本體識別公理到IMGT標準化關鍵詞:免疫球蛋白(IG)、T細胞受體(TR)和傳統基因。冷泉港協議6:604-613。[Ref。
  58. Lefranc M-P(2011)從IMGT-本體描述公理到IMGT標準化標簽:對於免疫球蛋白(IG)和T細胞受體(TR)的序列和結構。冷泉港協議6:614-626。[Ref。
  59. Lefranc M-P(2011)從IMGT-本體分類公理到IMGT標準化基因和等位基因命名:對於免疫球蛋白(IG)和T細胞受體(TR)。冷泉港協議6:627-632。[Ref。
  60. Lefranc M-P(1997)免疫遺傳學分析的唯一數據庫編號係統。今日免疫18:509。[Ref。
  61. Lefranc M-P(1999)免疫球蛋白、T細胞受體和igg樣結構域的IMGT唯一編號。免疫學家7:132 - 136。
  62. Lefranc M- p, Pommié C, Ruiz M, Giudicelli V, Foulquier E, et al.(2003)免疫球蛋白和T細胞受體可變結構域和Ig超家族V樣結構域的IMGT唯一編號。免疫學雜誌27:55-77。[Ref。
  63. Lefranc M-P, Pommié C, Kaas Q, Duprat E, Bosc N,等(2005)免疫球蛋白和T細胞受體常量結構域和Ig超家族C樣結構域的IMGT唯一編號。免疫學雜誌29:185-203。[Ref。
  64. Lefranc M- p, Duprat E, Kaas Q, trananne M, Thiriot A,等(2005)MHC槽g -域和MHC超族(MhcSF) g - like -域的IMGT唯一編號。Dev Comp Immunol 29: 917-938。[Ref。
  65. Lefranc M-P (2011) IG、TR、MH、IgSF和msf的變量(V)、常數(C)和槽(G)域的IMGT唯一編號。冷泉港協議6:633-642。[Ref。
  66. Ruiz M, Lefranc M- p(2002)具有已知三維結構的人類免疫球蛋白的IMGT基因鑒定和Colliers de Perles。免疫遺傳學53:857 - 883。[Ref。
  67. Kaas Q, Lefranc M-P (2007) IMGT Colliers de Perles: IgSF和MhcSF超家族結構域的標準化序列結構表示。Curr Bioinform 2:21 -30。[Ref。
  68. Kaas Q, Ehrenmann F, Lefranc M-P (2007) IG, TR和IgSf, MHC和MhcSF:我們從IMGT Colliers de Perles中學到了什麼?基因組蛋白質組學6:253-264。[Ref。
  69. Lefranc M-P (2011) IG、TR、MH、IgSF和msf的變量(V)、常數(C)和槽(G)域的IMGT Collier de Perles。冷泉港協議6:643-651。
  70. Lefranc M-P (2014) IMGT®免疫球蛋白譜分析及抗體人源化。見:Alt F, Honjo T, Radbruch A, Reth M (eds) B細胞分子生物學,第二版。愛思維爾有限公司:倫敦,英國,2014,卷1,第27章,481-514。
  71. Robert R, Lefranc M-P, Ghochikyan A, Agadjanyan MG, Cribbs DH,等(2010)小鼠對澱粉樣蛋白β肽n端免疫顯性表位的體液反應的限製性V基因使用和VH/VL配對。Mol Immunol 48: 59-72。[Ref。
  72. Ghia P, Stamatopoulos K, Belessi C, Moreno C, Stilgenbauer S,等(2007)ERIC對慢性淋巴細胞白血病IGHV基因突變狀態分析的建議。白血病21:1-3。[Ref。
  73. Agathangelidis A, Darzentas N, Hadzidimitriou A, Brochet X, Murray F, et .(2012)三分之一的慢性淋巴細胞白血病中的b細胞受體的刻板化:麵向具有靶向治療幹預意義的分子分類。血液119:4467- 4475。[Ref。
  74. Kostareli E, Gounari M, Janus A, Murray F, Brochet X,等人(2012)b細胞淋巴細胞增殖中的抗原受體刻板化:具有類風濕因子活性的IGHV4-59 / IGKV3-20受體的案例。白血病26日:1127 - 1131。[Ref。
  75. Xochelli A, Agathangelidis A, Kavakiotis I, Minga E, Sutton LA,等。(2015)免疫球蛋白重變量(IGHV)基因和等位基因:慢性淋巴細胞白血病研究和預測的新實體、新名稱和意義。免疫遺傳學67:61 - 66。[Ref。
  76. Jefferis R, Lefranc M-P(2009)人類免疫球蛋白異型:免疫原性的可能含義。馬伯1:332 - 338。[Ref。
  77. Lefranc M-P, Lefranc G(2012)人類Gm, Km和Am異型及其分子特征:多態性的顯著證明。在:Christiansen FT, Tait BD(編)免疫遺傳學:方法和應用在臨床實踐。Humana出版社,施普林格:紐約,紐約,美國,第34,635-680章。[Ref。
  78. Dechavanne C, Guillonneau F, Chiappetta G, Sago L, Lévy P,等(2012)G3m和IGHG3等位基因的質譜檢測及差異母兒和新生兒IgG3的隨訪。PLoS One 7: e46097。[Ref。
  79. Magdelaine-Beuzelin C, Kaas Q, Wehbi V, Ohresser M, Jefferis R, et al.(2007)批準用於癌症治療的單克隆抗體可變結構域的結構-功能關係。血液醇64:210-225。[Ref。
  80. Pelat T, Bedouelle H, Rees AR, Crennell SJ, Lefranc M-P,等(2008)通過體外和矽工程,一種非人靈長類動物抗體的種係人源化,可以中和炭疽毒素。分子生物學雜誌384:1400-1407。[Ref。
  81. Pelat T, Hust M, Hale M, Lefranc M- p, Dübel S,等(2009)一種中和蓖麻毒素生物活性的類人抗體片段(scFv)的分離。BMC生物技術。9:1-13。[Ref。
  82. Lefranc M-P, Ehrenmann F, Ginestoux C, Duroux P, Giudicelli V (2012) IMGT的使用®抗體工程和人性化的數據庫和工具。見:Chames P (ed)抗體工程,第二版。Humana出版社,施普林格科學+商業媒體有限責任公司:紐約,紐約,美國,第1章,3-37。[Ref。
  83. Alamyar E, Giudicelli V, Duroux P, Lefranc M-P(2013)抗體V和C結構域序列、結構和相互作用分析,特別參考IMGT®.見:Ossipow V, Fisher A(編)單克隆抗體:方法和協議,第2版。Humana出版社,施普林格科學+商業媒體有限責任公司:紐約,紐約,美國,2013,第21章,337-381。[Ref。
  84. Lefranc M-P (2013) V、C和G結構域的免疫信息學:IMGT®IG, TR和IgSF, MH和msf的權威係統。見:De RK, Tomar N(編)免疫信息學:從生物學到信息學,第2版。Humana出版社,施普林格科學+商業媒體有限責任公司:美國紐約,紐約,第4章,59-107。[Ref。
  85. Lefranc M-P(2014)如何使用IMGT®用於治療性抗體工程。見:Dübel S, Reichert J (eds)治療性抗體手冊,第2版。Wiley-VCH Verlag GmbH & Co. KGaA: Weinheim,德國,卷1,第10章,229-263。[Ref。
  86. Shirai H, Prades C, Vita R, Marcatili P, Popovic B,等。(2014)抗體信息學在藥物發現中的應用。生物化學生物物理學報1844:2002-2015。[Ref。
  87. http://bioportal.bioontology.org/ontologies/IMGT-ONTOLOGY [Ref。
  88. Wain HM, Bruford EA, Lovering RC, Lush MJ, Wright MW,等(2002)人類基因命名指南。基因組學79:464 - 470。[Ref。
  89. Bruford EA, Lush MJ, Wright MW, Sneddon TP, Povey S, et al.(2008) 2008年HGNC數據庫:人類基因組資源。核酸Res 36: D445-D448。[Ref。
  90. SI Letovsky, Cottingham RW, Porter CJ, Li PW (1998) GDB:人類基因組數據庫。核酸Res 26: 94-99。[Ref。
  91. Maglott DR, Katz KS, Sicotte H, Pruitt KD (2000) NCBI的LocusLink和RefSeq。核酸Res 28: 126-128。
  92. Maglott D, Ostell J, Pruitt KD, Tatusova T (2007) Entrez基因:NCBI的基因中心信息。核酸Res 35: D26-D31。[Ref。
  93. Stabenau A, McVicker G, Melsopp C, Proctor G, Clamp M, et al.(2004)集成核心軟件庫。基因組Res14: 929 - 933。[Ref。
  94. Wilming LG, Gilbert JG, Howe K, Trevanion S, Hubbard T, et al.(2008)脊椎動物基因組注釋(Vega)數據庫。核酸Res 36: D753-D760。[Ref。
  95. Blake JA, Eppig JT, Bult CJ, Kadin JA, Richardson JE, et al.(2006)小鼠基因組數據庫(MGD):更新和增強。核酸Res 34: D562-D567。[Ref。
  96. Bairoch A, Apweiler R, Wu CH, Barker WC, Boeckmann B,等(2005)通用蛋白質資源(UniProt)。核酸Res 33: D154-D159。[Ref。
  97. 國際人類基因組序列聯盟(2001)人類基因組的初步序列和分析。自然409:860 - 921。[Ref。
  98. Venter JC, Adams MD, Myers EW, Li PW,壁畫RJ, et al.(2001)人類基因組序列。科學291:1304 - 1351。[Ref。
  99. Herzig TA, Lefranc M-P, Baldwin CL(2010)牛T細胞受體δ基因的注釋和分類。BMC基因組11:100。[Ref。
  100. Antonacci R, Mineccia M, Lefranc M- p, Ashmaoui HM, Lanave C,等(2011)Camelus dromedarius由於CDR3的多樣化和體細胞突變,T細胞受體δ (TRD)基因顯示可變域庫增大。Mol Immunol 48: 1384-1396。[Ref。
  101. Castro R, Bernard D, Lefranc M-P, Six A, Benmansour A, et al.(2011)硬骨魚T細胞多樣性和TcR序列。魚貝類免疫31:644-654。[Ref。
  102. Schwartz JC, Lefranc M-P, Murtaugh MP(2012)豬(Sus scrofa家蠅)免疫球蛋白kappa位點通過種係基因轉化的進化。免疫遺傳學。64:303 - 311。[Ref。
  103. Schwartz JC, Lefranc M-P, Murtaugh MP(2012)豬(Sus scrofa家豬)免疫球蛋白lambda位點的組織、複雜性和等位基因多樣性。免疫遺傳學64:399 - 407。[Ref。
  104. 石斌,馬琳,何旭,王旭,王萍等。(2014)IMGT/LIGM-DB與IMGT/HighV-QUEST中人鼠免疫球蛋白可變重區比較分析。生物醫學理論模型11:30。[Ref。
  105. Lu J, Panavas T, Thys K, Aerssens J, Naso M, et al.(2014)通過大規模並行測序分析未免疫小鼠IgG可變區和VH CDR3多樣性。摩爾免疫57:274- 83。[Ref。
  106. Watson CT, Steinberg KM, Huddleston J, Warren RL, Malig M,等(2013)人免疫球蛋白重鏈變量、多樣性和連接基因的完整單倍型序列以及等位基因和拷貝數變異的特征。中國日報雜誌92:530-546。[Ref。
  107. Watson CT, Steinberg KM, Graves TA, Warren RL, Malig M,等(2015)對包蟲BAC文庫中的人類IG輕鏈位點進行測序,揭示了遺傳多樣性的位點特異性特征。基因Immun 16:24 -34。[Ref。
  108. Prabakaran P, Chen W, Singarayan MG, Stewart CC, Streaker E,等(2012)人臍帶血細胞表達抗體譜:種係基因使用、連接多樣性和體細胞突變的454測序和IMGT/HighV-QUEST分析。免疫遺傳學64:337 - 350。[Ref。
  109. Mroczek ES, Ippolito GC, Rogosch T, Hoi KH, Hwangpo TA, et al.(2014)血液中不同B細胞亞群的人抗體庫組成的差異。前免疫5:96。[Ref。
  110. O 'Connell AE, Volpi S, Dobbs K, Fiorini C, Tsitsikov E, et al.(2014)下一代測序揭示了Wiskott-Aldrich綜合征患者T和B細胞受體組的傾斜。前免疫5:340。[Ref。
  111. Hershberg U,孟W, Zhang B, Haff N, St Clair EW,等(2014)在Sjögren綜合征的rituximab治療背景下擴展B細胞克隆的持久性和選擇。關節炎治療16:R51。[Ref。
  112. Reiche S, Dwai Y, Bussmann BM, Horn S, Sieg M, et al.(2015)人流感病毒核蛋白特異性記憶B細胞中點突變、插入和缺失的高度個體間多樣性。PLoS One 10: e0128684。[Ref。
  113. 張勇,袁濤,李娟,張勇,徐軍,等(2013)人類免疫係統產生廣泛中和性HIV-1抗體的潛力:對疫苗開發的啟示。艾滋病27:2529- 2539。[Ref。
  114. Prabakaran P, Chen W, Dimitrov DS(2014)抗體種係/成熟假說,廣泛中和抗體對HIV-1和臍帶血IgM成分的誘導。Front Immunol 5:398。[Ref。
  115. Li L, Wang X-H, Williams C, Volsky B, Steczko O,等。(2015)HIV-1中和人單克隆抗體中針對V2、V3和CD4結合位點的廣泛突變。Mol Immunol 66: 364-374。[Ref。

在此下載臨時PDF

PDF

條信息

文章類型:研究文章

引用:Giudicelli V, Duroux P, Lavoie A, Aouinti S, Lefranc M-P, et al.(2015)自身免疫和感染性疾病中NGS免疫球蛋白(IG)和T細胞受體(TR)成分的IMGT- ontology到IMGT/HighV-QUEST。Autoimmun感染1(1):doi http://dx.doi.org/10.16966/2470-1025.103

版權:©2015 Giudicelli V等人。這是一篇開放獲取的文章,根據創作共用署名許可協議(Creative Commons Attribution License)發布,該協議允許在任何媒體上不受限製地使用、分發和複製,前提是注明原作者和來源。

出版的曆史:

  • 收到日期:2015年7月27日

  • 接受日期:2015年8月4日

  • 發表日期:2015年8月10日