前言
抗體是指機體的獲得性免疫系統在抗原刺激下,由B淋巴細胞經歷產生、成熟、增殖、分化并分泌的可與相應抗原發生特異性結合的一類免疫球蛋白[1].抗體是由兩條完全相同的重鏈和兩條完全相同的輕鏈由二硫鍵和非共價鍵結合[2]形成的“Y”形對稱結構的復合物[3].根據理化性質和生物學功能不同,抗體分為IgG、IgM、IgA、IgD、IgE五類(表1)。IgG抗體占血清Ig總量的80%,分為 IgG1、IgG2、IgG3、IgG4四個亞類,是機體抗感染的“主力軍”[4-5].IgG在血清中持續的時間長,半衰期為20~23 d,是唯一能在母親妊娠期穿過胎盤的抗體。IgM占血清Ig總量的5%~10%,是免疫應答中最先分泌的抗體,是機體抗感染的“先頭部隊”,可用于感染的早期診斷[4-5].IgA抗體占血清Ig總量的10%~15%,分為單體型IgA和分泌型IgA.分泌型IgA主要分布于呼吸、消化、生殖等管道的粘膜表面和乳汁、唾液、淚液中,可中和感染因子,參與局部粘膜免疫,是機體抗感染的“邊防軍”[4-5].IgD抗體占血清Ig總量的0.2%,主要出現在成熟的B淋巴細胞表面上,與B細胞的分化相關[4].
IgE抗體是血清中含量最少的抗體,約占血清Ig總量的0.003%,主要由粘膜下淋巴組織中的漿細胞分泌,參與超敏反應,與機體抗寄生蟲免疫相關[4-5].
抗體是 B 淋巴細胞抗原受體(B cell antigenreceptor, BCR)的分泌形式,抗體的產生和成熟過程也就是B細胞的產生、發育、增殖和分化的過程[2,3,5].其重鏈由V、D、J、C四個基因片段編碼的,輕鏈由V、J、C三個基因片段編碼。成熟的B細胞從骨髓釋放到外周血中,經過特異性抗原的刺激后會進入淋巴結的生發中心,在生發中心中經過細胞增殖、體細胞超突變、親和力成熟、抗原受體編輯、種型轉化等復雜事件,分化成能分泌特異性抗體的漿細胞和少數的記憶性B細胞[2, 3, 5].經過生發中心的體細胞超突變和親和力成熟過程,進一步增加了抗體譜(Antibody repertoire)的多樣性,使抗體的數量達到了1013的天文數字,并提高了抗體對特異性抗原的親和力[2, 5].
抗體是獲得性免疫的主要組分,在防御性及致病性的免疫反應中起關鍵的作用。通過對抗體發生、發展和成熟過程的解析,促進了對傳染性疾病病理機制、疫苗設計、自免疫疾病治療等免疫學相關的研究。例如,通過對HIV-1緩慢進展患者體內中和廣譜抗體產生及成熟通路的解析,以獲得具有高效中和效應的HIV-1特異抗體,并開始應用于HIV-1疫苗的研發[3, 6-10].在類風濕性關節炎自免疫疾病中,自身抗體基因IGHV4-34明顯富集,可以作為類風濕性關節炎檢測的分子標記和免疫治療的靶點[11].通過對抗體發生、發展的深入及全面解析,不僅能增加我們對免疫調節的認識,而且為疾病的治療和疫苗的研發等臨床應用提供新的技術與方案,引領新型治療性抗體研究的時代。
低通量測序在抗體研究中的應用隨著測序技術的發展,抗體組學的研究經歷了從低通量到高通量的時代變革。在1990~2000年時,主要利用RT-PCR擴增和Sanger測序技術研究少量B細胞的抗體特征[12].應用這一技術,人們開展了致病病毒如HIV-1、流感病毒的單克隆抗體和自免疫疾病相關自身抗體的研究。通過抗體測序結合克隆表達,人們獲得了第一代HIV-1的廣譜抗體如b12、4E10、2G12等抗體[13-17],解析了它們的抗原識別位點,為HIV-1疫苗的研發提供了指導[18-19].運用這一技術,Wardemann等[20]闡明骨髓中產生自身抗體及多效抗體的B細胞至少經過2步獨立的自體耐受性的檢測,當這一過程發生異常時會導致產生分泌自身抗體的漿細胞,誘發自身免疫疾病如系統性紅斑狼瘡和風濕性關節炎[21].
由于技術的低通量性,每次實驗只能分析幾十到幾百個B細胞的抗體特性,與抗體譜的巨大數據相比,低通量技術只為我們揭示了冰山的一角。
高通量測序在抗體組學中的應用對免疫系統的認識及對抗體的挖掘及應用需要人們能全面深入的了解抗體譜的整體特征,因通量限制,這個目標是傳統技術無法實現的。羅氏 454 和Illumina Miseq為代表的下一代測序技術的應用,一次測序即可獲得數以百萬計的B細胞的抗體可變區域序列。結合分子標記與細胞標記技術,NGS為人們展示了更廣闊的抗體譜特性,數據量更加接近人體抗體譜真實數量,使抗體的研究進入了大數據的時代。高通量數據的捕獲也使得研究抗體家系及抗體的成熟途徑成為現實。以下將從實驗的操作、測序平臺的選擇、數據的分析三個方面詳細介紹高通量測序在抗體組學中的進展與應用(圖1)。
2009年Weinstein等[22]首次應用高通量測序技術全面研究了斑馬魚的抗體庫特征,揭示不同斑馬魚個體間重鏈VDJ基因的使用頻率存在相似性,促進了高通量測序技術在人抗體組分析中的應用??贵w的高通量測序需要考慮實驗設計、重鏈與輕鏈配對、數據的分析、挖掘及可視化等問題。近5年高通量測序技術在抗體組學的應用可以分為2個時期:第一個時期為2009~2013年,利用抗體可變區與恒定區的混合引物,通過巢式PCR從外周血單個核細胞cDNA中分別擴增抗體重鏈與輕鏈基因,然后通過羅氏454測序平臺測序(圖1A)。
應用這一技術從HIV-1患者中分離出了中和力更強的第二代廣譜中和抗體,如 VRC01、VRC03、CH103-CH106、CH01-CH04、10E8等。結合結構生物學研究者解析出了HIV-1病毒4個重要的保守表位結構域,分別是CD4結合表位、V1/V2區、V3區、gp41蛋白近膜外周區[23-28].對這些抗體成熟通路的解析及HIV-1保守表位的分析,可以指導HIV-1疫苗的設計和生產,從而為預防HIV-1提供了新的思路。盡管這些方法發展迅速,但仍存在諸多問題:如混合B細胞樣本增加了特異性增殖B細胞克隆分析的難度;設計在V區的正向引物并不能覆蓋所有的抗體基因片段,多個正向引物的混合增加了PCR 的偏好性;盡管可以從混合的 mRNA 樣本中同時測出抗體的重鏈與輕鏈,但失去了體內重鏈與輕鏈的配對信息;454測序平臺容易引入堿基缺失與插入,增加了后續分析的難度。
針對以上問題,新的技術被開發并成功應用到抗體測序中(圖1B-D)。DeKosky等[29]通過物理方法將單個B細胞中的重鏈與輕鏈基因連結在一起,實現了內源重鏈與輕鏈的配對測序(圖1B)。Robinson[30-32]實驗室通過細胞標記的方法,在反轉錄過程中對不同的B細胞cDNA產物5`端引入特異性的標記,有利于糾正PCR過程及測序過程中的錯誤,并保證了內源重鏈與輕鏈的配對(圖1C)。最近Georgiou[33]實驗室開發了一套新的低花費、單細胞的油滴PCR技術,既可以保持體內重鏈與輕鏈的配對又實現了高通量,每次實驗可以分析多達2×106個B細胞,提高了測序的廣度與深度度(圖1D)。
5'RACE技術的應用,解決了混合引物擴增的偏好性問題,能夠更全面的擴增到抗體基因,結合 PGM 與Illumina MiSeq平臺提高了讀段的長度、測序的深度與數據量,更利于抗體組的高通量分析[34].因此,單細胞測序、重鏈與輕鏈配對、5'RACE、PGM 與 IlluminaMiSeq平臺應用,將進一步推動抗體組學在抗體生產、自免疫疾病診斷、疫苗生產及癌癥相關疾病的研究。
抗體組學的生物信息分析如何從數據的海洋中挖掘出有用的信息,用于指導抗體的生產和疫苗的設計,是抗體組學工作中面臨的巨大挑戰。目前抗體分析中常用的軟件及工具如圖2所示。其中包括的主要步驟如下:對測序得到的原始數據(Raw reads)進行質量控制,濾掉質量低與長度短的讀段并獲得干凈的數據(Clean reads);利用 IgBlast 和IMGT 對抗體的可變區進行 V(D)J 生殖系基因定位(VDJ annotation)[35-36];根據生殖系基因定位將每個合并的讀段剪切至恰好包含整個可變區域;去除冗余數據,對于每個唯一讀段(Unique reads)記錄其總數量;系統化注釋獲得 reads 的可變區域并提取 CDR3 區域;分析 CDR3 區域并獲得抗體的家系信息(Clone orlineage);獲得每個家系中輕重鏈可變區域的序列特性,并利用重鏈和輕鏈各家系的 reads 數量進行輕重鏈配對;對配對好的抗體序列通過實驗驗證功能。
利用上述分析軟件與流程,人們開展了大量的抗體相關工作的分析,促進了數據的分析與挖掘并加快了免疫學的進展。例如我們課題組最近參與的HIV-1中和抗體的研究,通過連續15年樣本的大數據量的分析,解析了HIV-1廣譜中和抗體VRC01的成熟與變異速率,結合結構生物學的分析,揭示了VRC01抗體的進化機制,對開發HIV-1疫苗具有重大的意義[37].同時通過對免疫反應中抗體譜數據特征的分析,揭示了年齡、遺傳等因素對抗體產生與成熟的影響,為開發相應的針對不同人群的有效疫苗提供了指導[38-39].然而,相對于高通量數據的快速發展,目前還沒有一個統一的分析流程,所有的分析軟件主要是借助了一些免費的公用軟件,針對抗體分析的專一性軟件還沒有開發出來?,F有的分析流程也存在一些問題,如:IgBlast和IMGT對抗體序列進行比對時,不能糾正序列中的錯誤,導致比對的不準確性;由于D基因較短,IgBlast和IMGT不能準確地定位D基因;抗體成熟過程中AID酶會引入新的突變,增加了抗體的多樣性并提高了抗體的親和力,然而目前的分析不能區分出AID所介導的突變熱點;家系進化樹的構建完全依賴于序列相似性,沒有考慮原始的生殖基因及AID突變的偏好(Hotspot),會遺漏掉許多基因并使得進化樹不能完全反映細胞內重鏈與輕鏈的配對情況。所有這些問題是需要下一步抗體數據分析中得到解決。
展望
從以上對抗體組學的發展及應用簡述中可以看到,結合高通量測序的抗體組學具有效率高、深度大、基因多樣性更豐富、數據反映更準確等優勢。最近5年里,高通量測序的抗體組學分析已經成為免疫學的熱門方法,促進了包括抗體發生、疫苗研發、腫瘤發生及自免疫疾病等相關免疫學的研究并取得了眾多創新性的成果。但到目前為止,抗體組學分析的應用潛力還遠未發揮出來,其技術仍受到一些現實條件的約束,如高通量PCR抗體基因擴增技術仍不夠完善、測序讀段長度與準確性還有待進一步提高、標準的分析流程有待開發完善。隨著單細胞分選及測序的應用、PCR擴增基因方法的改善、細胞標記的應用、分析標準的開發,未來抗體組學將在診斷、藥理學、疫苗設計及臨床應用中發揮前所未有的重大作用,引領新型治療性抗體研究的時代。