第一代Sanger測序法,由Sanger等在1997年提出,基本原理是通過雙氧核糖核苷酸進(jìn)行延伸反應(yīng),生成相互獨(dú)立的若干組帶放射性標(biāo)記的寡核苷酸,再通過凝膠電泳使它們分開,最后通過放射顯影讀出待測DNA上的核酸序列。
第二代(Next-generation sequencing,NGS)高通量測序法,引入可逆終止末端,并對其熒光標(biāo)記,從而實(shí)現(xiàn)邊合成邊測序。優(yōu)點(diǎn)是高通量,可定量,成本低廉,但是讀長較短,一般不超過500bp。
第三代測序技術(shù)即單分子測序技術(shù),包括單分子實(shí)時(shí)(Single Molecule Real-time,SMRT)測序技術(shù)和單分子納米孔(Nanopore)測序技術(shù),優(yōu)點(diǎn)為超長讀長且無需擴(kuò)增。
雖然第三代測序已經(jīng)商用了,但目前主流測序技術(shù)還是NGS,以下從其測序過程對其簡單介紹。
一、文庫構(gòu)建
1、基因組文庫構(gòu)建
① 通過物理性(超聲波法、噴霧法或水動力剪切等)機(jī)械打碎和酶消化切割等手段將提取到的基因組DNA隨機(jī)打斷。
② 打斷的DNA片段末端可能帶有5’—凸出和3’—凸出,且其末端不一定存在磷酸基團(tuán)或者羥基基團(tuán)。因此,需要使用Taq聚合酶補(bǔ)齊不平的末端,同時(shí)使用Klenow 酶在兩個(gè)末端添加堿基A。此過程即為末端修復(fù),修復(fù)后的即可鏈接測序接頭。
③ 測序接頭是已知的用于測序識別的序列,包括有與固定在流動槽中寡核苷酸序列互補(bǔ)的序列(P5/P7)和簇生成引物序列(Read SP)以及標(biāo)簽序列(Index),添加完接頭序列的DNA片段集合即為所建基因組文庫。
④ 建庫過程中含有聚合酶、連接酶等以及其他各種雜質(zhì),需要對其進(jìn)行磁珠純化,純化過程中同時(shí)進(jìn)行片段選擇。純化后的片段兩端是不互補(bǔ)的Y形結(jié)構(gòu),不能直接進(jìn)行測序,所以還要進(jìn)一步用與接頭互補(bǔ)的引物來PCR擴(kuò)增。擴(kuò)增完,進(jìn)一步磁珠純化,洗去雜質(zhì)。
2、轉(zhuǎn)錄組文庫構(gòu)建
轉(zhuǎn)錄組是指特定細(xì)胞或組織中全部轉(zhuǎn)錄產(chǎn)物,包括信使RNA(Messenger RNA,mRNA)、核糖體RNA(Ribosomal RNA,rRNA)、轉(zhuǎn)運(yùn)RNA(Transfer,tRNA)以及其他非編碼RNA(noncoding RNA,nc RNA)。不同類型的RNA文庫制備方法各不相同,主要過程有:
① 目標(biāo)RNA富集,方法包括靶向捕獲目標(biāo)RNA和消除rRNA。前者通常使用Oligo-dT與Poly(A)雜交的特性設(shè)計(jì)探針,從而實(shí)現(xiàn)總RNA中捕獲到聚腺苷酸化RNA;后者方法較多,包括有Ribo-Zero-seq法、RNA消化酶法以及根據(jù)rRNA特性來消除rRNA的方法等。
② 通過化學(xué)方法或者酶消化的方法打斷富集到的RNA,或者將RNA反轉(zhuǎn)錄成cDNA,運(yùn)用DNA片段化方法打斷cDNA。
③ 連接接頭。cDNA測序接頭連接方法與DNA建庫方法一致;小RNA長度20—35nt且5’端有磷酸基團(tuán)、3’端有羥基基團(tuán),因此不需要特殊修飾即可與接頭連接。
NEBNext Ultra II RNA 試劑盒( New England Biolabs) 文庫制備流程
二、成簇Cluster Generation
利用有單鏈引物的流動槽將DNA分子片段固定在流動槽上擴(kuò)增,形成單克隆DNA簇。
① 文庫片段(P5/P7)與芯片表面引物互補(bǔ)配對,被固定后進(jìn)行DNA復(fù)制。復(fù)制完后解鏈,將文庫片段洗去,留在流動槽表面的即為文庫模板互補(bǔ)的DNA鏈。
② 留下的互補(bǔ)鏈與原先模板鏈連接的引物結(jié)合,形成單鏈橋,再在聚合酶的參與下生成互補(bǔ)鏈,最終形成雙鏈橋。
③ 雙鏈橋再次變性后形成單鏈,形成的單鏈又分別與自己配對的引物結(jié)合,重復(fù)這個(gè)循環(huán),形成散布在芯片上的DNA簇。
④ 進(jìn)一步再切斷洗去反向鏈(與模板鏈一致),僅留下正向鏈,且封鎖3’端防止重新形成單鏈橋。
成簇Cluster Generation
三、測序Sequencing
向已經(jīng)處理過的流動槽中添加改造過的DNA聚合酶和帶有熒光標(biāo)記的可逆終止dNTP(3’-OH鏈接疊氮基團(tuán),在延伸時(shí)被阻止連接下一個(gè)dNTP),統(tǒng)計(jì)每輪收集到的熒光信號結(jié)果,就可以得知每個(gè)模板DNA片段的序列。由于測序儀每次測序時(shí)的通量比較大,所以每次測得的序列可能不止一個(gè)樣本,為了做區(qū)分,在建文庫時(shí)在接頭序列加入不同Index(或Barcode)區(qū)分來源。
現(xiàn)在主流測序方法為雙末端(Paired-end)測序,因?yàn)榭梢栽鲩L測序長度且方便分析結(jié)構(gòu)變異。一般是洗掉前面復(fù)制好的合成片段,單鏈繼續(xù)在流動槽表面形成“橋式連接”。NaOH使雙鏈變性為單鏈,并洗去已經(jīng)測序完成的P7上DNA,留下P5’鏈。加入簇生成引物Read2,從相反方向進(jìn)行另一端序列讀取。
四、測序數(shù)據(jù)
以上則為二代測序的整個(gè)過程,不同的平臺會存在一些差異,但總體過程類似。測序完成后,基于文庫構(gòu)建時(shí)添加的Index分類來自不同樣本的序列,這些序列再與參考基因組匹配后,得到完整序列。