最近回頭重新看了illlumina paired end sequence的測序原理視頻,發(fā)現(xiàn)了以前沒有注意的一些問題,,而這些問題也是大家平時容易搞錯的,,因此花了幾天時間將illumina 的paired end sequence 從構(gòu)建文庫到上機(jī)測序的整個過程以及原理較為詳細(xì)的寫了出來,。 基礎(chǔ)知識:illumina測序的核心在于利用可逆終止的,、熒光標(biāo)記的dNTP進(jìn)行邊合成邊測序 Flowcell(流動池)是有著2個或8個lane(泳道)的玻璃板,,。每個lane可以測一個樣本或者多樣本的混合物,,且隨機(jī)布滿了能夠與文庫兩端接頭分別互補(bǔ)配對或一 致的寡核苷酸(oligos,P7和P5接頭),。一個lane包含兩列,,每一列有60個tile,每個tile會種下不同的cluster,,每個tile在一次循環(huán)中會拍照4次(每個堿基一次),。 paried-end sequencing 一、Library Preparation文庫的構(gòu)建 1. 利用轉(zhuǎn)座子(transposome)對雙鏈DNA進(jìn)行剪切以及接頭(adapter)的連接 2. 接頭連接成功后,,利用低循環(huán)擴(kuò)增技術(shù)在接頭處進(jìn)行修飾,,分別在兩端添加sequencing primer binding site1/sequencing primer binding site2(即測序引物結(jié)合位點)、index1/index2以及我們稱之P5和P7的寡核苷酸序列 上圖并沒有將之前的adapter標(biāo)志出來,,下圖是維基百科的示意圖,,詳細(xì)一些。 這里要注意兩點(1)P5和P7是不同的,,它們分別和flowcell上的接頭互補(bǔ)和相同,。為了方便闡述,,將與P5互補(bǔ)的接頭稱為P5’,與P7互補(bǔ)的接頭稱為P7’,。(2)index1和index2也是不同的,,與P5相連的是index2,與P7相連的是index1,。 關(guān)于index,,也叫barcodes,因為一個lane可以同時測多個樣品,,為了避免混淆樣品的read products,,每種樣品的DNA由一種index修飾,這樣測序得到的reads都是具有index標(biāo)記的,,在測序結(jié)果中,,依據(jù)之前標(biāo)簽與樣品的對應(yīng)關(guān)系,就可以獲得對應(yīng)樣品的數(shù)據(jù),。而這里的index1和index2是為了區(qū)分paired-end測序得到的雙端reads,。二、Cluster generation 簇生成 1. Flowcell上隨機(jī)分布了兩種不同的寡核苷酸序列,,分別與P5互補(bǔ)(即P5’),,與P7一致(即P7)。 2. 待測sequence通過P5與folwcell上的P5’序列雜交互補(bǔ),,以待測sequence為模板進(jìn)行互補(bǔ)鏈(即reverse strand)的延伸,,互補(bǔ)鏈的兩端為P5’和P7’。 3. 接下來模板鏈被切斷并洗下 Reverse strand的P7’與Flowcell上的P7雜交互補(bǔ),,進(jìn)行鏈的合成,,這就是我們所熟知的橋式PCR 接下來合成的雙鏈被解鏈,再分別與Flowcell上的接頭雜交互補(bǔ),,延伸....解鏈,,雜交,延伸,,解鏈...如此重復(fù)35個循環(huán)
4. 橋式PCR完成后,,使用NAOH將雙鏈解鏈,并利用甲酰胺基嘧啶糖苷酶(Fpg)對8-氧鳥嘌呤糖苷(8-oxo-G)的選擇性切斷作用,,選擇性地將P5’與鏈的連接切斷,,留下與Flowcell上P7連接的鏈,也就是Forward strand,。同時游離的3’端被阻斷,,防止不必要的DNA延伸 三、測序 1. 測序引物(sequencing primer)結(jié)合到靠近P5的測序引物結(jié)合位點1(sequencing primer binding site 1)上,,在系統(tǒng)中加入四種dNTP和DNA聚合酶,。這里的dNTP有兩個特點:它是有熒光基團(tuán)標(biāo)記的,,每種堿基標(biāo)記的熒光基團(tuán)不一樣。它的3’末端連了一個疊氮基,。這個疊氮基能夠阻斷后面的堿基與它相連 因此在聚合酶的作用下,,與Forward strand相應(yīng)位置堿基配對的dNTP就會結(jié)合到新合成的鏈上,而由于疊氮基的存在,,后面的dNTP無法繼續(xù)連接,。這時用水將剩余的dNTP和酶給沖掉,將Flowcell進(jìn)行掃描,,掃描出來的熒光對應(yīng)的堿基的配對堿基即是該鏈該位置的堿基,。同時在這個Flowcell上有成千上萬個cluster也在進(jìn)行同樣的反應(yīng),因此一個循環(huán)就能同時檢測多個樣本(這也是高通量的核心所在),。這個循環(huán)完成后,,加入化學(xué)試劑把疊氮基和標(biāo)記的熒光基團(tuán)切掉,進(jìn)行下一個循環(huán)(堿基的連接,、檢測與切除),。如此重復(fù)直至所有鏈的堿基序列被檢測出。也就是Forward read 序列,。 2. Index測序:所有循環(huán)結(jié)束后,,read products 被洗掉,index1 primer與鏈上index primer1 結(jié)合位點雜交配對,,進(jìn)行index1的合成及檢測 3. Index1測序完成后,,洗脫測序產(chǎn)物。此時機(jī)器已通過熒光得到了index1的序列 4.Index2測序:Forward strand頂端的P5序列與Flowcell上的P5’雜交配對,,進(jìn)行index2測序,。測序完成后洗脫產(chǎn)物
四、Paried-end sequencing(即對Reverse strand測序) 1. 洗脫index2測序產(chǎn)物后,,以Flowcell上的P5’為引物,F(xiàn)orward strand為模板進(jìn)行橋式擴(kuò)增,,得到雙鏈 2. NAOH使雙鏈變性為單鏈,,并洗去已經(jīng)測序完成的Forward strand 3. 類似的,readprimer2結(jié)合到靠近P7’的read primer binding site 2開始對Reverse strand的測序,。測序完成后即可得到Reverse read序列,。 總結(jié):有兩點需要重點注意:(1)DNA片段連接的兩個接頭P5和P7,它們與Flowcell上的兩種寡核苷酸序列分別互補(bǔ)和相同,,并不是都相同 (2)結(jié)合在DNA片段兩端的index序列也不同,,分別是index1和index2 前面介紹的都是paired-end的測序,而single-end測序方式是只將index,,sequencing primer binding site以及P7/P5添加到 fragamented DNA片段的一端,,另一端直接連上P5/P7,,將片段固定在Flowcell上橋式PCR生成DNA簇,然后單端測序讀取序列 最后給出illumina的官方視頻 http://v.youku.com/v_show/id_XMTI1MjA5Mzg5Mg==.html?spm=a2h0k.8191407.0.0&from=s1.8-1-1.2
|
|