2017-12-131.測序結果文件一般公司DNA測序結果都提供兩個文檔,一個是序列文檔(后綴為.seq),,一個是測序峰圖文檔(后綴.ab1),,為堿基的測序質量信息。 (A).seq – 序列文件,,TEXT的序列文檔,可由記事本或BioEdit打開,。 (B).ab1-峰圖文件,,可由BioEdit或Chromas打開察看。
2.切除兩端低質量堿基由于Sanger測序技術限制,,每個測序反應一般僅有800bp左右比較準確,。 一般測序結果的前端大約50個堿基的質量會不好(測序引物的原因),此部分測序峰圖通常無法判讀,。這是正?,F(xiàn)象,需要把此部分堿基切除。同理,,測序后期的堿基質量也比較差(酶活降低與雜質干擾較大等原因),,也需要把尾部測序峰圖不規(guī)則的堿基切除。因此留下中間堿基質量相對較好(峰圖規(guī)則)的序列用于后續(xù)分析,。
方法如下: 用 BioEdit 打開正向測序結果峰圖文件( ZB10100433 (yangpin1) 16SS(zidai)_Pw_G12.ab1),通過移動左邊與左上角的比例標尺,,調整峰圖的高度與寬度,使DNA每個堿基的峰圖大小適合觀察,。 從下圖看出,,前面50多個堿基的峰較亂,此處選擇55個開始的堿基,。同理,,DNA末端由于酶活力下降等原因,測序質量也逐步變差,。根據峰圖的形狀,,我們也需要切除尾部950bp后的堿基(約末端100bp),只保留56-950之間約900bp的高質量堿基,。
選擇 BioEdit 顯示DNA序列的子窗口(Window菜單->DNA sequence frome…) 然后在 BioEdit 的Sequence菜單->select positions,在彈出窗口中輸入56與950,,點OK按鈕后,就以背景黑的顯示已選擇的序列,。 再選edit菜單->Copy(或直接按Ctrl-C鍵),,復制序列到一個新的文本文件,保存為16S_rDNA.fas,。增加序列的注釋行”>16SF”,代表正向測序序列,。 同上步驟,根據峰圖信息,,再復制另一個反向測序結果的高質量序列(56-950)到文本文件16S_rDNA.fas,,并標記序列為”>16SR”,代表反向測序序列,。 DNA測序通常需要兩個方向進行,,測序都是從DNA的5’端到3’端進行的,正向和反向測序是指對DNA的兩條互補鏈分別測序,。雙向測序結果經校讀后完全一致才能認為得到可靠DNA測序結果,。
3.雙向測序序列的合并通常PCR產物雙向測序,需要合并雙向序列,,最終得到全長序列,,這樣得到DNA序列比較準確。 Bioedit打開前面保存的16S_rDNA.fas,。 由于第二條序列是反向測序得到的DNA反向互補序列,,需要通過先得到DNA的反向互補序列:Sequence->Nuleic Acid->Reverse Complement,,再進行比對。 利用BioEdit的alignment功能找重疊區(qū)域:Accessory application->ClustalW multiple alignment,,使用默認設置,,比對結果顯示,中間重疊部分的序列大部分相似,。 如果重疊區(qū)不是大部分相同堿基,,請試著把一條序列反向互補,再比對,。
4.堿基的校準在上一步的比對結果窗口,,先利用BioEdit得到兩條件序列合并后的一致序列: 修改堿基前,,需要先把bioedit的Mode設置為”Edit”與”Insert”,,并選中按鈕”view conservation plotting identities […] with a dot”,以點顯示相同的堿基,,便于觀察差異位點,。
在BioEdit中打開正向和反向測序結果的AB1文件和上面比對結果放同一窗戶(如圖)。 定位到差異堿基的位置(下圖黑色部分),,一般可以在峰圖文件中查找不一致堿基(正反鏈錯配,、缺失或誤增堿基)及附近的幾個序列(點擊Edit菜單->find,或直接Ctrl-F),,如查找GCAtAC,。 注意反向測序峰圖的搜索,需要輸入序列的反向互補序列(GTtTGC),小寫字母為不一致堿基,。
查看該堿基及附近堿基正反測序峰圖形狀,,判斷該堿基正確的堿基序列。 然后在序列窗口中分別改正正向16SF,、反向16SR及Consensus序列中不一致的堿基,。如有空格(gap)顯示為”-“,需要把三條序列同一位置上的堿基與”-“都刪除,,才能保持后面的堿基比對結果正常(Backspace可刪除光標前一個堿基),。
在BioEdit中打開正向和反向測序結果的AB1文件和上面比對結果放同一窗戶(如
5.保存序列保存校正后的consensus序列,即為最終測序結果的合并序列,。 選擇concensus序列->鼠標右鍵:copy sequences 點擊file菜單->新建Aligment 點擊Edit菜單->paste sequence,并點擊concensus的標題改為”16S_rDNA” 然后保存為16S_rDNA.fas(文件類型選擇Fasta格式)
|