聽說最近大家的朋友圈被組學(xué)君家的Nanopore 兩大利器——MinION和GridION刷屏了,,組學(xué)君的座機(jī)(400-027-1221,,廣告一下組學(xué)君專機(jī)O(∩_∩)O)也被咨詢Nanopore的電話打爆了,大家熱情這么高,,組學(xué)君也不能辜負(fù),,于是從未來組最專注的基因組組裝方向,為大家整理了幾篇已公布的基于Nanopore測序基因組文章,,先讓大家一睹為快,,當(dāng)然,Nanopore測序到底如何,?你不來未來組試試如何知道,,組學(xué)君等你。 萬事開頭難,,先從模式物種來 Whole genome sequencing and assembly of a Caenorhabditis elegans genome with complex genomic rearrangements using the MinION sequencing device (2D) ONT sequencing library(SQK-LSK108),,上機(jī)4 MinION flowcells(R9.0)48hrs (1D) ONT sequencing library(SQK-RAD001),上機(jī)2 MinION flowcells(R9.3)48hrs (Figure 1) Figure1 MinION 測序 共下機(jī)1.1M reads,,read長度最長123,159 bp (平均長度 4,801 bp),,其中5.33Gb 1D堿基,,其互補(bǔ)鏈的2D 序列有1Gb,,1D 序列比對率為~93%,2D比對率90-95%,,其中,,3號染色體上有~3M的duplication(chrIII:10,062,096-11,973,739)(Figure 2)。 Figure2 MinION read 比對到參考基因組 經(jīng)Nanopore數(shù)據(jù)組裝可到145 Contigs,,Contig N50 = 1.22 Mb,,覆蓋了參考基因組的99%序列。研究者并用短讀長數(shù)據(jù)做了比較,,經(jīng)Illumina平臺的~8.04 G數(shù)據(jù),,組裝得到38,645 Contigs,Contig N50 = ~26 kb,。通過MinION 的基因組組裝結(jié)果,,同時(shí)還確定了重排和插入的復(fù)雜區(qū)域結(jié)構(gòu)。 High contiguity Arabidopsis thaliana genome assembly with a single nanopore flow cell typical consumer computing hardware (4 Cores, 16Gb RAM) 1 μg gDNA ,,(1D) ONT sequencing library (SQK-LSK108)(~3h),,a single ONT MinION flowcell (R9.4) 48hrs 平均讀長11.4K(N50 7.5 kb),3.4G base-called sequence,,平均質(zhì)量值Q7.3,,其中200k以上reads有4條,最長有269K,超過100kb有14條reads,,50k以上有2317條reads,。 文中經(jīng)多種組裝軟件測試,其中,,minimap/miniasm組裝少于1hr,,racon (3x)consensus 12 hrs,pilon 進(jìn)行polish 24 hrs,。 ONT minimap/miniasm (ONTmin) 組裝得到62 Contigs,,ContigN50=12.3 Mb,覆蓋了100% (119 Mb) 的非重復(fù)序列(Table 1),,經(jīng)BioNano光學(xué)圖譜數(shù)據(jù)驗(yàn)證了其高連續(xù)性,,并經(jīng)PacBio RSII數(shù)據(jù)驗(yàn)證其高堿基質(zhì)量。 最后研究者不忘計(jì)算此次Nanopore測序組裝項(xiàng)目成本,,總共花費(fèi)了4天時(shí)間,,以及包括儀器折舊和測序耗材在內(nèi)1000美金。 Table 1 OxfordNanopore (ONT) 和Pacific Biosciences (PB)組裝比較 模式物種搞定,,再來點(diǎn)非模式物種 Reconstructing the Gigabase Plant Genome of Solanum pennellii using Nanopore sequencing 通過2種片段方式建庫: a. 富集長片段(12-80 kb,,12-50 kb)建庫,(1D) ONT sequencing library (SQK-LSK108),,20 μg DNA/library,,29 ONT MinION flowcell (R9.4) b. 未經(jīng)片段篩選建庫,24 μg DNA/2 library,,2 ONT MinION flowcell (R9.4) 共下機(jī)數(shù)據(jù)131.6G,,平均一個(gè)Cell 4G產(chǎn)量,passed filter(Metrichor 1.121 base caller) 數(shù)據(jù)有110.96G(基本上是預(yù)估基因組1-1.1G的100X測序量),,過濾后的平均Q-score為7.44,,在文庫優(yōu)化后,平均讀長在6,625-15,869bp間,,最長read達(dá)153,099bp,。 提取40%,60%,,80%數(shù)據(jù)量,,經(jīng)miniasm,Canu和 SMART de novo 進(jìn)行組裝測試,并經(jīng)二代數(shù)據(jù)polish,,其中Canu-SMARTdenovo效果最優(yōu):Contig N50 達(dá)2.5 Mb(Figure 3),。 Figure3 不同組裝策略對比 Rapid de novo assembly of the European eel genome from nanopore sequencing reads 在血液和肝臟組織中提取High MW DNA,片段化到20 kb,,構(gòu)建不同文庫: ONT sequencing library (2D:SQK- MAP006),,于ONT MinION flowcell(R7.3)上機(jī),; ONT sequencing library (2D:SQK-NSK007和1D:SQK-RAD001),上機(jī)MinION flowcells(R9.0),; ONT sequencing library (SQK-LSK108和SQK-RAD002),,ONT MinION flowcell(R9.4)。 下機(jī)數(shù)據(jù)共15.6G(Table 2),,k-mer分析預(yù)估基因組~860 Mb,,下機(jī)數(shù)據(jù)基本上是基因組18X測序深度。 Table 2 Nanopore測序 研究者開發(fā)組裝新工具TULIP(The Uncorrected Long-read Integration Process),,在二代數(shù)據(jù)基礎(chǔ)上組裝得到基因組891.7 Mb,,Contig N50為1.2M,相對已有短讀長組裝的基因組草圖提升顯著,。 |
|