如今,,人類基因組的測(cè)序已經(jīng)達(dá)到群體規(guī)模,但仍需要結(jié)合不同的測(cè)序技術(shù)(短讀長(zhǎng)和長(zhǎng)讀長(zhǎng)),,才能覆蓋各種類型的遺傳變異,。這無疑增加了測(cè)序項(xiàng)目的成本和復(fù)雜度。為此,,Pacific Biosciences公司的研究人員開發(fā)出一種方案,,能夠在Sequel測(cè)序平臺(tái)上生成高度準(zhǔn)確的長(zhǎng)reads。 在PacBio,、Google,、NIST等機(jī)構(gòu)的共同努力下,研究人員對(duì)人類男性HG002樣本進(jìn)行了測(cè)序,,覆蓋度達(dá)28倍,,平均讀長(zhǎng)為13.5 kb,且準(zhǔn)確性高達(dá)99.8%,。這項(xiàng)成果于本周發(fā)表在預(yù)印本網(wǎng)站bioRxiv上,。PacBio公司的David Rank和Michael Hunkapiller為共同通訊作者。 “一項(xiàng)具有長(zhǎng)讀長(zhǎng)和高準(zhǔn)確性的測(cè)序技術(shù)將讓研究人員在單次實(shí)驗(yàn)中全面發(fā)現(xiàn)變異,,”作者在文中寫道,。他們證實(shí)了這種方案在檢測(cè)小片段和大片段變異以及基因組組裝和單體型定相上媲美甚至超越現(xiàn)有技術(shù)。 研究團(tuán)隊(duì)以環(huán)狀一致測(cè)序(CCS)為基礎(chǔ)開發(fā)出一種方案,。CCS通過反復(fù)通讀環(huán)化模板而獲得一致序列,,從嘈雜的subreads中產(chǎn)生準(zhǔn)確的reads?!白罱黃MRT測(cè)序的讀長(zhǎng)增加和經(jīng)過優(yōu)化的DNA模板制備為高準(zhǔn)確性和長(zhǎng)讀長(zhǎng)的統(tǒng)一提供了機(jī)會(huì),,”他們寫道。 研究人員通過測(cè)序和分析人類男性HG002樣本來評(píng)估這個(gè)方案的表現(xiàn),。HG002樣本是瓶中基因組(GIAB)聯(lián)盟的基準(zhǔn)樣本之一,。GIAB提供了物理參考材料以及樣本基因組的詳細(xì)鑒定,定義了“高度可信的區(qū)域”和“高度可信的變異”,。 他們?cè)赑acBio Sequel測(cè)序平臺(tái)上開展了基因組測(cè)序,,覆蓋度達(dá)到28倍。讀取準(zhǔn)確性達(dá)到99.8%,,與通常的短讀長(zhǎng)測(cè)序準(zhǔn)確性不相上下,。他們補(bǔ)充說,這些reads的從頭組裝產(chǎn)生了高度連續(xù)和準(zhǔn)確的基因組,,contig N50超過15 Mb,,一致性為99.998%,。 研究人員還分析CCS reads,以檢出SNV,、插入缺失和結(jié)構(gòu)變異,,并開展單體型定相。對(duì)于變異的檢測(cè),,CCS的表現(xiàn)與30倍的短讀長(zhǎng)測(cè)序相當(dāng),。其中,SNV的檢出率為99.91%,,插入缺失為95.98%,,而結(jié)構(gòu)變異達(dá)到95.99%。正如作者所說,,幾乎所有的變異都定相到單體型,,這進(jìn)一步改善了變異檢測(cè)。 此方案不僅僅有出色的質(zhì)量結(jié)果,,還具備許多其他的優(yōu)點(diǎn)。具體包括樣本制備過程更輕松(因?yàn)椴恍枰L(zhǎng)的基因組DNA),,計(jì)算時(shí)間縮短,,以及能夠使用專為準(zhǔn)確reads而設(shè)計(jì)的熟悉工具GATK。 作者認(rèn)為,,未來的改進(jìn) – 包括時(shí)間縮短和通量增加 – 將促進(jìn)快速的群體規(guī)?;蚪M分析,并改善人類健康,。除了人類基因組學(xué)方面的應(yīng)用,,這種方案也有望應(yīng)用在宏基因組學(xué)以及動(dòng)植物基因組的組裝。 原文檢索 Highly-accurate long-read sequencing improves variant detection and assembly of a human genome
|
|