久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

變異位點(diǎn)的準(zhǔn)確識(shí)別

 微笑如酒 2018-08-20

目前,,隨著成本的降低,二代測(cè)序技術(shù)在遺傳學(xué)及醫(yī)學(xué)中的研究和應(yīng)用越來越普遍,。得益于不同方式的測(cè)序(panel/WES/WGS),以及大樣本的測(cè)序數(shù)據(jù)的積累,,大量的致病基因及位點(diǎn)被發(fā)現(xiàn),極大的促進(jìn)了相關(guān)領(lǐng)域的科學(xué)發(fā)現(xiàn),也使基因檢測(cè)日益成熟,。其中,,如何從測(cè)序數(shù)據(jù)中準(zhǔn)確的進(jìn)行變異檢測(cè),是后續(xù)生物學(xué)及醫(yī)學(xué)研究的基礎(chǔ),。變異位點(diǎn)通常包括:點(diǎn)突變(SNV),,短的插入缺失(Indel),拷貝數(shù)變異(CNV)及結(jié)構(gòu)變異(SV)等,。不同的變異類型的變異檢測(cè)方法和準(zhǔn)度均存在差異,。本文主要從三個(gè)方面論述變異位點(diǎn)的相關(guān)問題:


1,變異識(shí)別的準(zhǔn)確度估計(jì)

通常,,Sanger等一代測(cè)序技術(shù)作為金標(biāo)準(zhǔn),,用于對(duì)二代測(cè)序的位點(diǎn)進(jìn)行驗(yàn)證。但是由于人類基因組變異位點(diǎn)的數(shù)量極為龐大,,對(duì)這些位點(diǎn)進(jìn)行大規(guī)模的驗(yàn)證是不可取的,。那么,對(duì)于一個(gè)變異數(shù)據(jù)集如何從整體上評(píng)估其變異的可信度,?主要有兩個(gè)指標(biāo):

1)針對(duì)SNP的變異類型,,即轉(zhuǎn)換(Ti)/顛換(Tv)的比例,研究表明Ti/Tv=2.1:1[1],,即存在一定的偏好性,;根據(jù)某一SNP變異集的Ti/Tv值偏離此范圍之程度,來判斷其可信度,;

2)判斷變異集合中屬于dbSNP數(shù)據(jù)庫之比例,;通常認(rèn)為,對(duì)于某一個(gè)個(gè)體,,檢測(cè)的變異位于dbSNP[2]中,,則其可信度較高;而新位點(diǎn)(novel variants)則暗示著較大比例的假陽性。

雖然有綜述文章[3]表明主流的測(cè)序平臺(tái)正確率極高(99.99%~99.9999%),,然而,,由于人類基因組堿基數(shù)目的巨大,進(jìn)而導(dǎo)致識(shí)別的堿基錯(cuò)誤的絕對(duì)數(shù)量仍較為龐大,;Li Heng[4]通過一個(gè)單倍體CHM1hTERT的65x的測(cè)序數(shù)據(jù),,同時(shí),還采用Illumina Platinum Gen omes project的NA12878作為陽性對(duì)照(55x),,在考慮體細(xì)胞突變的情況下,,發(fā)現(xiàn)雜合位點(diǎn)假陽性的概率約為:1~100–200 kb;(即在全基因組水平上15000-30000的假陽性雜合位點(diǎn)),??傊鷾y(cè)序同時(shí)有準(zhǔn)確度高和假陽性和假陽性絕對(duì)數(shù)量大的特點(diǎn)


2,,真實(shí)變異數(shù)據(jù)集

構(gòu)建人類個(gè)體的標(biāo)準(zhǔn)變異數(shù)據(jù)集,,在評(píng)估測(cè)序數(shù)據(jù)質(zhì)量、變異檢測(cè)流程準(zhǔn)確度方面有重要的作用,。目前,,普遍使用的真實(shí)變異數(shù)據(jù)集為NA12878個(gè)體的兩套標(biāo)準(zhǔn)變異數(shù)據(jù)集:


1National Institute of Standards and Technology (NIST)組織開展的的Genome in a Bottle Consortium計(jì)劃中,Zook J M等人采用Illumina,,454,,SOLiD4,Complete Genomics,,Ion Torrent共 5種測(cè)序平臺(tái)對(duì)樣本NA12878進(jìn)行測(cè)序,,利用7種比對(duì)方法以及3種變異檢測(cè)工具組合而得到的14個(gè)數(shù)據(jù)集(11個(gè)全基因組和3個(gè)全外顯子組),通過整合多種平臺(tái)和數(shù)據(jù)庫來確定SNP和INDEL變異位點(diǎn)的置信程度,,提供了一個(gè)高置信的變異位點(diǎn)集[5],。然而,該數(shù)據(jù)集不包括約23%的基因組部分,。此外,,該研究仍在進(jìn)行基于種群的高置信變異位點(diǎn)構(gòu)建工作。


2)Illumina Platinum Project:該計(jì)劃對(duì)CEPH 1463家系的17個(gè)成員分別采用Hiseq 2000進(jìn)行50x測(cè)序,。此外,,對(duì)NA12877, NA12878及NA12882 trio家系還進(jìn)行了200x 的HiSeq 2000測(cè)序其中,建庫技術(shù)為TruSeq DNA PCR-Free Library Prep Kit,;并采用多種生物信息分析流程來進(jìn)行變異檢測(cè),,最終的高置信變異集合綜合考慮了家系遺傳和多種方法的結(jié)果而得。同時(shí)提供了NA12877 和NA12878兩個(gè)個(gè)體的標(biāo)準(zhǔn)變異數(shù)據(jù)集,。


3,,影響變異檢測(cè)的主要因素

影響變異檢測(cè)的因素是多方面的,,涵蓋了從實(shí)驗(yàn)環(huán)節(jié)到信息分析環(huán)節(jié):

1) 測(cè)序方式

目前主要是選擇全外顯子組測(cè)序(WES)還是全基因組測(cè)序(WGS)。一項(xiàng)基于WGS和WES的比較研究[10]發(fā)現(xiàn):WGS對(duì)編碼區(qū)有更好的捕獲效率,;以覆蓋度20x為標(biāo)準(zhǔn),,95-160x的高測(cè)序深度的WES可以捕獲95%的編碼區(qū)域;而87x的WGS捕獲率即為98%,。目前,隨著測(cè)序成本的降低,,WGS越來越成為科學(xué)研究中的主流方案,。


2) 測(cè)序平臺(tái)

不同的測(cè)序平臺(tái),在reads讀長(zhǎng),、堿基的識(shí)別方面均有差異,。其中,Illumina平臺(tái)易出現(xiàn)替換錯(cuò)誤(substitution errors),,同時(shí)由于單鏈DNA的折疊和酶的堿基序列偏好性修飾導(dǎo)致一些序列特異性錯(cuò)誤,。單分子的Pacific Bioscience雖然有讀長(zhǎng)長(zhǎng)的優(yōu)勢(shì),但易導(dǎo)致indel錯(cuò)誤,,而基于焦磷酸和半導(dǎo)體測(cè)序技術(shù)則在homopolymer易出現(xiàn)延后的indel錯(cuò)誤[3],。J F等人比較了一個(gè)trio家系在Illumina HiSeq,Life Technology Proton和Complete Genomics三個(gè)測(cè)序平臺(tái)的測(cè)序一致性,,結(jié)果(見圖1)顯示三者在SNP的檢測(cè)上僅有66%的一致性,,而在Indel上僅有18%的一致性[6]??傊?,各個(gè)平臺(tái)技術(shù)均有所優(yōu)劣,目前主流的為Illumina平臺(tái),,而國(guó)產(chǎn)的華大BGIseq序列的使用也較為普遍,。


3) 信息分析方法

基于Genome in a Bottle (GIAB) 聯(lián)盟提供的NA12878標(biāo)準(zhǔn)變異數(shù)據(jù)集,Sohyun Hwang[7]對(duì)12種測(cè)序數(shù)據(jù),,系統(tǒng)比較了BWA-MEM, Bowtie2以及Novoalign三種比對(duì)工具,,以及GATK-HC,Samtools,,F(xiàn)reebayes,,Torrent Variant Caller (TVC)四種call變異軟件組成的13種分析流程在變異檢測(cè)結(jié)果上的不同;其中,,12種數(shù)據(jù)集信息見下表:

結(jié)果表明,,各種分析流程在變異檢測(cè)的敏感性和特異性方面均有所差異。建議采用主流的BWA-GATK流程進(jìn)行變異檢測(cè),,同時(shí)綜合其他分析流程的結(jié)果,。


總之,目前的變異檢測(cè)方案是比較成熟的,適合大規(guī)模的科學(xué)研究和臨床應(yīng)用,。但是,,進(jìn)一步提高變異檢測(cè)的準(zhǔn)確度,降低假陽性和假陰性比例,,仍需要新的測(cè)序技術(shù)和變異檢測(cè)工具的開發(fā),。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,,不代表本站觀點(diǎn),。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,,謹(jǐn)防詐騙,。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào),。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多