這個(gè)問(wèn)題不好回答,。請(qǐng)一直看到最后,。 5.2 有關(guān)文庫(kù)構(gòu)建技術(shù)路線方面高通量測(cè)序(high-throughput sequencing)并不是指一般意義上通量高的測(cè)序,,而是特指二代測(cè)序(next generation sequencing,,NGS)。NGS也翻譯成下一代測(cè)序,、新一代測(cè)序,、平行測(cè)序。NGS一次反應(yīng)能同時(shí)對(duì)數(shù)百億個(gè)核酸分子進(jìn)行測(cè)序(cluster密度高達(dá)數(shù)M/mm2),,雖然測(cè)序長(zhǎng)度(讀長(zhǎng))比一代測(cè)序短,,但是模板分子數(shù)(=平行進(jìn)行的測(cè)序反應(yīng)數(shù))的增加幅度驚人,所以測(cè)序通量比一代測(cè)序提高了數(shù)千萬(wàn)倍,,測(cè)序成本的降低速度超越摩爾定律,。由于數(shù)據(jù)量大規(guī)模提高,NGS使得對(duì)一個(gè)物種進(jìn)行基因組分析和轉(zhuǎn)錄組分析成為現(xiàn)實(shí),;由于成本大規(guī)模降低,,NGS使得臨床和消費(fèi)者基因檢測(cè)應(yīng)用變成了現(xiàn)實(shí)。【云】一代測(cè)序與二代測(cè)序的要點(diǎn)比較如下:技術(shù) 讀長(zhǎng)(bp) 模板數(shù)量 通量 增加倍數(shù)二代測(cè)序 150-300 100M-20G 100M-6T 60Mde novo測(cè)序也叫從頭測(cè)序,,指一個(gè)物種第一次開(kāi)展全基因組測(cè)序,其NGS數(shù)據(jù)的生物信息學(xué)數(shù)據(jù)分析由于沒(méi)有現(xiàn)成的基因組參考序列(reference sequence)可用,,算法比較特殊,,難度也比較大。通常會(huì)組合運(yùn)用多種測(cè)序方式,,比如NGS,,轉(zhuǎn)錄組測(cè)序(提供RNA剪接與可變轉(zhuǎn)錄本等信息),,三代測(cè)序(長(zhǎng)讀長(zhǎng))等技術(shù),數(shù)據(jù)相互參照,,以取得高質(zhì)量的組裝圖,,因此成本也比較高。de novo測(cè)序的化學(xué)反應(yīng)與標(biāo)準(zhǔn)NGS測(cè)序一樣,;但是其生物信息學(xué)數(shù)據(jù)分析算法不同,,全基因組序列組裝過(guò)程中不使用基因組參考序列,,運(yùn)算耗時(shí)較長(zhǎng),。隨著NGS技術(shù)的發(fā)展,基因組測(cè)序所需成本和時(shí)間較傳統(tǒng)技術(shù)大幅降低,,越來(lái)越多的物種獲得了全基因組序列,。有了基因組參考序列后,對(duì)于同一物種其他個(gè)體的測(cè)序,,其生物信息學(xué)數(shù)據(jù)分析就變得相對(duì)簡(jiǎn)單了,,此種測(cè)序稱(chēng)為重測(cè)序。什么是重測(cè)序(re-sequencing),?重測(cè)序是對(duì)曾經(jīng)進(jìn)行過(guò)WGS測(cè)序,、數(shù)據(jù)庫(kù)中具有reference sequence的物種的不同個(gè)體進(jìn)行測(cè)序。這種測(cè)序的化學(xué)反應(yīng)部分與標(biāo)準(zhǔn)的NGS一樣,,但是生物信息學(xué)數(shù)據(jù)分析比de novo測(cè)序簡(jiǎn)單,,依賴reference sequence進(jìn)行全基因組組裝,運(yùn)算簡(jiǎn)單,,速度快,。重測(cè)序可以應(yīng)用于個(gè)體水平或群體水平的全基因組差異分析,解析與疾病,、家系遺傳,、癌癥發(fā)生、藥效等有關(guān)的基因變異,,研究其致病機(jī)理,,尋找新的藥物作用靶點(diǎn),開(kāi)發(fā)新藥,,篩選靶向藥適用人群等,。隨著基因組測(cè)序成本的不斷降低,人類(lèi)疾病的致病突變研究由外顯子區(qū)擴(kuò)大到了全基因組范圍,,實(shí)現(xiàn)了在全基因組水平檢測(cè)疾病關(guān)聯(lián)的常見(jiàn),、低頻甚至罕見(jiàn)的變異,具有重大的科研和產(chǎn)業(yè)價(jià)值,。什么是全基因組測(cè)序(whole genome sequencing, WGS),?就是對(duì)整個(gè)基因組進(jìn)行NGS測(cè)序,,測(cè)序區(qū)域包括外顯子、內(nèi)含子以及基因之間區(qū)域,,測(cè)序類(lèi)型包括de novo sequencing和re-sequencing,。WGS文庫(kù)構(gòu)建流程是所有NGS應(yīng)用中最簡(jiǎn)單也是最基本的,其他技術(shù)方法都是在此基礎(chǔ)上衍生發(fā)展出來(lái)的,。什么是外顯子組測(cè)序(whole exome sequencing, WES),?只對(duì)某一個(gè)基因組的全部外顯子區(qū)域進(jìn)行NGS測(cè)序,測(cè)序區(qū)域只包括外顯子,,有時(shí)還包括少量UTR區(qū)域,,但是不包括內(nèi)含子、不包括基因之間區(qū)域,。這是因?yàn)橛信R床意義的基因變異主要發(fā)生在外顯子區(qū)域,,而外顯子組只占基因組的2%左右,WES可以比WGS大幅度降低測(cè)序費(fèi)用,。【云】WES文庫(kù)的構(gòu)建流程比WGS幾乎復(fù)雜一倍,。WES測(cè)序首先也要構(gòu)建WGS文庫(kù),然后利用針對(duì)外顯子區(qū)域的大量長(zhǎng)探針進(jìn)行大規(guī)模雜交,,從WGS文庫(kù)中把外顯子片段捕獲下來(lái),,再通過(guò)PCR進(jìn)行擴(kuò)增。Southern雜交的探針長(zhǎng)度21 bp,,而外顯子捕獲的探針可以長(zhǎng)達(dá)120 bp,,這是因?yàn)殚L(zhǎng)探針比短探針具備更好的容錯(cuò)性,可以兼容各種未知的基因變異,,從而在外顯子文庫(kù)中保留更多的基因變異信息,。靶基因區(qū)域比外顯子組更小的靶向測(cè)序稱(chēng)為panel測(cè)序。Panel測(cè)序的基因數(shù)量可變,,根據(jù)研究目的可多可少,,少到1個(gè)基因,多到幾千個(gè)基因,。其中包括所有臨床驗(yàn)證過(guò)的遺傳病致病基因的panel,,稱(chēng)為臨床全外顯子組測(cè)序(clinical exome sequencing, CES)。Panel測(cè)序與外顯子組測(cè)序統(tǒng)稱(chēng)靶向測(cè)序,。靶向測(cè)序都有一個(gè)靶基因捕獲與富集的過(guò)程,。捕獲富集的方法主要有兩種:探針雜交和多重PCR擴(kuò)增。技術(shù) 靶區(qū)域大小 建庫(kù)時(shí)間 數(shù)據(jù)量 測(cè)序深度 成本WES外顯子組 60M,,小50倍 2.5天 10G 150x 低什么是轉(zhuǎn)錄組測(cè)序(transcriptome sequencing,,RNA-seq)?轉(zhuǎn)錄組(transcriptome)指特定組織部位的細(xì)胞群,、在特定時(shí)間點(diǎn)(即某一功能狀態(tài)下)轉(zhuǎn)錄的全體RNA(包括mRNA和非編碼RNA)的種類(lèi)與拷貝數(shù),。研究人員僅需要一次試驗(yàn),,即可快速生成帶poly-A尾巴的RNA的完整序列信息,分析基因表達(dá),、等位基因特異性表達(dá),、發(fā)現(xiàn)新的剪接異構(gòu)體和罕見(jiàn)轉(zhuǎn)錄等轉(zhuǎn)錄組相關(guān)信息。【云】轉(zhuǎn)錄組的內(nèi)容主要體現(xiàn)在基因表達(dá)圖式上,,所以轉(zhuǎn)錄組與基因表達(dá)基本就是同義詞,。基因組主要體現(xiàn)在基因變異(包括多態(tài)性和突變)上,,所以基因組與基因序列大致就是同義詞,。與基因組相比,轉(zhuǎn)錄組的最大特色是:基因表達(dá)具有時(shí)間特異性和空間特異性,。對(duì)于不同的組織樣本,,轉(zhuǎn)錄組不一樣,;即使是同一組織,,它在不同的發(fā)育階段和/或不同的生理狀態(tài)下,其轉(zhuǎn)錄組也不一樣,。如果要研究RNA,,樣本種類(lèi)多,不能互相取代,?;蚪M就單純多了,基本上全身一樣,、終生不變,。除了腫瘤體細(xì)胞變異具有時(shí)間和空間特異性之外,基本上終生不變,;除了生殖細(xì)胞是單倍體以外,,基本上全身一樣。這是因?yàn)榛蜃园l(fā)發(fā)生變異的頻率很低,;所發(fā)生的變異當(dāng)中,,很大一部分又被機(jī)體自身修復(fù)了。如果研究基因組,,不同類(lèi)型的樣本可用互相取代,。除了癌組織與癌旁組織要嚴(yán)格區(qū)分,不可替代之外,,研究遺傳病的時(shí)候,,外周血、唾液和新鮮冷凍組織等樣本可以任取一種,,其檢測(cè)結(jié)果是基本一樣的,。你沒(méi)有看錯(cuò),小RNA (small RNA)就是指長(zhǎng)度短,、分子量小的RNA,。小RNA種類(lèi)繁多,比較常見(jiàn)的包括micro RNA (miRNA),、siRNA和piRNA等,,它們調(diào)控基因表達(dá)、新陳代謝,、細(xì)胞生長(zhǎng),、個(gè)體發(fā)育、疾病發(fā)生等生理過(guò)程,。在各種小RNA中,,lncRNA和miRNA是比較有特色的兩種,備受重視,。成熟的miRNA是長(zhǎng)17~24 nt的單鏈非編碼RNA,,它通過(guò)與mRNA相互作用,影響目標(biāo)mRNA的穩(wěn)定性及翻譯,,最終誘導(dǎo)基因沉默或者被降解,。lncRNA(long noncoding RNA,長(zhǎng)鏈非編碼RNA)雖然號(hào)稱(chēng)長(zhǎng)鏈,,也屬于小RNA,,因?yàn)樗皇窍鄬?duì)于其他小RNA來(lái)說(shuō)才比較長(zhǎng),與mRNA相比一點(diǎn)也不長(zhǎng),。小RNA測(cè)序指對(duì)特定細(xì)胞,、組織、或者體液樣本中的全部small RNA進(jìn)行深度測(cè)序并進(jìn)行定量分析,。由于小RNA長(zhǎng)度短,,只需要進(jìn)行1x50 bp的單端(single read)測(cè)序就足夠了,可以節(jié)省成本,。small RNA測(cè)序有兩種策略,。一是先將長(zhǎng)度在18-30 nt范圍的small RNA從總RNA中分離出來(lái),體外反轉(zhuǎn)錄成cDNA,,然后在其兩端加上通用接頭,,PCR擴(kuò)增后測(cè)序。一是不分離small RNA,,先加5’-接頭,,再加3’-接頭,利用特別的酶的特性,只在天然帶有3’-OH的小RNA的末端加接頭,,而人工打斷的mRNA碎片不接,,從而把小RNA與mRNA區(qū)分開(kāi)。lncRNA測(cè)序也有兩種策略,。一是進(jìn)行轉(zhuǎn)錄組測(cè)序,,然后在數(shù)據(jù)分析過(guò)程中通過(guò)生物信息學(xué)的手段過(guò)濾去除mRNA數(shù)據(jù),剩下的就是lncRNA數(shù)據(jù),。一是先用ribo-zero試劑去除樣本中的rRNA,,然后進(jìn)行文庫(kù)構(gòu)建。由于rRNA占RNA樣本的90%多,,去除rRNA可以節(jié)省測(cè)序成本,。對(duì)small RNA進(jìn)行大規(guī)模測(cè)序,可以獲得物種全基因組水平的miRNA圖譜,,實(shí)現(xiàn)未知miRNA分子的挖掘,、小RNA作用靶基因的預(yù)測(cè)與鑒定、樣品間miRNA表達(dá)差異分析,、miRNA聚類(lèi)和表達(dá)譜分析等目標(biāo),。基于NGS的miRNA測(cè)序,,一次實(shí)驗(yàn)即可獲得數(shù)百萬(wàn)條miRNA序列,,能夠快速鑒定不同組織、不同發(fā)育階段,、不同疾病狀態(tài)下已知和未知的miRNA的種類(lèi)及其表達(dá)差異,為研究miRNA對(duì)細(xì)胞進(jìn)程的作用及其生物學(xué)影響提供了有力的工具,。什么是宏基因組(metagenome)測(cè)序,?宏基因組學(xué)(metagenomics)又稱(chēng)元基因組學(xué)、環(huán)境基因組學(xué),、生態(tài)基因組學(xué),,研究樣本中的整個(gè)微生物群落,以直接從環(huán)境樣本中提取的基因組遺傳物質(zhì)(即混合DNA)為樣本,,而無(wú)需進(jìn)行細(xì)菌或其他微生物的分離,、培養(yǎng)。相對(duì)于傳統(tǒng)的單個(gè)細(xì)菌研究來(lái)說(shuō),,它具有眾多優(yōu)勢(shì),,其中最主要的有兩點(diǎn):(1) 微生物通常以群落方式共生于某一小生境中,它們的很多特性是基于整個(gè)群落環(huán)境及個(gè)體間的相互影響的,,因此研究metagenomics比單個(gè)個(gè)體更能發(fā)現(xiàn)其特性,;(2) Metagenomics研究無(wú)需分離單個(gè)細(xì)菌,可以研究那些不能被實(shí)驗(yàn)室分離培養(yǎng)的微生物,。【云】宏基因組測(cè)序神似鳥(niǎo)槍法,。鳥(niǎo)槍法不用分離,、克隆靶基因,宏基因組測(cè)序不用分離,、培養(yǎng)目標(biāo)微生物,。二者都能提高工作效率。與單一樣本檢測(cè)相比,,混合樣本的檢測(cè)要求技術(shù)方法,、試劑盒的靈敏度更高。NGS可用做宏基因組測(cè)序,,一代測(cè)序和PCR就不行,,正如NGS可以做NIPT,一代測(cè)序和PCR就不行一樣,。混合樣本檢測(cè)可用提高效率,,節(jié)省成本,那是以先進(jìn)技術(shù)為代價(jià)的,。沒(méi)有金剛鉆,,混樣需慎重!
|