久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

小白的tophat2學(xué)習(xí)筆記

 飛芽科學(xué)團(tuán) 2017-08-02

在轉(zhuǎn)錄本分析中,tophat2是近年來(lái)最常用的工具之一,,可以將RNAseqreads數(shù)據(jù)map到基因組上,,找出外顯子之間的結(jié)合位點(diǎn)。tophat2的下游軟件是cufflinks,,通過(guò)cufflinks我們就可以找到不同樣本間的差異基因,,進(jìn)而進(jìn)行后續(xù)的GOKEGG分析等,,所以說(shuō)tophat2是轉(zhuǎn)錄本分析中的非常重要的一個(gè)中間工具,。

tophat2的安裝需要依賴三個(gè)軟件:boost,,samtoolsBowtie2。這三個(gè)軟件安裝完成后即可安裝tophat2,,命令如下:

cd tophat

./configure

make

make install



下面來(lái)為大家講解寫tophat2有參比對(duì)的用法:

tophat –p 20 –o output –G genome.gtf  genome reads_1.fa reads_2.fa

-p 為安排運(yùn)行tophat所需要的CPU線程數(shù),,根據(jù)服務(wù)器端的CPU總線程數(shù)來(lái)決定。

-o 為文件輸出路徑,,一般建議每個(gè)樣單獨(dú)建立一個(gè)文件夾,。

-G 后面跟著相應(yīng)參考基因組的注釋文件,在運(yùn)行時(shí)會(huì)首先被tophat2調(diào)用bowtie2建立index,,這個(gè)過(guò)程會(huì)占用一定的時(shí)間,。

genome,樣品物種的基因組index,,可用bowtie2-build對(duì)物種的genome.fa文件進(jìn)行建庫(kù),,命令為:bowtie2-build genome.fa genome ,此命令建立index也需要花費(fèi)較長(zhǎng)的時(shí)間,。

tophat既支持pair-end數(shù)據(jù),,也支持single-read數(shù)據(jù)。

此外,,tophat的常用參數(shù)還有:

-r 成對(duì)的reads之間的平均inner距離,,默認(rèn)為50

--library-type  Tophat2處理的reads具有鏈特異性,。一般Illumina數(shù)據(jù)的默認(rèn)library-typefr-unstranded,。


輸出的結(jié)果主要有以下幾部分:

accepted_hits.bam  reads排序的結(jié)果以bam格式生成文件,是后面cufflinks軟件的輸入文件,。

junctions.bed  deletions.bed  insertions.bed 這三個(gè)分別是tophat處理的junctions,,刪除和插入的結(jié)果。

unmapped.bam 沒有map上的序列

align_summary.txt  可以查看map上的reads所占的比例,。


在使用tophat2的時(shí)候可能會(huì)遇到的幾個(gè)問(wèn)題:


01


此類問(wèn)題常見于第一次使用tophat時(shí),,部分tophat所調(diào)用的軟件沒有配置好。如上,,將bowtie2-build/usr/local/bin目錄下建立軟連接即可解決,。


02


此問(wèn)題的初心一般為注釋文件.gtf和基因組的信息在染色體上格式的不匹配造成的,例如本例中的注釋文件.gtf1號(hào)染色體標(biāo)識(shí)為chr1,,而基因組.fa1號(hào)染色體標(biāo)識(shí)為1,,導(dǎo)致兩個(gè)文件相互無(wú)法識(shí)別,。解決的辦法是,,將注釋文件.gtfchr1轉(zhuǎn)換成1,操作代碼為:sed 's/^chr//g' piggenome.gtf > piggenome1.gtf ,。


03

關(guān)于tophat2程序后臺(tái)運(yùn)行的問(wèn)題

可以使用nohup 命令運(yùn)行tophat2,,這樣可以后臺(tái)同時(shí)掛多個(gè)tophat2程序,,但是-p的值要根據(jù)服務(wù)器端的線程數(shù)進(jìn)行設(shè)置,如總服務(wù)器CPU線程為56個(gè),,后臺(tái)掛了6個(gè)tophat2程序,,則單個(gè)-p值不應(yīng)該超過(guò)9??梢杂?/span>more nohup.out查看運(yùn)行進(jìn)度,。


04


解決每次運(yùn)行tophat2都要對(duì)注釋文件建index的問(wèn)題

每次用tophat2都要先進(jìn)行注釋文件建庫(kù)會(huì)占用太多時(shí)間,所以我們可以提前建好index一勞永逸,,使用命令:tophat G  XXX_genes.gtf  --transcriptome-index=transcriptome_data/XXX  genome(基因組index 建立注釋文件.gtfindex,,對(duì)應(yīng)的,使用的tophat命令改成:tophat –p 20 –o output --transcriptome-index=transcriptome_data/XXX  genome reads_1.fa reads_2.fa











    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,,所有內(nèi)容均由用戶發(fā)布,,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式,、誘導(dǎo)購(gòu)買等信息,,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,,請(qǐng)點(diǎn)擊一鍵舉報(bào),。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多