今天教一下大家如何更加快速的(可都是Mb/s的速度奧)下載NCBI數(shù)據(jù),,包括轉(zhuǎn)錄組,、基因組原始數(shù)據(jù)SRA文件和基因組組裝及注釋數(shù)據(jù)(genome和GFF文件),還有其他NCBI上所有數(shù)據(jù)大家自己發(fā)揮,,都能找到,,快速下載! 一,、window系統(tǒng) 1,、軟件下載。Aspera Connect下載, 下載地址:http://www./downloads,,選擇相應(yīng)版本,,安裝到本地電腦上; 2,、數(shù)據(jù)網(wǎng)址獲得,。所有適用于aspera下載的數(shù)據(jù)均在此網(wǎng)址內(nèi)http://www.ncbi.nlm./projects/faspftp/,你只需要找到對應(yīng)的數(shù)據(jù)點擊即可彈出aspera軟件下載界面,,下載即可(一個一個下,,不可貪多奧!) SRA數(shù)據(jù)下載截圖,,找到對應(yīng)的SRR號,,點擊黃色部分SRR000001.sra即可完成下載 基因組相關(guān)信息網(wǎng)址:找到genome,然后找到對應(yīng)物種拉丁文即可,,注意點擊黃色部分向右的小箭頭,,會翻頁的奧!(別找不到自己的物種) 二,、linux系統(tǒng) 1. 進入linux服務(wù)器,,下載aspera。 輸入:wgethttp://downloads./download/sw/connect/3.1/aspera-connect-3.1.1.70545-linux-64.tar.gz 將會開始下載,。 2. 下載完畢后,,解壓,輸入: tar xvf aspera-connect-3.1.1.70545-linux-64.tar.gz 3. 安裝輸入:sh aspera-connect-3.1.1.70545-linux-64.sh 4. cd 到/home/usrname文件夾,,ls-a就能看到 .aspera 這就是安裝的文件夾,。 5. 重要一步,添加環(huán)境變量,,否則不能用,。輸入 exportPATH=$PATH:/home/username/.aspera/connect/bin 6. 數(shù)據(jù)下載。 可以按照這個模板去下載了SRA數(shù)據(jù)(如果很多可以把所有命令寫到一個shell里面,,nohup提交睡大覺去就可以了,,明早一醒,,全部ok) nohup /home/usrname/.aspera/connect/bin/ascp -i/home/usrname/.aspera/connect/etc/asperaweb_id_dsa.openssh -k 1 -T [email protected].:/sra/sra-instant/reads/ByRun/sra/SRR/SRR949/SRR949627/SRR949627.sra./ & 可以按照此模板下載基因組相關(guān)數(shù)據(jù) ~/.aspera/connect/bin/ascp -i~/.aspera/connect/etc/asperaweb_id_dsa.openssh -k 1 -T [email protected].:genomes/all/GCF_000147175.1_CamFlo_1.0/GCF_000147175.1_CamFlo_1.0_genomic.fna.gz./ 其中GCF_000147175.1_CamFlo_1.0/GCF_000147175.1_CamFlo_1.0_genomic.fna.gz根據(jù)你要下載的基因組改成NCBI FTP上的基因組、GFF和CDS文件名字 其他類型數(shù)據(jù)類似 |
|
來自: sailing_387 > 《待分類》