你會用到的網(wǎng)站:
IGV 官網(wǎng)http://software./software/igv/download~ Broadinstitute出品
Java version8 下載: https://www./en/download/mac_download.jsp
IGV內(nèi)置的物種基因組及基因組來源:http://software./software/igv/Genomes
完整的官方幫助文檔:http://software./software/igv/book/export/html/6
寫在前面:
之前mac不小心升級了一下java,,然后igv就不能用了,,要寫教程必須降級java
首先,,看官方說明,,需要安裝Java -8,,9以上版本不支持。我的mac不知道什么時候更新到了java 10,,按說可以向下兼容,,但是事與愿違,igv不能正常使用了,。
需要降級Java,,mac用戶可以直接參考,,windows可以試下直接下載安裝IGV:
先刪除原來的java
terminal
打開終端,,復制粘貼一下三條命令:
sudo rm -fr /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin
sudo rm -fr /Library/PreferencesPanes/JavaControlPanel.prefPane
sudo rm -fr ~/Library/Application\ Support/Java
??:不要通過/usr/bin 刪除 Java 工具來卸載 Java。此目錄是系統(tǒng)軟件的一部分,,下次對操作系統(tǒng)執(zhí)行更新時,,Apple 會重置所有更改。
finder
中進入 /Library/Java/JavaVirtualMachines
,,然后刪除之前的jdk.版本號
下載安裝新的Java version8
【Windows用戶下載,,解壓后,,點擊igv.bat文件即可啟動;如果啟動失敗,,用記事本打開并編輯igv.bat文件,,在文件的最后新起一行輸入pause,保存后,,再嘗試打開,,就可以在Windows下的命令行界面(cmd命令提示符)看到錯誤信息,再根據(jù)信息提示去解決問題,;不過一般問題不大】
正文開始:
好啦,,問題解決啦,開始正式IGV介紹,!
什么是IGV
它是一款本地的探索基因組數(shù)據(jù)的可視化瀏覽器,,有多個系統(tǒng)版本,支持多種不同類型的輸入格式,,包括芯片測序,、二代測序、基因組注釋文件等,。推薦使用BAM與SAM格式,,主要格式見下表
數(shù)據(jù)來源 | 文件格式 |
---|
序列比對 | SAM/BAM |
顯示覆蓋率 | TDF |
拷貝數(shù) | SNP、CN |
基因表達 | GCT,、RES |
基因注釋 | GFF3/GTF,、BED |
突變數(shù)據(jù) | MUT |
追蹤參考基因組覆蓋度、測序深度(UCSC) | WIG,、BW |
一睹IGV
每次打開會自動加載hg19.fa文件,,也就是人類基因組,一會進入主界面
自己構建基因組信息
這里我會舉一個昆蟲中一種——棉鈴蟲,,這個基因組是17年2月更新在NCBI傷的,,屬于小眾物種,IGV并沒有收錄,。正好拿來練手,,當然如果你研究的領域也有基因組被測出來,也可以試一試【注意:在提交基因組文件到IGV之前,,要先構建索引】
這些工作都可以在本地進行,,只需要打開你本地的git_bash或者putty/xshell或者terminal,解壓縮基因組文件=》下載samtools(推薦用conda管理)=>構建索引samtools faidx genome.fasta
=>IGV中 輸入fasta文件路徑=》提供注釋文件(可以是組裝基因組預測的基因注釋文件,,也可以是拼接轉錄組用的gtf文件)=〉其他選項可以忽略=》點擊OK推彈出一個框讓你輸入存儲路徑
查看注釋文件
這里以人類基因組注釋文件為例,,下載gtf到電腦
下載完不要急著導入,需要先構建索引
然后會生成gff3.idx或者gtf.idx文件,說明構建了索引,,接著導入File -> Load from file
,,選擇sorted的注釋文件
查看bam文件
我這里準備的bam文件大小是2.8G,是由人類轉錄組測序數(shù)據(jù)得到的,,準備的參考基因組是hg19
,,注釋文件是gencode.v28lift37.annotation.sorted.gff3
bam文件在導入前,要先使用samtools進行sort和index,,samtools sort test.bam test.sort``samtools index test.sort.bam
,生成一個后綴為“.fai”的文件,,它根據(jù)文件名自動和.bam關聯(lián), 另外這兩個文件要在一個文件夾下,,最后將bam導入IGV中
載入bam后,,默認會出現(xiàn)兩個track(翻譯的話,可以理解為不同的軌道,,顯示不同的信息)Coverage track和Alignment track,。
另外基因組信息也可以有collapsed、expanded,、squished三種展示形式
查看Coverage track
它的意思是顯示比對文件的覆蓋率和測序深度,。橫坐標是基因組上的位置,縱坐標是該位置的測序深度,?!臼髽朔旁诿恳粋€位點都會顯示一個小方框,其中的的內(nèi)容就是顯示總共有多少reads在這個位置,,每個堿基各是什么】
點右上角+放大reads可視化窗口后,,track會以灰色的條形圖來顯示每個位點的測序深度。如果某一個核苷酸與參考序列相比,,有超過20%的reads是不同的,,條形圖會顯示不同的顏色
關于上圖中的右鍵菜單,解釋如下
功能 | 含義 |
---|
Rename Track | 更改track名 |
Change Track Color | 更改背景色,,比如把Coverage Track灰色變紫色 |
Change Track Height | 改變每一個track的高度 |
Change Font Size | 改變IGV最左側字體大小 |
Set Data Range | 覆蓋深度的范圍設置 |
Log scale | 用對數(shù)尺度作圖 |
AutoScale | 是否自動縮放 |
- 比較多個基因
這里看到有許多顏色,這些顏色是根據(jù)定義不同比對類型而不同,,
查找結構變異
灰色:與參看基因組可以比對的reads
紫色I:插入(鼠標查看插入的堿基信息)
黑色橫線:——缺失
歡迎關注我們的公眾號~_~
我們是兩個農(nóng)轉生信的小碩,打造生信星球,,想讓它成為一個不拽術語,、通俗易懂的生信知識平臺。需要幫助或提出意見請后臺留言或發(fā)送郵件到[email protected]
Welcome to our bioinfoplanet!