現(xiàn)在是2021了,,有了很多成熟的軟件算法可以做peaks的差異分析,,不過偶爾憶苦思甜也是有必要的ATAC-seq經(jīng)典差異分析,讓我們一起看看距離2013年的ATAC-seq技術(shù)開發(fā)出來不到兩年的 2015的一個(gè)文章是如何做,。文章是:A novel ATAC-seq approach reveals lineage-specific reinforcement of the open chromatin landscape via cooperation between BAF and p63. Genome Biol 2015 Dec 18;16:284. PMID: 26683334 數(shù)據(jù)集在:https://www.ncbi.nlm./geo/query/acc.cgi?acc=GSE67382 可以看到里面的ATAC-seq的數(shù)據(jù)是4個(gè): GSM1645706 BAFi_ATAC_rep1 可以看到很明顯的2個(gè)組,,每個(gè)組都是2個(gè)重復(fù)的樣品,而且根據(jù)peaks的信號(hào)值強(qiáng)度相關(guān)性散點(diǎn)圖可以看出來組內(nèi)一致性比較好: 其實(shí)現(xiàn)在有Irreproducibility Discovery Rate (IDR)指標(biāo),,用于評(píng)估重復(fù)樣本間peaks一致性,。IDR評(píng)估會(huì)同時(shí)考慮peaks間的overlap和富集倍數(shù)的一致性。通過IDR閾值(0.05)的占比越大,,說明重復(fù)樣本間peaks一致性越好,。 差異分析主居然還像模像樣的給出來了一個(gè)流程圖,簡(jiǎn)單的上下調(diào)的peaks數(shù)量,,還可以畫一個(gè)餅圖: 挑選具體的基因,,進(jìn)行IGV軟件載入bw文件的可視化,看ATAC-seq的信號(hào)差異: 另外一個(gè)不得不提的經(jīng)典圖表,,就是看信號(hào)強(qiáng)度的: 處理流程首先看上游數(shù)據(jù)處理流程:
下游就是差異分析,;
其實(shí)呢,現(xiàn)在的ATAC-seq 數(shù)據(jù)處理的更完善了,,見ATAC-seq項(xiàng)目的標(biāo)準(zhǔn)分析僅收費(fèi)1600,,差異分析也有專門的R包,比如 Diffbind,,有一個(gè)2020綜述《From reads to insight: a hitchhiker’s guide to ATAC-seq data analysis》值得看:
結(jié)合轉(zhuǎn)錄組測(cè)序可以看到是3個(gè)分組,,共6個(gè)樣品: GSM1921004 Ctrli_rep1_RNAseq 兩次差異分析,各自挑選 (fold change?>?3 with depletion, FDR?<?0.01)的基因,,然后看交集: 對(duì) 236 genes controlled jointly by both BAF and p63 進(jìn)行GO數(shù)據(jù)庫的功能注釋,。 這個(gè)轉(zhuǎn)錄組數(shù)據(jù)分析比較容易復(fù)現(xiàn),基本上看我六年前的表達(dá)芯片的公共數(shù)據(jù)庫挖掘系列推文即可; 文末友情推薦 |
|