久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

大數(shù)據(jù)系列-找差異分子案例操作實(shí)踐(四)

 阿非ycfg 2017-07-28


首先介紹下基因芯片軟件和工具,?;蛐酒治鲆话銓τ布蟛桓撸胀ǖ腜C機(jī)就能運(yùn)行,,但如果處理較多的數(shù)據(jù)量時,,建議提高內(nèi)存,,如果擁有16g內(nèi)存和i7的處理器基本就能快速運(yùn)行所有分析了。目前基因芯片的分析工具很多,,但各有優(yōu)缺點(diǎn),。根據(jù)難易程度推薦以下三款軟件和工具。


GeneSpring 

優(yōu)點(diǎn):互動式的視窗操作界面,,傻瓜式操作,,功能強(qiáng)大,擁有超過4400篇的高水平參考文獻(xiàn)的引用,,表達(dá)譜數(shù)據(jù)分析的金標(biāo)準(zhǔn),。

缺點(diǎn):商業(yè)軟件收費(fèi),操作繁瑣,,功能拓展性差,。如同SPSS一樣,適用于零基礎(chǔ)的鞋同,。

.BRB-Array 

 優(yōu)點(diǎn):基于excel的分析工具,,自動調(diào)用R包,功能強(qiáng)大,,拓展性強(qiáng),,操作簡單,免費(fèi)使用,。

缺點(diǎn):專業(yè)性強(qiáng),,格式要求高,稍有不符就報錯,。適用于有一定基礎(chǔ)且對英文說明書研究要透徹,。

R—Bioconductor

優(yōu)點(diǎn):R語言,生信必學(xué)的分析工具,,強(qiáng)大的統(tǒng)計分析和作圖工具,,集合了幾乎所有和最新的分析算法和工具包,任你免費(fèi)調(diào)用,。

缺點(diǎn):對于擁有安裝某個R包就研究幾天經(jīng)歷的鞋童們就不用多說了吧,!

那么便于零基礎(chǔ)的鞋童這里采用GeneSpring進(jìn)行分析。我們以上次講到的GSE15765為例90個樣本,,從cel文件開始分析,。

GeneSpring界面


新建項(xiàng)目,命名,。


新建實(shí)驗(yàn),,命名。


選擇芯片平臺,,即哪家公司的哪類產(chǎn)品,。


選擇高級分析,,點(diǎn)擊ok。


選擇文件,,導(dǎo)入cel文件,。


輸入arr文件,不用輸入跳過這步點(diǎn)next,。


選擇算法,,從還原文獻(xiàn)中得知采用RMA。一般選擇中位數(shù)作為基線,。


點(diǎn)擊完成后,,運(yùn)行。最終生成了一個22277個探針*90個樣本的矩陣格式形式了,。


接下來就是導(dǎo)入平臺注釋文件,,告訴你這些探針號代表的基因是什么。


導(dǎo)入對應(yīng)的上期所講的平臺注釋txt文件,。


記得打開它,,把多余的標(biāo)題刪除,保持也是矩陣形式,。


選擇你要匹配的id和注釋的信息,。根據(jù)文獻(xiàn),我們就選擇ID,,Gene Symbol,,ENTREZ_GENE_ID和Gene Title。當(dāng)然也可以選擇更多信息來注釋你的探針,。


這樣就完成注釋了,。


最后就是要輸入樣本的分組信息。只有知道樣本的分組信息才能進(jìn)行統(tǒng)計,,沒有比較就沒有差異,。


添加一個分組變量,命名type,,非數(shù)值型。


根據(jù)實(shí)驗(yàn)分組信息,,對具體樣本編號進(jìn)行hcc,,hcc-icc,icc分組,。


然后點(diǎn)擊create interpretation來進(jìn)一步描述統(tǒng)計目的,。


選擇不連續(xù)變量。


選擇包含三個分組,,取均值,。


產(chǎn)生了三組的圖譜,。可以指針懸??词裁椿?。


接下來是統(tǒng)計,可以進(jìn)行三組檢驗(yàn)的各種統(tǒng)計分析,。


如果只想進(jìn)行兩組(例如hcc和icc)的檢驗(yàn),。那么重新create interpretation,只選擇hcc和icc,。這里舉例hcc和icc,,用非配對的t檢驗(yàn)。


根據(jù)你不同的目的選擇不同的統(tǒng)計方法,。


設(shè)定p值的閾值,。


篩選出14633個探針,p<>


接下來再根據(jù)差異倍數(shù)進(jìn)一步篩選,。


選擇HCC v ICC,。


選擇2倍差異閾值。


總共4151個探針,,至少兩倍差異,,p<>


右擊鼠標(biāo)導(dǎo)出數(shù)據(jù)。


打開txt,,就得到最終的詳細(xì)列表,。



最后可以通過txt導(dǎo)入excel,進(jìn)一步整理成發(fā)表論文的表格,,這樣就大功告成了,。


這期就到這里了,下期將進(jìn)一步實(shí)現(xiàn)如何把不同類型的芯片數(shù)據(jù)集整合在一起,,即還原文獻(xiàn)中以下這段過程,。



關(guān)于GeneSpring的安裝下載,可從官網(wǎng)機(jī)構(gòu)郵箱注冊獲得,,可以免費(fèi)試用7天


本期也有幾提問:

  1. 如果數(shù)據(jù)集沒有cel格式的原始數(shù)據(jù),,只有矩陣文本是否能用GeneSpring來統(tǒng)計分析差異?怎么操作,?
  2. GeneSpring還能做哪些分析,?怎么操作?


作者簡介

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,,所有內(nèi)容均由用戶發(fā)布,,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,,謹(jǐn)防詐騙,。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報,。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多