首先介紹下基因芯片軟件和工具,?;蛐酒治鲆话銓τ布蟛桓撸胀ǖ腜C機(jī)就能運(yùn)行,,但如果處理較多的數(shù)據(jù)量時,,建議提高內(nèi)存,,如果擁有16g內(nèi)存和i7的處理器基本就能快速運(yùn)行所有分析了。目前基因芯片的分析工具很多,,但各有優(yōu)缺點(diǎn),。根據(jù)難易程度推薦以下三款軟件和工具。 優(yōu)點(diǎn):互動式的視窗操作界面,,傻瓜式操作,,功能強(qiáng)大,擁有超過4400篇的高水平參考文獻(xiàn)的引用,,表達(dá)譜數(shù)據(jù)分析的金標(biāo)準(zhǔn),。缺點(diǎn):商業(yè)軟件收費(fèi),操作繁瑣,,功能拓展性差,。如同SPSS一樣,適用于零基礎(chǔ)的鞋同,。 優(yōu)點(diǎn):基于excel的分析工具,,自動調(diào)用R包,功能強(qiáng)大,,拓展性強(qiáng),,操作簡單,免費(fèi)使用,。缺點(diǎn):專業(yè)性強(qiáng),,格式要求高,稍有不符就報錯,。適用于有一定基礎(chǔ)且對英文說明書研究要透徹,。優(yōu)點(diǎn):R語言,生信必學(xué)的分析工具,,強(qiáng)大的統(tǒng)計分析和作圖工具,,集合了幾乎所有和最新的分析算法和工具包,任你免費(fèi)調(diào)用,。缺點(diǎn):對于擁有安裝某個R包就研究幾天經(jīng)歷的鞋童們就不用多說了吧,!那么便于零基礎(chǔ)的鞋童這里采用GeneSpring進(jìn)行分析。我們以上次講到的GSE15765為例90個樣本,,從cel文件開始分析,。選擇芯片平臺,,即哪家公司的哪類產(chǎn)品,。 輸入arr文件,不用輸入跳過這步點(diǎn)next,。 選擇算法,,從還原文獻(xiàn)中得知采用RMA。一般選擇中位數(shù)作為基線,。 點(diǎn)擊完成后,,運(yùn)行。最終生成了一個22277個探針*90個樣本的矩陣格式形式了,。 接下來就是導(dǎo)入平臺注釋文件,,告訴你這些探針號代表的基因是什么。
導(dǎo)入對應(yīng)的上期所講的平臺注釋txt文件,。
記得打開它,,把多余的標(biāo)題刪除,保持也是矩陣形式,。
選擇你要匹配的id和注釋的信息,。根據(jù)文獻(xiàn),我們就選擇ID,,Gene Symbol,,ENTREZ_GENE_ID和Gene Title。當(dāng)然也可以選擇更多信息來注釋你的探針,。 這樣就完成注釋了,。
最后就是要輸入樣本的分組信息。只有知道樣本的分組信息才能進(jìn)行統(tǒng)計,,沒有比較就沒有差異,。添加一個分組變量,命名type,,非數(shù)值型。根據(jù)實(shí)驗(yàn)分組信息,,對具體樣本編號進(jìn)行hcc,,hcc-icc,icc分組,。然后點(diǎn)擊create interpretation來進(jìn)一步描述統(tǒng)計目的,。產(chǎn)生了三組的圖譜,。可以指針懸??词裁椿?。接下來是統(tǒng)計,可以進(jìn)行三組檢驗(yàn)的各種統(tǒng)計分析,。如果只想進(jìn)行兩組(例如hcc和icc)的檢驗(yàn),。那么重新create interpretation,只選擇hcc和icc,。這里舉例hcc和icc,,用非配對的t檢驗(yàn)。根據(jù)你不同的目的選擇不同的統(tǒng)計方法,。 設(shè)定p值的閾值,。接下來再根據(jù)差異倍數(shù)進(jìn)一步篩選,。右擊鼠標(biāo)導(dǎo)出數(shù)據(jù)。
最后可以通過txt導(dǎo)入excel,進(jìn)一步整理成發(fā)表論文的表格,,這樣就大功告成了,。
這期就到這里了,下期將進(jìn)一步實(shí)現(xiàn)如何把不同類型的芯片數(shù)據(jù)集整合在一起,,即還原文獻(xiàn)中以下這段過程,。
關(guān)于GeneSpring的安裝下載,可從官網(wǎng)機(jī)構(gòu)郵箱注冊獲得,,可以免費(fèi)試用7天 - 如果數(shù)據(jù)集沒有cel格式的原始數(shù)據(jù),,只有矩陣文本是否能用GeneSpring來統(tǒng)計分析差異?怎么操作,?
|