這么簡單的問題,,總是有人問,,而且總是有人不搜索就到處問,本來我是很生氣的,,后來想一想,,應該是我們沒有教會大家搜索,也不能全部怪新手,。 以前我都是建議大家取最大表達值探針來作為基因的表達量,,其實最大值也好,平均值也罷,,中位值也好,,都是有各自的優(yōu)缺點。 而且芯片探針這種落后的技術,,在這些地方本來就不準確,,糾結這種細節(jié)意義不大。 平均值代碼我給大家一個示范,。 BiocInstaller::biocLite('CLL')
BiocInstaller::biocLite('hgu95av2.db')
library('hgu95av2.db')
library(CLL)
data(sCLLex)
sCLLex=sCLLex[,1:8] ## 樣本太多,,我就取前面8個
group_list=sCLLex$Disease
exprSet=exprs(sCLLex)
exprSet=as.data.frame(exprSet)
exprSet$probe_id=rownames(exprSet)
head(exprSet)
probe2symbol=toTable(hgu95av2SYMBOL)
dat=merge(exprSet,probe2symbol,by='probe_id')
results=t(sapply(split(dat,dat$symbol),function(x) colMeans(x[,1:(ncol(x)-1)])))
如果你看著這個代碼,卻不知道如何修改成最大值,,median等,,說明你應該是要好好學習編程了,。 請學會搜索,3000篇員原創(chuàng)教程為你而發(fā)?。,。?br>
|