基因分析基因表達除了移除低質(zhì)量的細胞,也會排除受技術(shù)操作影響較大的一部分基因。而且查看基因表達結(jié)果,可以幫助改進實驗操作。 通常會看
表達最高的50個基因的reads分布相對平緩,且比例不大,,在一定程度上反應(yīng)了測序?qū)φ麄€轉(zhuǎn)錄組覆蓋較好,。但是最高表達的15個基因里面有4個 基因過濾通常建議移除那些表達水平極低以至于可以視為”未檢測出”的基因。這里針對UMI數(shù)據(jù),,“檢出”定義為至少有2個細胞檢測到某個基因存在多于一個轉(zhuǎn)錄本,。如果是reads counts數(shù)據(jù), “檢出”可以定義為至少有2個細胞檢測到某個基因有至少5個reads count支持。請注意,,對兩種表達量計算方式,,閾值的選擇都與測序深度有關(guān)。自己的數(shù)據(jù)可以做相應(yīng)的修改,。另外一個需要注意的點是基因的過濾必須在細胞過濾后面,,因為部分基因可能只在低質(zhì)量細胞中能檢測的到 (注意下面的
細胞類型,建庫方案,,測序深度都會影響閾值選擇,,勿硬套。 存儲過濾后的數(shù)據(jù)查看過濾后的數(shù)據(jù)集中保留的基因數(shù)和細胞數(shù):
獲取對數(shù)轉(zhuǎn)換的原始count值,,供下一章節(jié)使用,,并且移除PCA的結(jié)果:
存儲過濾后的數(shù)據(jù)
|
|