久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

一篇文章帶你走進單細胞的天地

 健明 2021-07-15

文獻詳解欄目


每個人的時間精力有限,必須優(yōu)先閱讀相關(guān)文獻,,開設(shè)這個欄目也是希望為大家推薦高質(zhì)量的單細胞相關(guān)文獻,。如果大家對單細胞轉(zhuǎn)錄組感興趣可以關(guān)注一下,哪怕每天只學一點點,,積土成山,,積水成淵。

當然一個人的力量終歸是小的,,我也希望匯聚一群人,,形成一個場,這里頭最重要的生產(chǎn)力不是單個人多聰明,,多厲害,,而是每個人相互作用,形成的那個氛圍,。

希望大家能有所收獲,!

文章

文章發(fā)表于nature review genetics:Integrative single- cell analysis,,作者是Tim Stuart與Rahul Satija。做過單細胞分析的對他們應該都不陌生,。

   摘要  

scRNA-seq技術(shù)的發(fā)展契合了研究個體細胞表觀遺傳,、空間研究、蛋白質(zhì)組與譜系信息的方法需要,,這為研究多類型數(shù)據(jù)的綜合方法提出了獨特的機遇與挑戰(zhàn),。綜合分析可以發(fā)現(xiàn)細胞之間的模式關(guān)系,獲取細胞的整體狀態(tài)信息,,產(chǎn)生涵蓋不同樣本與不同研究手段的數(shù)據(jù)集,。該文重點討論了單細胞基因表達數(shù)據(jù)與其他類型的單細胞分析方法的整合。


 一些 · 概念

多模態(tài)(Multimodal)數(shù)據(jù):多種類型數(shù)據(jù)的組合,,如RNA與蛋白質(zhì)數(shù)據(jù)組合,,是一種多維度數(shù)據(jù),類似多組學,。

單模態(tài):單個類型數(shù)據(jù)

Pseudotime:擬時分析


聯(lián)合聚類(Joint-clustering):通過聯(lián)合不同類型數(shù)據(jù)對細胞進行分組,。


典型相關(guān)分析(CCA): 利用綜合變量對之間的相關(guān)關(guān)系來反映兩組指標之間的整體相關(guān)性的多元統(tǒng)計分析方法。


動態(tài)時間規(guī)整(Dynamic time warping):一種局部拉伸或壓縮兩個一維矢量以校正一個矢量相對于另一個矢量的滯后的方法,。


MNNs:標準化基因表達空間中最臨近的細胞,。聚類用校正批次效應。


梯度推進(Gradient boosting):一種預測模型算法,。

概述

隨著分子生物學,、微流控與納米技術(shù)的發(fā)展,催生了許多類型的單細胞測序技術(shù),。過去的方法集中在單模態(tài)測量上,,如DNA序列、RNA表達量和染色質(zhì)可及性上,。雖然這些技術(shù)促進了我們對細胞多樣性與發(fā)育景觀的理解,,但是它們并不能很好地解析單細胞內(nèi)分子間互作關(guān)系。而這些互作關(guān)系是深入探索細胞狀態(tài)的關(guān)鍵,。此外,,隨著可用數(shù)據(jù)集規(guī)模的快速增長,迫切需要用于標準化與聯(lián)合分析且考量到批次效應與個體差異的計算方法,。


scRNA-seq是應用最為廣泛的單細胞測序技術(shù)之一,。而后出現(xiàn)了一系列互補技術(shù)如單細胞基因組、表觀基因組和蛋白質(zhì)組分析技術(shù),,涵蓋了單細胞基因組測序(
Vitak, S. A. et al., 2017; Navin, N. et al., 2011),、染色質(zhì)可及性(Pott, S., 2017; Corces, M. R. et al., 2016; Buenrostro, J. D. et al., 2015; Cusanovich, D. A. et al., 2015; Lake, B. B. et al., 2018)、DNA甲基化(Luo, C. et al., 2017; Smallwood, S. A. et al., 2014; Guo, H. et al., 2013; Mulqueen, R. M. et al., 2018),、膜蛋白(Stoeckius, M. et al., 2017; Peterson, V. M. et al., 2017),、小RNA(Faridani, O. R. et al., 2016),、組蛋白修飾(Gomez, D. te al., 2013; Rotem, A. et al., 2015)和染色體構(gòu)象(Ramani, V. et al., 2017; Nagano, T. et al., 2013)等技術(shù)。目前已開發(fā)出研究單細胞空間結(jié)構(gòu)和譜系信息的方法(Frieda, K. L. et al., 2017; Shah, S. et al., 2016),。

單細胞多模態(tài)綜合分析方法示意

Multimodal and integrative methods for single- cell analyses


目前已有多種方法測定單細胞各個時期不同參數(shù),,這些方法可以大致分為細胞狀態(tài)分析細胞譜系分析,、擬時分析三大類,,圖中適用于不同類型的分析方法均已標注

單模態(tài)與多模態(tài)分析方法匯總


CEL-seq:線性擴增測序法
CITE- seq:膜蛋白豐度與基因表達水平測定
G&T-seq:基因組轉(zhuǎn)錄組測序
LINNAEUS:譜系追蹤
MARS-seq:大規(guī)模平行單細胞RNA測序
MEMOIR:譜系與空間結(jié)構(gòu)測定
MERFISH:主要是細胞間結(jié)構(gòu)測定
osmFISH:環(huán)狀單分子熒光原位雜交,,空間結(jié)構(gòu)測定
REAP- seq:膜蛋白豐度與基因表達水平測定
scATAC-seq:單細胞空間結(jié)構(gòu)測定
scBS-seq:單細胞甲基化測序
scChIP-seq:單細胞ChIP-seq
scGESTALT:結(jié)合CRISPR-cas9的譜系追蹤弄方法
scHi-C-seq:測定染色體組裝
sciATAC-seq:結(jié)合index轉(zhuǎn)座酶的scATAC-seq
sci-CAR:利用index聯(lián)合分析mRNA和染色質(zhì)可及性譜
sci-MET:利用index分析單細胞甲基化水平
sci-RNA-seq:結(jié)合index的scRNA-seq
SCI-seq:單細胞組合標記測序,,檢測CNV
scM&T-seq:單細胞甲基化組和轉(zhuǎn)錄組測序,可研究未知的DNA甲基化與基因表達之間的關(guān)系
scNOMe- seq:核小體占位與甲基化組測序
scRRBS:單細胞限制性代表區(qū)域甲基化測序
scTHS- seq:單細胞轉(zhuǎn)座體超敏性位點測序
seqFISH:內(nèi)含子序貫熒光原位雜交,,擴展觀測到基因數(shù)量
snmC-seq:單核甲基胞嘧啶測序
SNS:單核測序
SPLiT-seq:丐版scRNA-seq
STARmap:原位單細胞測序

理想的實驗流程應當全面洞悉細胞的所有方面,,包括分子狀態(tài)、空間構(gòu)象,、胞外環(huán)境互作的全部過程,。盡管當下技術(shù)手段無法做到,但多模態(tài)技術(shù)與綜合計算方法可以是我們離該目標越來越近,。文章希望提出整合單細胞轉(zhuǎn)錄組學,、基因組學、表觀組學與蛋白組學的數(shù)據(jù)統(tǒng)一分析方法,,重點在結(jié)合其他數(shù)據(jù)類型分析scRNA-seq數(shù)據(jù),,尤其是整合來自于同一細胞的不同類型數(shù)據(jù)。

文章分為四大塊,,首先探討了多模態(tài)單細胞分析方法,,其次研究了不同實驗不同數(shù)據(jù)整合分析,然后討論了單細胞空間測序數(shù)據(jù)整合分析方法,,最后給出了整合分析方法的前景與必要性,。(本文中我把第二和第三塊的內(nèi)容合在了一起)

單細胞多模態(tài)測序方法

最初的單細胞分析方法主要關(guān)注細胞某狀態(tài)下的某類分子水平。而現(xiàn)在更引人矚目的是同時分析單細胞內(nèi)多種分子以建立更全面的單細胞分子視圖,。通常這些方法是將scRNA-seq數(shù)據(jù)與其它分析手段的結(jié)合,,目前主要有四種策略從單細胞中得到多模態(tài)數(shù)據(jù):

1.1
FACS結(jié)合scRNA-seq

嚴格來說這種方法算單模態(tài)。


一些scRNA-seq workflow采用流式分選細胞,,隨后進行scRNA-seq(MARS-seq/Smart-seq/2),,這樣可以同時獲得單細胞與對應的熒光信號,將熒光所表示的蛋白質(zhì)水平與轉(zhuǎn)錄組在同一細胞中關(guān)聯(lián)(
Ramsk?ld, D. et al., 2012; Jaitin, D. A. et al., 2014; Picelli, S. et al., 2013 ),。早期研究(Hayashi, T. et al., 2010)利用FACS結(jié)合半定量RT-PCR(作者稱之為FBSC‐PCR),,結(jié)合scRNA-seq,明確了細胞表面marker可以區(qū)分細胞類型與狀態(tài)(Wilson, N. K. et al., 2015;該文結(jié)合了Smart-seq2),,(Paul, F. et al., 2015;該文結(jié)合了MARS-seq)和鑒定稀有細胞的思路,。Paul, F. et al., 2015Nestorowa, S. et al., 2016利用該workflow研究發(fā)現(xiàn)了小鼠造血祖細胞由轉(zhuǎn)錄組定義不同細胞簇的免疫表型,,Wilson, N. K. et al., 2015則分離了小鼠HSCs,鑒定細胞維持干性相關(guān)的表面marker,。但是囿于熒光光譜的重疊現(xiàn)象,,利用該法測到的每個細胞的參數(shù)范圍有限。

1.2
  細胞內(nèi)組分分離分析

針對熒光無法分選的部分,,F(xiàn)ACS顯然是不合適的,,尤其是需要同時測得單細胞基因組與胞內(nèi)蛋白的scRNA-seq實驗。此時需要物理分離或通過不同tag篩選出不同組分,。

G&T-seq通過加入oligo(dT)特異性分離mRNA同時保留基因組DNA從而實現(xiàn)了基因組轉(zhuǎn)錄組平行測序(Macaulay, I. C. et al., 2015)DR-seq通過則通過加入barcode特異擴增cDNA序列實現(xiàn)基因組轉(zhuǎn)錄組平行測序(Dey, S. S. et al., 2015),。這使得單細胞基因表達水平與其對應基因型聯(lián)系起來,深度揭示單細胞間DNA拷貝數(shù)變異與染色體重排對下游mRNA豐度的具體關(guān)聯(lián),。這些方法適用于研究體細胞基因高度變異的腫瘤組織,。

DNA甲基化與轉(zhuǎn)錄組水平結(jié)合研究是基于Macaulay, I. C. et al., 2015的G&T-seq和 Smallwood, S. A. et al., 2014的scBS- seq技術(shù)發(fā)展的,同普通BSP一樣,,用亞硫酸氫鈉處理DNA片段隨后進行擴增,,結(jié)合G&T-seq,可以分析同一細胞內(nèi)的DNA甲基化模式和基因表達數(shù)據(jù)(Angermueller, C. et al., 2016),。由于DNA甲基化存在不穩(wěn)定性和異質(zhì)性,,因此若要研究DNA甲基化與基因表達間的關(guān)系,則必須將表觀基因組變異與細胞間的異質(zhì)性區(qū)別開來,。
通過DNA甲基化與轉(zhuǎn)錄組關(guān)聯(lián)分析,,為啟動子甲基化與基因表達間的負相關(guān)性提供深層次的證據(jù)。此外,,利用barcode系統(tǒng)選擇性標記基因組DNA與cDNA,,結(jié)合index系統(tǒng),可以對數(shù)千個單細胞進行染色質(zhì)可及性與基因表達水平間的關(guān)聯(lián)分析,,同時鑒定出影響基因表達的順式調(diào)控元件(Cao, J. et al., 2018),。

關(guān)于胞內(nèi)蛋白與mRNA關(guān)聯(lián)研究,有兩種思路可供借鑒,。其一(Darmanis, S. et al., 2016)是將FACS sort到的細胞裂解后分離裂解液,,分別進行蛋白質(zhì)與RNA定量。作者采用PEA (鄰近探針延伸分析) 檢測蛋白并用RT-qPCR定量,,采用qRT-PCR定量mRNA,。該法可以同時檢測82個mRNA/75個蛋白;其二(Genshaft, A. S. et al.)是將FACS sort到的細胞在微流控芯片中同時進行逆轉(zhuǎn)錄和PEA而不分離裂解液,。該法可以同時檢測96個mRNA/38個蛋白,。這兩種方法檢測的蛋白與mRNA數(shù)量與質(zhì)量均有限。

1.3
泛化測序數(shù)據(jù)統(tǒng)一


此處泛化統(tǒng)一是指將多種數(shù)據(jù)類型(蛋白數(shù)據(jù)/譜系數(shù)據(jù)/基因表達數(shù)據(jù))整合為一個通用型數(shù)據(jù)類型。
CITE-seq與REAP-seq可以同時將細胞表面膜蛋白信息與mRNA轉(zhuǎn)為cDNA信息,,通過測序可以同時檢測到二者實際水平,。具體是利用帶有polyA的不同barcode的抗體結(jié)合細胞表面蛋白,barcode可以與mRNA一起檢測,。與FACS-scRNAseq相比,,針對不同表位的不同抗體barcode都是特異的,可以從根本上消除熒光信號重疊對檢測數(shù)量的限制,,這使得區(qū)分不同免疫細胞的細微差別成為可能,。但是該法對于胞內(nèi)蛋白與mRNA共檢測是行不通的。作者認為可以與PEA結(jié)合來解決這一問題,,或是采用SPLiT-seq,、sci-RNA-seq的研究思路來解決。

這些技術(shù)的出現(xiàn)表明若將可以細胞信息轉(zhuǎn)化為有序的barcode,,我們就可以在分析單細胞轉(zhuǎn)錄組時將這些信息同時獲取,。這種策略不僅適用于分析細胞的自然狀態(tài),也適用于大規(guī)?;驍_動研究。目前有Perturb-Seq(Dixit, A. et al., 2016)和CRISPR-Seq(Adamson, B. et al., 2016; Datlinger, P. et al., 2017; Jaitin, D. A. et al., 2016),,他們將scRNA-seq與CRISPR-cas9結(jié)合進行遺傳篩選,,使得研究正向遺傳學的大規(guī)模基因擾動試驗成為可能,。具體原理是給單個基因擾動和受到影響的細胞添加barcode,,通過scRNA-seq能夠鑒定出這兩者,從而推斷CRISPR靶向基因和由此產(chǎn)生的單個細胞的轉(zhuǎn)錄譜間的關(guān)系,。目前應用在基因調(diào)控網(wǎng)絡(luò)(Dixit, A. et al., 2016),、未折疊蛋白反應(Adamson, B. et al., 2016)、免疫細胞分化發(fā)育(Datlinger, P. et al., 2017)和T細胞受體激活(Jaitin, D. A. et al., 2016),,非編碼區(qū)調(diào)控元件(Klann, T. S. et al., 2017),。此外,還可以結(jié)合CRISPR-dcas9系統(tǒng),,擴展到轉(zhuǎn)錄調(diào)控,、表觀遺傳調(diào)控領(lǐng)域中(Thakore, P. I. et al., 2016; Liu, X. S. et al., 2016; Hilton, I. B. et al., 2015; Konermann, S. et al., 2015; Gilbert, L. A. et al., 2017),18年發(fā)展了同時靶向和敲除基因的技術(shù)(Boettcher, M. et al., 2018)。

另一個應用是結(jié)合CRISPR-cas9的譜系追蹤技術(shù),。單細胞譜系追蹤是去年的大熱方向之一,,此處提到三種mRNA+lineage方法:scGESTALTScarTrace,、LINNAEUS,。這三種方法各有不同,但大體是利用CRISPR-cas9連續(xù)切割結(jié)合到基因組上的barcode,細胞會用NHEJ來應對這種損傷,。但NHEJ容易出錯,,從而在DNA序列中產(chǎn)生隨機突變,這些突變通過細胞分裂進行遺傳,,結(jié)合scRNAseq利用這些突變作為復合barcode來構(gòu)建組織或器官發(fā)育譜系,。

另一種略有不同的方法是MEMOIR,它結(jié)合smFISH與CRISPR-cas9系統(tǒng),,可以同時檢測細胞譜系與空間位置,。

1.4
scRNA-seq數(shù)據(jù)挖掘

普通的scRNA-seq流程除了可以做轉(zhuǎn)錄本豐度外,還可以進行諸如體細胞突變,、遺傳變異,、RNA isoform等分析。

關(guān)于體細胞突變目前已有研究(Lodato, M. A. et al., 2015),該文通過對人大腦的少量單細胞全基因組測序,,分析了發(fā)生的細胞突變,,構(gòu)建了人大腦神經(jīng)細胞譜系。作者發(fā)現(xiàn)突變大多發(fā)生在高轉(zhuǎn)錄活性相關(guān)位置,,這表明可能可以通過scRNA-seq數(shù)據(jù)來分析神經(jīng)細胞突變情況,,根據(jù)轉(zhuǎn)錄狀態(tài)重構(gòu)神經(jīng)細胞譜系。此外,,分析scRNA-seq數(shù)據(jù)中的拷貝數(shù)變異,,可以研究癌癥非整倍體與異質(zhì)性等情況(Tirosh, I. et al., 2016; Fan, J. et al., 2018)。
單細胞分析也為理解DNA自然變異如何影響基因表達與細胞狀態(tài)提供了新思路,。有研究結(jié)合GWAS+scRNAseq,,鑒定出了不同個體之間的eQTL(Kang, H. M. et al., 2018)。

1.4
多模態(tài)數(shù)據(jù)分析

多模態(tài)測序策略正在催生與之相匹配的數(shù)據(jù)分析方法,。多模數(shù)據(jù)集可以檢測到細胞間的細微差異,,而單模數(shù)據(jù)很可能無法做到這一點。由于scRNAseq數(shù)據(jù)存在dropout,,故而它更容易忽略細胞間的細微差別,;但與來自同一細胞的其他數(shù)據(jù)互補分析可以改善這一問題。例如,,很難通過scRNA-seq數(shù)據(jù)區(qū)分不同的T細胞亞群,,但聯(lián)合膜蛋白分析則可以顯著提高亞群分辨率(Stoeckius, M. et al., 2017),同樣,,RNA+chromatin,、RNA+methylation聯(lián)合可能揭示單個細胞間的調(diào)控異質(zhì)性,不再贅述,。

單細胞多模態(tài)分析思路很可能受到bulk-seq多組學聯(lián)合分析的啟發(fā)(Meng, C. et al., 2016),,Argelaguet開發(fā)了一種名為MOFA( multi- omics factor analysis)的方法,,該方法在多組學bulk-seq數(shù)據(jù)中效果良好,同時測試了單細胞DNA甲基化數(shù)據(jù)與RNA數(shù)據(jù)聯(lián)合處理情況,,效果也可以,。這暗示適用于bulk-seq的多組學數(shù)據(jù)處理方式可能也適用于單細胞多模態(tài)數(shù)據(jù)。鑒于單細胞數(shù)據(jù)規(guī)模遠超bulk-seq,,多視圖機器學習不失為一種重要的補充手段(Colomé- Tatché, M. & Theis, F. J., 2018),。
單細胞多模態(tài)研究策略為解析細胞內(nèi)不同組分間的關(guān)系提供了新方法。如CITE-seq和REAP-seq可以輕易鑒別出相關(guān)度較低的RNA-protein模塊,,表明此處存在活躍的轉(zhuǎn)錄后調(diào)節(jié),。還有一個很有意思的是通過測量剪接過的成熟RNA與未剪接RNA的相對豐度,可以建立RNA與蛋白的關(guān)聯(lián)動態(tài)模型(La Manno, G. et al., 2018),。
此外,,還可以在不同類型數(shù)據(jù)間建立統(tǒng)計模型。前面提到的sci-CAR文章建立了染色質(zhì)可及性與基因表達水平間的統(tǒng)計模型,,通過染色質(zhì)可及性數(shù)據(jù)估計細胞內(nèi)基因表達水平(Cao, J. et al., 2018),,另一組研究人員建立了gRNA與基因表達水平間的線性回歸模型,用以識別細胞應答的前后關(guān)系,,重構(gòu)轉(zhuǎn)錄網(wǎng)絡(luò)(Perturb-Seq(Dixit, A. et al., 2016)),。通過這種手段可以研究目標物種復雜的調(diào)控網(wǎng)絡(luò)。


不同來源測序數(shù)據(jù)整合

前面主要講了在同一測序?qū)嶒炌慌毎M行的多模態(tài)數(shù)據(jù)整合,,而不同測序?qū)嶒灁?shù)據(jù)整合分析才是亟需解決的關(guān)鍵問題,。同bulk seq 數(shù)據(jù)一樣,處理批次效應是綜合分析不同實驗室,、不同workflow產(chǎn)出數(shù)據(jù)的首要問題(SVA包(Leek, J. T. 2014))。然而目前bulk seq水平的處理方法無法處理單細胞數(shù)據(jù)((Haghverdi, L, et al.,  2018,,作者用MNN處理數(shù)據(jù),,該法在mnnpy中得到改進);  Butler, A, et al,. 2018)。目前最新方法利用CCA/MNN可以識別出兩個數(shù)據(jù)集間共有的部分,,判定細胞間共有的生物學狀態(tài),然后以這些相同狀態(tài)的細胞為基準消除批次效應,。

2.1
常規(guī)scRNA-seq數(shù)據(jù)整合分析

此處作者介紹了他自己在Seurat V2中開發(fā)的方法(Satija, R, et al., 2015;),該法用CCA鑒別出不同數(shù)據(jù)集間相同的細胞類型且可以避免出現(xiàn)由批次效應或常規(guī)PCA造成的假陽性細胞類型,;接下來采用動態(tài)時間規(guī)整算法校正數(shù)據(jù)集間細胞密度差異,。這兩步驟可以將細胞投影到一個低維空間,具有相同生物學狀態(tài)的細胞相互接近且消除了不同數(shù)據(jù)集帶來的影響,。

另一種方法即mnnCorrect,,最早用于計算機領(lǐng)域圖形識別。該法尋找不同數(shù)據(jù)集間最接近的細胞,,將之判定為潛在的狀態(tài)相同細胞,,隨后利用成對MNNs距離計算一個批次參數(shù)(batch vector),用以校正原始表達矩陣(Haghverdi, L., 2018)。

CCA/mnnCorrect在整合處理不同來源的scRNA-seq數(shù)據(jù)時表現(xiàn)良好,。這將極大提升發(fā)現(xiàn)稀有細胞,、微弱轉(zhuǎn)錄差異細胞及與之對應maker的能力(Haghverdi, L, et al,.2018Butler, A,et al,. 2018) ,。這為建立一個統(tǒng)一的單細胞參考數(shù)據(jù)集提供了依據(jù),。在此基礎(chǔ)上,scRNA-seq數(shù)據(jù)整合分析得到了快速發(fā)展(Hie, B. L, et al., 2018; Barkas, N. et al., 2018; Park, J.-E., 2018; Korsunsky, I. et al., 2018; Stuart, T. et al., 2018; Welch, J. et al., 2018),。這種多數(shù)據(jù)集整合分析的應用遠不止用于校正批次效應這么單一,。它可以在單細胞尺度上深入比較細胞間的狀態(tài),發(fā)現(xiàn)細胞對環(huán)境及基因擾動的特異性響應,,對不同疾病及不同治療下的患者的測序數(shù)據(jù)進行標準化,。
scRNA-seq數(shù)據(jù)整合分析還可以擴展至跨物種分析。Karaiskos,N比較了兩種果蠅早期胚胎的空間基因表達模式,,通過構(gòu)建空間基因表達圖譜,,該研究系統(tǒng)比較了兩個果蠅的同源基因表達譜,鑒定出了彼此間的進化波動,。Tosches比較了爬行動物與哺乳動物腦細胞間的相關(guān)性,。Baron分析了人與小鼠胰島細胞scRNA-seq數(shù)據(jù),鑒定出了二者間的保守亞群,。Alpert開發(fā)出了cellAlign,,在一維水平上比對了人與小鼠的擬時軌跡,發(fā)現(xiàn)人胚胎合子激活要比小鼠晚,,小鼠中比人活躍的基因皆與蛋白合成相關(guān),。跨物種分析未來是光明的,,但對于多物種整合分析而言,,精確鑒定物種間同源基因是多物種整合分析至關(guān)重要的一步。

2.2
多重scRNA-seq數(shù)據(jù)集間的細胞分類

以細胞分類信息的形式串聯(lián)不同的scRNA-seq數(shù)據(jù)集,,或者借鑒到自己實驗中,,是優(yōu)于合并數(shù)據(jù)集然后de novo聚類這種方法的。且隨著有參細胞圖譜的開發(fā),,這種方式將更加尋常,。目前已開發(fā)對應方法:scmap- cell & scmap- cluster,其中scmap-cell 用乘積量化(product quantization)算法進行比對,,而scmap-cluster則用于識別未知數(shù)據(jù)集中的cluster,。

利用已有的注釋數(shù)據(jù)集,目前開發(fā)的新方法采用奇異值分解,、線性判別分析支持向量機算法來對細胞進行分類,。此外,,隨著引用數(shù)據(jù)集的大小、范圍與深度越來越高,,監(jiān)督聚類在解析細胞類型方面要比無監(jiān)督聚類強得多,。通過以上這些方法,可以更精確地識別并解析細胞亞群,。

2.3
不同來源和類型的單細胞數(shù)據(jù)整合分析

satija已有相關(guān)文章研究:Comprehensive Integration of Single-Cell Data
這一部分講的是將scRNA-seq數(shù)據(jù)與其它不同來源和類型數(shù)據(jù)諸如甲基化,、染色質(zhì)結(jié)構(gòu)等整合分析的方法。


將scRNA-seq數(shù)據(jù)與其它類型,、不同來源的單細胞數(shù)據(jù)整合分析是無法提取到數(shù)據(jù)間的共同特征的,,因為它們不是一個類型的數(shù)據(jù),需要不同的分析方法,。這點在基于基因組的數(shù)據(jù)(如染色質(zhì)可及性與甲基化數(shù)據(jù))與基于基因的數(shù)據(jù)(如基因與蛋白表達數(shù)據(jù))間整合分析尤為明顯,。但如果這些數(shù)據(jù)來自于同一類細胞群,由于存在著共同的生物學狀態(tài),,此時可以聯(lián)立分析以發(fā)現(xiàn)不同數(shù)據(jù)集類型間的對應關(guān)系,。

MATCHER是一種在一維水平上比較不同類型測序數(shù)據(jù)擬時軌跡的方法。簡單來說就是比對不同類型測序數(shù)據(jù)的擬時軌跡,,以確定這些數(shù)據(jù)集間的對應關(guān)系,。這種方法可以識別不同數(shù)據(jù)集間的“等效細胞”而不需預先知道彼此間的對應關(guān)系。開發(fā)者用scM&T- seq(Angermueller, C. et al., 2016)和scRNA-seq數(shù)據(jù)做了驗證,,準確預測了DNA甲基化與基因表達之間的關(guān)系,。


其他sc-seq數(shù)據(jù)不同于scRNA-seq數(shù)據(jù)一樣可以借助Marker解析細胞類型,因此可以利用scRNA-seq解析出的細胞信息為其他sc-seq數(shù)據(jù)分析做參考,。有研究(
Lake, B. B. et al., 2018)對不同腦組織切片進行了單核RNAseq(snRNA-seq)與單細胞轉(zhuǎn)座子超敏性位點測序(scTHS-seq),,通過梯度推進算法利用單細胞基因表達譜指導了染色質(zhì)可及性測序數(shù)據(jù)集的細胞分類:作者首先鑒別出snRNA-seq數(shù)據(jù)集與scTHS-seq數(shù)據(jù)集共有的細胞亞群,訓練一個可以將基因表達與染色質(zhì)可及性數(shù)據(jù)關(guān)聯(lián)的模型,;然后利用該模型去分類scTHS-seq中剩余未被分類的細胞,。這種方法可以更細致地對大腦組織中的細胞進行分類。同樣,,可以整合scATAC-seq數(shù)據(jù)集來分析單細胞DNA甲基化或轉(zhuǎn)座酶染色質(zhì)可及性間的細胞分類。


目前正在開發(fā)的新方法有利用假定等價特征,、或識別在所有類型數(shù)據(jù)中的假定相關(guān)共享特征來進行數(shù)據(jù)交叉模態(tài)分類,。
Welch開發(fā)了一種集成非負矩陣分解(iNMF)的方法,名為LIGER,,可以跨模態(tài)整合數(shù)據(jù),。他們對同一類型皮質(zhì)細胞分別進行了亞硫酸鹽測序(snmC- seq)與scRNA-seq并對其進行了分類。他們假設(shè)基因體甲基化與其表達水平負相關(guān)從而整合了不同模態(tài)測序數(shù)據(jù)進行細胞分類,。在seurat v3.0中,,作者也引入了假定等價特征或關(guān)聯(lián)特征進行多模態(tài)整合數(shù)據(jù)細胞分類的方法,。這些方法優(yōu)點如上所述,即可以利用scRNA-seq的細胞分類信息來指導scATAC-seq數(shù)據(jù)細胞分類,,鑒別出染色質(zhì)可及性與DNA甲基化的細胞特異模塊,。

2.4
空間數(shù)據(jù)與測序數(shù)據(jù)整合

組織中細胞的空間結(jié)構(gòu)常反映出細胞間的功能差異與細胞命運和譜系的差異。不同基因表達引導細胞向不同方向分化,,不同細胞精確排列形成不同組織,。關(guān)鍵是單細胞實驗通常在分析前細胞已被解離,組織原位信息無法保留,,scRNA-seq得到的表達譜不能完全反應細胞空間信息,。具有相似基因表達譜的細胞可能存在于不同的空間位置中,故而細胞分離過程中空間信息的缺失是很多單細胞實驗的主要缺點,。結(jié)合高分辨率基因表達譜與空間表達圖譜 (spatial expression maps) 將細胞空間坐標與基因表達譜聯(lián)系起來,,可以解決這一問題。有兩類方法:計算模型或者RNA原位定量,,可以同時收集到細胞空間坐標與基因表達值,。


FISH方法是原位基因檢驗的金標準,但是它檢測基因數(shù)目較少,。新方法將探針與糾錯碼相結(jié)合,,可以一次性檢測到數(shù)百個基因表達情況,或使用空間條形碼來記錄mRNA逆轉(zhuǎn)錄過程中的空間信息,。這些數(shù)據(jù)集可以通過計算方法進行整合,,同時獲取高通量的空間信息與基因表達信息。


目前計算整合FISH與scRNA-seq數(shù)據(jù)已有相關(guān)文章報道,。這個思路最初由
SatijaAchim提出,,應用于腦組織研究中,后來擴展到其他組織研究中,,為個體本身提供了完整的空間表達圖譜,。該類研究通常關(guān)注關(guān)鍵基因的空間分布,獲取它們的空間表達模式,,并為單個基因建立對應表達模型,,利用這些空間表達模型,將單細胞數(shù)據(jù)mapping到空間信息中,。藉由該方法得到的整合數(shù)據(jù)集,,可以研究幾乎所有基因的空間輪廓,進而研究每種細胞所在區(qū)域情況,。


目前最新的方法可以從該類整合數(shù)據(jù)中系統(tǒng)分析基因空間表達趨勢,。但是該類方法只適用于已有明晰空間結(jié)構(gòu)的組織或個體,如早期胚胎與動物肝臟,;在成熟個體或?qū)嶓w腫瘤應用仍不現(xiàn)實,。一些研究提出了一種粗整合方案:scRNA-seq鑒定細胞簇marker基因后,,用FISH或免疫組化檢測一小部分感興趣基因,將之與scRNA-seq相整合,。但是此類研究較為粗糙,,并未提供系統(tǒng)的解決方案 (Puram, S. V. et al., 2017Pandey, S. et al., 2018),。


近年來,,有兩種高分辨率的空間基因表達測定方法被開發(fā)出來,可以檢測大范圍2D或3D組織內(nèi)單個細胞數(shù)十至數(shù)百基因表達情況(
Wang, X. et al., 2018,;Codeluppi, S. et al., 2018),。這些方法極大降低了組織背景熒光,提高了信噪比,。這兩種方法(osmFISH&STARmap)均可以保有組織原位三維空間信息,。這些方法可以原位獲取許多細胞和基因的精確表達譜,可以在細胞原位進行分子分型,,評估細胞分布環(huán)境,,推斷細胞各類細胞的三維分布,將細胞信息推到解剖學水平上去,??臻g數(shù)據(jù)與scRNA-seq數(shù)據(jù)整合,可以為研究組織構(gòu)成與功能提供全新的手段,。


展望

隨著單細胞技術(shù)日趨成熟,,每個細胞所檢測的測量量與檢測到的細胞和分子數(shù)量都在逐漸增加。因此整合不同實驗得到的不同模態(tài)數(shù)據(jù)成為必然,。目前正在進行的人類細胞圖譜和關(guān)鍵模式生物圖譜是當下最大規(guī)模的多模態(tài)數(shù)據(jù)整合工作,。整合單細胞一系列多模態(tài)數(shù)據(jù),我們可以獲取轉(zhuǎn)錄組之上的細胞圖譜,,洞悉細胞的整體狀態(tài),。分析單細胞多模態(tài)數(shù)據(jù)之間的關(guān)系,可以揭示細胞功能的潛在基礎(chǔ),,推斷各模態(tài)間的因果關(guān)系,。

生物學中有一個主要問題:什么是細胞類型?

解決方案正如那個 老問題:“什么是基因,?” 的答案一般,,該問題是通過跨物種DNA序列比較與多種模式下的生化分析來解答的。故而本問題的答案必是在多種模式與條件下,,對單細胞進行細致分析來回答。

    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多