Single-cell RNA sequencing of human kidney
人腎臟的單細胞測序
一. 研究背景腎臟是在結構和功能高度復雜的器官,而其結構和功能的復雜性與其眾多的細胞類型相關,。其中腎近端小管細胞(proximal tubular cells,,PT cells)在調節(jié)全身水鈉,酸堿平衡中起著重要作用,。隨著單細胞測序技術(scRNA-seq)的成熟,,對腎臟的單細胞測序研究大量涌現(xiàn),然而這些研究樣本中PT細胞的數(shù)量相對過少而且針對某種特定疾病,,難以對PT細胞再進行分類,。故本文作者希望通過對健康人腎臟細胞進行單細胞測序分析,從單細胞轉錄組信息對腎臟細胞尤其是PT細胞再分類,,并深入研究相關基因表達情況,。 二. 研究思路三. 結果解讀1. 獲取樣本進行單細胞測序作者使用的腎組織樣本來自三個正常人 ,組織經(jīng)過前期處理后使用10X Genomics捕獲腎臟單細胞,,再建庫擴增后使用Hiseq Xten進行測序,。得到了三個腎臟樣本中25404個人腎細胞的轉錄組數(shù)據(jù)用于下游分析。 2. 使用Seurat包對scRNA-seq數(shù)據(jù)進行質量控制,,消除批次效應圖1. 對初始scRNA-seq數(shù)據(jù)進行質量控制 A:將三個樣本的scRNA-seq數(shù)據(jù)整合后,,檢測到的基因數(shù)<200和>2500的細胞被過濾,同時線粒體基因占比>30%的細胞也被過濾(因為理論上占比應該很小),。經(jīng)過質量控制后,,得到了23366個高質量的腎細胞轉錄組數(shù)據(jù)。圖A中從左到右分別是每個細胞檢測到的基因數(shù),,每個細胞檢測到的count數(shù)之和以及測到的線粒體基因所占的比例 B:三個樣本的細胞中線粒體基因所占百分比與mRNA讀數(shù)間的關系(r=-0.08),,以及測到的基因數(shù)與測到的RNA表達量間的關系(r=0.95) C:為了避免不同樣本間批次效應(Batch effect,這里指不同樣本間存在的差異)對后續(xù)分析的影響,,作者使用Harmony包處理scRNA-seq數(shù)據(jù),,矯正了了樣本間的批次效應后,用UMAP法分別將三個樣本的scRNA-seq數(shù)據(jù)降維,??梢钥吹饺齻€樣本的細胞在降維后分布類似,,批次效應幾乎不存在 D:為了排除細胞因處于不同細胞周期帶來的基因表達量的差異,,作者根據(jù)細胞中G1/S期(43個基因)和G2/M期(54個基因)標致基因的最大平均表達量對細胞進行分類,,并給細胞上色??梢钥吹皆诿總€區(qū)域中,,三個時期的細胞隨機分布,并無細胞周期基因表達帶來的差異 E:利用GSE107585的腎臟scRNA-seq數(shù)據(jù)對每個細胞檢測到的基因數(shù)量進行了比較,,結果與作者自己的scRNA-seq數(shù)據(jù)結果接近
3. 對細胞聚類可視化以及標記細胞類型圖2. scRNA-seq揭露腎臟細胞群體的組成
C:以細胞中表達量高度變化的基因作為輸入,,進行主成分分析,隨后選擇20個主成分將所有細胞分成了10類(分類函數(shù)Findcluster()內(nèi)參數(shù)resolution=0.25),。每類細胞所占的比例如圖C所示,,每類細胞中的細胞數(shù)在79-11539之間 B:作者使用UMAP法可視化細胞類別,在找到每類細胞中于其它類別細胞的差異表達基因后,,作者根據(jù)文獻中已有的腎臟各類細胞的特征基因將各類細胞注釋,。1-10分別對應近曲小管細胞,近端小管細胞,,近端直小管細胞,,NK-T細胞,單核細胞,,腎小球頂上皮細胞,,遠端小管細胞,收集管主細胞,,B細胞和收集管插入細胞,。類別1,2和3對應的細胞即為PT細胞,,可以看到PT細胞被分為了三類 D:熱圖展示每類細胞中特征基因的表達情況,,并依據(jù)此識別細胞種類
4. 利用Monocle2包對PT細胞進行細胞軌跡分析圖3. 針對PT細胞的細胞軌跡分析
A:作者用小提琴圖展示了6種PT細胞特征基因在三類PT細胞中的表達情況,cluster1-3分別對應近曲小管細胞,,近端小管細胞和近端直小管細胞 B-E:作者利用Monocle2對PT細胞進行細胞軌跡分析(n=20308),,B-E分別是三種PT細胞的軌跡分布,總體偽時間狀態(tài),,三種狀態(tài)分布以及三個樣本的細胞分布 F:線圖展示對PT細胞分化影響最大的前6個基因,,橫坐標是擬時間,縱坐標是相對表達量,,三種顏色表示圖D中的三種細胞狀態(tài),。可以看到除了GADD45A的的表達量隨擬時間推進下降,,其它5個基因的表達量隨擬時間的推進二上升 G:熱圖展示了對PT細胞分化影響最大的前50個基因在細胞中表達情況,,有相似表達模式的基因被聚類,cluster1,2,,3(藍綠紅)分別表示在分化起始階段,,轉化階段,最終階段高表達的基因
5. 對其它類型細胞的驗證分析圖4. 對其它幾類細胞的驗證 A:圖2.B中的第8(collecting duct principal cells)和第10類(collecting duct intercalated cells)細胞是腎臟集合管細胞,,圖A用小提琴圖展示了4種集合管細胞標志基因在第8和第10類細胞中表達量 B:依舊選前20個主成分進行分類,,但將分類函數(shù)中參數(shù)resolution值改為0.8后,第4類細胞(NK-T細胞)可以被再分為NK細胞和T細胞 C-G:小提琴圖展示5種淋巴細胞特征基因的表達情況,,據(jù)此可以區(qū)分NK(CD3D + CD3E + GNLY + NKG7 +)細胞和T細胞(CD3D + CD3E + IL7R+) 此外,,作者對其它類型的細胞中特征基因的表達量進行了驗證,發(fā)現(xiàn)文獻中指出的各類細胞的特征基因在自己分類的細胞中幾乎都高表達,,故認為本文的腎臟scRNA-seq結果是可靠的
最后我們來總結一下,,本文作者的目的便是提供人類腎臟細胞的轉錄組圖譜。作者先用Seurat包對三個正常腎臟樣本的scRNA-seq數(shù)據(jù)進行質量控制,,Harmony包用于減少批次效應,,排除細胞周期基因帶來的影響。之后對細胞進行分類,,根據(jù)每類細胞的標志基因表達情況將其注釋到每種類型的腎臟細胞,。重點用Monocle2包對PT細胞進行了細胞軌跡分析,其次是每種類型細胞的驗證,。最后得出結論,,即本文所得的scRNA數(shù)據(jù)提供了人腎臟細胞的轉錄組圖譜。本文scRNA-seq數(shù)據(jù)分析流程值得我們學習,。
|