单细胞分析|在 Seurat 中使用 sctransform

简介: 单细胞分析|在 Seurat 中使用 sctransform

单细胞 RNA-seq 数据的生物异质性常常受到测序深度等技术因素的影响。每个细胞中检测到的分子数量在细胞之间可能存在显着差异,即使在同一细胞类型内也是如此。 scRNA-seq 数据的解释需要有效的预处理和标准化,以消除这种技术变异性。

本文介绍了一个建模框架,用于对 scRNA-seq 实验中的分子计数数据进行标准化和方差稳定。该过程省略了对启发式步骤的需要,包括伪计数加法或对数转换,并改进了常见的下游分析任务,例如降维和差异表达。我们将此方法命名为 sctransform。

library(Seurat)
library(ggplot2)
library(sctransform)

加载数据并创建 Seurat 对象

pbmc_data <- Read10X(data.dir = "/brahms/shared/vignette-data/pbmc3k/filtered_gene_bc_matrices/hg19/")
pbmc <- CreateSeuratObject(counts = pbmc_data)

应用 sctransform 标准化

# store mitochondrial percentage in object meta data
pbmc <- PercentageFeatureSet(pbmc, pattern = "^MT-", col.name = "percent.mt")

# run sctransform
pbmc <- SCTransform(pbmc, vars.to.regress = "percent.mt", verbose = FALSE)

使用 PCA 和 UMAP 降维

# These are now standard steps in the Seurat workflow for visualization and clustering
pbmc <- RunPCA(pbmc, verbose = FALSE)
pbmc <- RunUMAP(pbmc, dims = 1:30, verbose = FALSE)

pbmc <- FindNeighbors(pbmc, dims = 1:30, verbose = FALSE)
pbmc <- FindClusters(pbmc, verbose = FALSE)
DimPlot(pbmc, label = TRUE)

用户可以根据规范标记单独注释cluster。然而,与标准 Seurat 工作流程相比,sctransform 标准化在以下几个方面揭示了更明显的生物学差异:

  • 基于 CD8A、GZMK、CCL5、CCR7 表达,清晰分离至少 3 个 CD8 T 细胞群(初始细胞、记忆细胞、效应细胞)
  • 基于 S100A4、CCR7、IL32 和 ISG15 清晰分离三种 CD4 T 细胞群(初始细胞、记忆细胞、IFN 激活细胞)
  • B 细胞簇中的其他发育子结构,基于 TCL1A、FCER2
  • 基于 XCL1 和 FCGR3A 将 NK 细胞进一步分离为 CD56dim 与 Bright 簇
# These are now standard steps in the Seurat workflow for visualization and clustering
# Visualize canonical marker genes as violin plots.
VlnPlot(pbmc, features = c("CD8A", "GZMK", "CCL5", "S100A4", "ANXA1", "CCR7", "ISG15", "CD3D"),
    pt.size = 0.2, ncol = 4)

# Visualize canonical marker genes on the sctransform embedding.
FeaturePlot(pbmc, features = c("CD8A", "GZMK", "CCL5", "S100A4", "ANXA1", "CCR7"), pt.size = 0.2,
    ncol = 3)

FeaturePlot(pbmc, features = c("CD3D", "ISG15", "TCL1A", "FCER2", "XCL1", "FCGR3A"), pt.size = 0.2,
    ncol = 3)

相关文章
|
2月前
|
存储 编解码 数据可视化
单细胞分析|Seurat中的跨模态整合
在单细胞基因组学中,新方法“桥接整合”允许将scATAC-seq、scDNAme等技术的数据映射到基于scRNA-seq的参考数据集,借助多组学数据作为桥梁。研究展示了如何将scATAC-seq数据集映射到人类PBMC的scRNA-seq参考,使用10x Genomics的多组学数据集。Azimuth ATAC工具提供了自动化的工作流程,支持在R和网页平台上执行桥接整合。通过加载和预处理不同数据集,映射scATAC-seq数据并进行评估,证明了映射的准确性和细胞类型预测的可靠性。此方法扩展了参考映射框架,促进了不同技术间的互操作性。
47 5
|
机器学习/深度学习 自动驾驶 计算机视觉
目标检测落地必备Trick | 结构化知识蒸馏让RetinaNet再涨4个点
目标检测落地必备Trick | 结构化知识蒸馏让RetinaNet再涨4个点
307 0
|
数据挖掘
Seurat 4.0 | 单细胞转录组数据整合(scRNA-seq integration)
Seurat 4.0 | 单细胞转录组数据整合(scRNA-seq integration)
1540 0
Seurat 4.0 | 单细胞转录组数据整合(scRNA-seq integration)
|
10天前
|
存储 编解码 数据可视化
单细胞空间|在Seurat中对基于图像的空间数据进行分析(1)
单细胞空间|在Seurat中对基于图像的空间数据进行分析(1)
20 5
|
2月前
|
数据可视化 数据挖掘 索引
R语言层次聚类、多维缩放MDS分类RNA测序(RNA-seq)乳腺发育基因数据可视化|附数据代码2
R语言层次聚类、多维缩放MDS分类RNA测序(RNA-seq)乳腺发育基因数据可视化|附数据代码
|
2月前
|
存储 数据可视化 数据挖掘
R语言层次聚类、多维缩放MDS分类RNA测序(RNA-seq)乳腺发育基因数据可视化|附数据代码1
R语言层次聚类、多维缩放MDS分类RNA测序(RNA-seq)乳腺发育基因数据可视化|附数据代码
|
2月前
|
SQL 数据可视化 算法
单细胞Seurat - 降维与细胞标记(4)
单细胞Seurat - 降维与细胞标记(4)
52 2
|
2月前
|
存储 数据可视化 数据挖掘
单细胞分析|将 Seurat 与多模态数据结合使用
单细胞分析|将 Seurat 与多模态数据结合使用
31 0
|
2月前
|
存储 数据可视化 数据处理
单细胞Seurat - 数据处理 (2)
单细胞Seurat - 数据处理 (2)
104 1
|
2月前
|
编解码 算法 数据挖掘
单细胞Seurat - 细胞聚类(3)
单细胞Seurat - 细胞聚类(3)
33 0