R中单细胞RNA-seq分析教程 (8)

简介: R中单细胞RNA-seq分析教程 (8)

引言

本系列开启 R 中单细胞RNA-seq数据分析教程,持续更新,欢迎关注,转发!

3. 如何比较不同数据整合方法

当数据集完成整合后,就可以进一步开展多种分析了,这些分析内容包括但不限于第 1 部分提及的细胞聚类、标记识别、细胞聚类重新注释、伪时间分析、分支点分析以及 RNA 速度分析等。此外,还能对同一聚类中不同样本或条件下细胞的差异表达情况进行分析。

不过,在深入研究前,需要确定采用哪种数据整合方法。你可能已经发现,对于这两个示例数据集,没有一种方法是绝对完美的,这在数据整合工作中是很普遍的情况。那该如何评判哪种结果更优呢?其实并无绝对标准。各种方法都有自身的优势和劣势,而且你的具体需求也会因时而异。即便如此,还是有一些通用的参考准则。

  1. 数据整合的目的通常是让不同数据集中的细胞相互混合。除非这些数据集完全不存在共有的细胞类型,否则不同数据集的细胞应该会出现部分或全部混合的情况;
  2. 数据整合的目的并非单纯地让不同数据集的细胞混合,而是要让相同细胞类型或状态的细胞相互融合。一种直观的检验方法是分别查看每个数据集在联合嵌入(如 tSNE 或 UMAP)中细胞类型标记的表达情况。比如,FeaturePlot函数里的cells参数就很有参考价值。
seurat <- readRDS("integrated_seurat.rds")
plot1 <- FeaturePlot(seurat, c("EMX1","DLX2"), ncol=1, pt.size = 0.1)
plot2 <- FeaturePlot(seurat, c("EMX1","DLX2"), ncol=1,
                     cells=colnames(seurat)[seurat$orig.ident == "DS1"], pt.size = 0.1)
plot3 <- FeaturePlot(seurat, c("EMX1","DLX2"), ncol=1,
                     cells=colnames(seurat)[seurat$orig.ident == "DS2"], pt.size = 0.1)
plot1 + plot2 + plot3
AI 代码解读

  1. 你期望在数据整合之后,不同数据集所具有的独特性结构能够被保留下来。比如,当在一个数据集中观察到某种特定的轨迹时,你会希望在完成整合之后,这个轨迹依然能够被发现。一种很直接的验证方式就是在各个单独的数据集以及整合后的整体数据中,分别绘制一些特征图来进行观察。以 Seurat 的整合结果为例来说明这一过程。
plot1 <- FeaturePlot(seurat, c("EMX1","DLX2"), ncol=1, pt.size = 0.1)
plot2 <- FeaturePlot(seurat_DS1, c("EMX1","DLX2"), ncol=1, pt.size = 0.1)
plot3 <- FeaturePlot(seurat_DS2, c("EMX1","DLX2"), ncol=1, pt.size = 0.1)
plot1 + plot2 + plot3
AI 代码解读

需要注意的是,由于数据失真和信息压缩,嵌入时可能会发现原本存在的轨迹似乎断裂。这种情况在 t-SNE 中尤为常见,尤其是在轨迹中间的过渡细胞状态数量较少时。因此,在做出判断时务必谨慎。

  1. 当然,还有许多其他方面和方法可以用于比较。保持开放的心态和创造性思维。

值得一提的是,研究数据整合方法的学者们已经开发了多种指标,旨在以客观和定量的方式评估和比较不同数据整合方法在不同数据集上的表现。这些指标大致可以分为两类,分别关注不同的角度。第一类关注局部水平的混合情况,即评估某个细胞的邻近细胞是否来自不同的数据集。例如 Local Inverse Simpson's Index (LISI),该指标在 Harmony 论文 和基准测试 论文 中都有使用。第二类则关注单个数据集的原始细胞异质性结构,例如检查数据整合后细胞簇的细胞类型纯度。例子包括 Adjusted rand index (ARI),该指标同样在基准测试论文中使用。一个良好的数据整合应该在两者之间找到最佳平衡。

目录
打赏
0
19
18
0
332
分享
相关文章
|
29天前
|
R中单细胞RNA-seq分析教程 (11)
R中单细胞RNA-seq分析教程 (11)
24 0
R中单细胞RNA-seq分析教程 (11)
R中单细胞RNA-seq分析教程 (10)
R中单细胞RNA-seq分析教程 (10)
34 4
R中单细胞RNA-seq分析教程 (7)
R中单细胞RNA-seq分析教程 (7)
83 20
R中单细胞RNA-seq分析教程 (7)
R中单细胞RNA-seq分析教程 (5)
R中单细胞RNA-seq分析教程 (5)
63 13
R中单细胞RNA-seq分析教程 (5)
RNA-seq 差异分析的点点滴滴(3)
RNA-seq 差异分析的点点滴滴(3)
90 27
RNA-seq 差异分析的点点滴滴(3)