空间单细胞|10x Visium数据分析、可视化与整合(1)

简介: 空间单细胞|10x Visium数据分析、可视化与整合(1)

引言

本文介绍了使用Seurat分析具有空间分辨率的RNA测序数据的方法,重点在于将空间信息与分子数据相结合。将包括以下常见于空间数据分析的任务:

  • 数据标准化
  • 降维和数据聚类
  • 发现空间变异性特征
  • 与单细胞RNA测序数据的整合
  • 处理多个样本切片

首先,将加载Seurat及其所需的其他包以进行本教程的操作。

library(Seurat)
library(SeuratData)
library(ggplot2)
library(patchwork)
library(dplyr)

数据集

本文将介绍一个最新发布的小鼠脑矢状面切片数据集,该数据集是利用Visium v1化学技术生成的。数据集包括两组连续的前脑切片和两组(配对的)后脑切片。

您可以利用Seurat中的Load10X_Spatial()函数将其导入。该函数能够读取spaceranger流程的输出结果,并生成一个包含点级表达数据和相应组织切片图像的Seurat对象。

此外,您还可以通过SeuratData包轻松获取数据,如下面的示例所示。安装完数据集之后,输入命令?stxBrain即可获取更多相关信息。

InstallData("stxBrain")

brain <- LoadData("stxBrain", type = "anterior1")

数据预处理

对基因表达数据的初步处理过程与一般的单细胞RNA测序实验相仿。首先,需要对数据进行标准化处理,以校正不同数据点之间测序深度的差异。发现,空间数据集在分子计数或点上的变异可能非常显著,尤其是当组织中的细胞密度不同时。在这里观察到了显著的异质性,这就需要进行有效的数据标准化。

plot1 <- VlnPlot(brain, features = "nCount_Spatial", pt.size = 0.1) + NoLegend()
plot2 <- SpatialFeaturePlot(brain, features = "nCount_Spatial") + theme(legend.position = "right")
wrap_plots(plot1, plot2)

这些图表证明了分子计数的变异不单纯是技术层面的问题,还与组织结构有关。例如,组织中神经元较少的区域(如大脑皮层的白质部分),通常会显示出较低的分子计数。因此,一些常规方法(如LogNormalize()函数),它们要求每个数据点在标准化后具有相同的“基数”,可能会引起问题。

建议改用sctransform方法(Hafemeister和Satija,2019年发表于《基因组生物学》),这种方法通过建立基因表达的正则化负二项模型,旨在消除技术误差,同时保留生物学上的变异。sctransform能够对数据进行标准化处理,识别变异性大的特征,并将这些数据保存在SCT检测项中。

brain <- SCTransform(brain, assay = "Spatial", verbose = FALSE)

基因表达可视化

Seurat的SpatialFeaturePlot()函数是对FeaturePlot()的一个扩展,它允许在组织学图像上叠加分子层面的数据。例如,在小鼠大脑的这个数据集中,Hpca基因是海马区的一个强烈指示标志,而Ttr基因则是脉络丛的标志。

SpatialFeaturePlot(brain, features = c("Hpca", "Ttr"))

library(ggplot2)
plot <- SpatialFeaturePlot(brain, features = c("Ttr")) + theme(legend.text = element_text(size = 0),
    legend.title = element_text(size = 20), legend.key.size = unit(1, "cm"))
jpeg(filename = "../output/images/spatial_vignette_ttr.jpg", height = 700, width = 1200, quality = 50)
print(plot)
dev.off()

## agg_png 
##       2

在Seurat中,默认设置更侧重于分子数据的可视化效果。不过,您可以通过调整一些参数来改变点的尺寸(和透明度),从而提升组织学图像的可视性:

  • pt.size.factor 参数用于调整点的尺寸大小,其默认值为1.6。
  • alpha 参数用来设置点的透明度范围,其默认值是c(1, 1),即完全不透明到完全透明。

您可以尝试将alpha参数设置为c(0.1, 1),这样可以降低那些表达量较低的点的透明度,使得可视化效果更加突出。

p1 <- SpatialFeaturePlot(brain, features = "Ttr", pt.size.factor = 1)
p2 <- SpatialFeaturePlot(brain, features = "Ttr", alpha = c(0.1, 1))
p1 + p2

相关文章
|
2月前
|
数据采集 数据可视化 数据挖掘
基于Python的数据分析与可视化实战
本文将引导读者通过Python进行数据分析和可视化,从基础的数据操作到高级的数据可视化技巧。我们将使用Pandas库处理数据,并利用Matplotlib和Seaborn库创建直观的图表。文章不仅提供代码示例,还将解释每个步骤的重要性和目的,帮助读者理解背后的逻辑。无论你是初学者还是有一定基础的开发者,这篇文章都将为你提供有价值的见解和技能。
207 0
|
27天前
|
存储 数据可视化 数据挖掘
使用Python进行数据分析和可视化
本文将引导你理解如何使用Python进行数据分析和可视化。我们将从基础的数据结构开始,逐步深入到数据处理和分析的方法,最后通过实际的代码示例来展示如何创建直观的数据可视化。无论你是初学者还是有经验的开发者,这篇文章都将为你提供有价值的见解和技巧。让我们一起探索数据的世界,发现隐藏在数字背后的故事!
|
1月前
|
机器学习/深度学习 数据可视化 数据挖掘
使用Python进行数据分析和可视化
【10月更文挑战第42天】本文将介绍如何使用Python进行数据分析和可视化。我们将从数据导入、清洗、探索性分析、建模预测,以及结果的可视化展示等方面展开讲解。通过这篇文章,你将了解到Python在数据处理和分析中的强大功能,以及如何利用这些工具来提升你的工作效率。
|
1月前
|
数据采集 数据可视化 数据挖掘
使用Python进行数据分析和可视化
【10月更文挑战第33天】本文将介绍如何使用Python编程语言进行数据分析和可视化。我们将从数据清洗开始,然后进行数据探索性分析,最后使用matplotlib和seaborn库进行数据可视化。通过阅读本文,你将学会如何运用Python进行数据处理和可视化展示。
|
2月前
|
数据采集 数据可视化 数据挖掘
使用Python进行数据处理与可视化——以气温数据分析为例
【10月更文挑战第12天】使用Python进行数据处理与可视化——以气温数据分析为例
329 0
|
2月前
|
数据采集 数据可视化 数据挖掘
Python 数据分析实战:使用 Pandas 进行数据清洗与可视化
【10月更文挑战第3天】Python 数据分析实战:使用 Pandas 进行数据清洗与可视化
142 0
|
2月前
|
机器学习/深度学习 数据采集 数据可视化
如何理解数据分析及数据的预处理,分析建模,可视化
如何理解数据分析及数据的预处理,分析建模,可视化
63 0
|
24天前
|
机器学习/深度学习 算法 数据挖掘
数据分析的 10 个最佳 Python 库
数据分析的 10 个最佳 Python 库
72 4
数据分析的 10 个最佳 Python 库
|
4月前
|
数据采集 数据可视化 数据挖掘
数据分析大神养成记:Python+Pandas+Matplotlib助你飞跃!
在数字化时代,数据分析至关重要,而Python凭借其强大的数据处理能力和丰富的库支持,已成为该领域的首选工具。Python作为基石,提供简洁语法和全面功能,适用于从数据预处理到高级分析的各种任务。Pandas库则像是神兵利器,其DataFrame结构让表格型数据的处理变得简单高效,支持数据的增删改查及复杂变换。配合Matplotlib这一数据可视化的魔法棒,能以直观图表展现数据分析结果。掌握这三大神器,你也能成为数据分析领域的高手!
91 2
|
4月前
|
机器学习/深度学习 数据采集 数据可视化
基于爬虫和机器学习的招聘数据分析与可视化系统,python django框架,前端bootstrap,机器学习有八种带有可视化大屏和后台
本文介绍了一个基于Python Django框架和Bootstrap前端技术,集成了机器学习算法和数据可视化的招聘数据分析与可视化系统,该系统通过爬虫技术获取职位信息,并使用多种机器学习模型进行薪资预测、职位匹配和趋势分析,提供了一个直观的可视化大屏和后台管理系统,以优化招聘策略并提升决策质量。
215 4
下一篇
DataWorks