空间转录组: Visium HD 数据集分析 (1)

简介: 空间转录组: Visium HD 数据集分析 (1)

引言

本系列讲解 空间转录组学 (Spatial Transcriptomics) 相关基础知识与数据分析教程,持续更新,欢迎关注,转发,文末有交流群

简介

Visium HD 是由 10x Genomics 开发的下一代空间转录组技术,旨在为整个组织切片提供单细胞分辨率的空间基因表达数据。

自 2024 年起商业化,Visium HD 将该平台的分辨率从 55 µm 点推进到亚细胞分辨率(2 µm)的 bins。

在此工作流程中,我们将使用结直肠癌的 Visium HD 数据集演示常见的分析步骤。

依赖

library(Banksy)
library(BiocParallel)
library(dplyr)
library(DropletUtils)
library(ggplot2)
library(ggspavis)
library(igraph)
library(magick)
library(OSTA.data)
library(patchwork)
library(pheatmap)
library(scater)
library(scran)
library(scuttle)
library(sf)
library(spacexr)
library(SpatialExperiment)
library(SpotSweeper)
library(Statial)
library(tidyr)
library(VisiumIO)

数据集

在本演示中,我们对 16 µm 的 bins 进行去卷积,并将其与 10x Genomics 提供的 8 µm bins 的结果进行一致性比较。

# retrieve dataset from OSF repo
id <- "VisiumHD_HumanColon_Oliveira"
pa <- OSTA.data_load(id)
dir.create(td <- tempfile())
unzip(pa, exdir=td)
# read 8um bins into 'SpatialExperiment'
vhd8 <- TENxVisiumHD(
    spacerangerOut=td, 
    processing="filtered",
    format="h5", 
    images="lowres", 
    bin_size="008") |>
    import()
# use gene symbols as feature names
gs <- rowData(vhd8)$Symbol
rownames(vhd8) <- make.unique(gs)
vhd8

这些数据附带由 spacexr 中实现的 RCTD去卷积估算得到的 bin 级注释。具体而言,提供两组标签,分别对应每个 bin 内 38 种细胞类型中出现频率最高和第二高的类型:

# retrieve annotations
gz <- "binned_outputs/square_008um/deconvolution.csv.gz"
df <- read.csv(file.path(td, gz), row.names=2)
head(df <- df[complete.cases(df), -1])

# keep only annotated bins
vhd8 <- vhd8[, rownames(df)]
names(df) <- c("DeconClass", "DeconLabel1", "DeconLabel2")
colData(vhd8)[names(df)] <- df

lab <- grep("Label", names(cd <- colData(vhd8)), value=TRUE)
pal <- hcl.colors(length(unique(unlist(cd[lab]))), "Spectral")
lapply(lab, \(.) {
  plotCoords(vhd8, annotate=., point_size=0.2, point_shape = 15) + ggtitle(.)
}) |>
  wrap_plots(nrow=1, guides="collect") &
  scale_color_manual(NULL, values=pal) &
  theme(legend.key.size=unit(0, "lines"))

具有 16 µm bin 的 VisiumHD 的另一种分辨率可以如下读取:

# read 16um bins into 'SpatialExperiment'
vhd16 <- TENxVisiumHD(
    spacerangerOut=td,
    processing="filtered",
    format="h5",
    images="lowres",
    bin_size="016") |>
    import()
# use symbols as feature names
gs <- rowData(vhd16)$Symbol
rownames(vhd16) <- make.unique(gs)
vhd16

Space Ranger 生成的聚类结果适用于两种分辨率。

csv <- list.files(td, "clustering.csv.gz", recursive=TRUE, full.names=TRUE)
dfs <- lapply(csv, read.csv, row.names="barcode") 

colData(vhd8)$cluster <- factor(dfs[[1]][colnames(vhd8), "cluster"])
colData(vhd16)$cluster <- factor(dfs[[2]][colnames(vhd16), "cluster"])

我们可以在 8 µm 和 16 µm 分辨率下可视化给定的聚类结果。稍后,我们将比较 16 µm 处的聚类结果与 Banksy 的聚类结果。

(plotCoords(vhd8, 
    annotate="cluster", point_size=0.05, point_shape=15,
    pal=unname(pals::kelly())) + ggtitle("8 µm")) |
(plotCoords(vhd16[, !is.na(vhd16$cluster)], 
    annotate="cluster", point_size=0.1, point_shape=15, 
    pal=unname(pals::kelly())) + ggtitle("16 µm"))

为保持运行时间较短,我们的下游分析将仅在 16 µm bins 的一个子区域(占数据覆盖面积的 1/64)上进行,我们在此读取该子区域;

.rng <- \(spe) {
    xy <- spatialCoords(spe)*scaleFactors(spe)
    xs <- range(xy[, 1]); ys <- nrow(imgRaster(spe))-range(xy[, 2])
    x1 <- xs[1] + 4*(xs[2]-xs[1])/8; x2 <- xs[2] - 3*(xs[2]-xs[1])/8
    y1 <- ys[1] + 3*(ys[2]-ys[1])/8; y2 <- ys[2] - 4*(ys[2]-ys[1])/8
    list(box=c(x1, x2, y1, y2), cov=c(xs, ys))
}
vhd8r <- .rng(vhd8)
# vhd16r <- .rng(vhd16) 
# use 8um bounding boxes to subset spes at both resolutions; 
# it is similar to 16um's box range 
.box <- \(roi, lty, lwd, col) {
    geom_rect(
        xmin=vhd8r[[roi]][1], xmax=vhd8r[[roi]][2], 
        ymin=vhd8r[[roi]][3], ymax=vhd8r[[roi]][4],
        col=col, fill=NA, linetype=lty, linewidth=lwd)
}
cov <- .box(roi="cov", lty=2, lwd=1/2, col="grey")
box <- .box(roi="box", lty=4, lwd=2/3, col="black")
# plotting
.lim <- \(spe) list(
    xlim(spe[["box"]][c(1, 2)]),
    ylim(spe[["box"]][c(4, 3)]))

plotVisium(vhd8, spots=FALSE, point_shape=22) + cov + box +
    ggtitle("grey: data coverage\n black: zoomed region") + 
plotVisium(vhd8, point_size=0.8, zoom=TRUE, point_shape=22) + .lim(vhd8r) +
    ggtitle("8 µm bins in black box") + 
plotVisium(vhd16, point_size=1.6, zoom=TRUE, point_shape=22) + .lim(vhd8r) +
    ggtitle("16 µm bins in black box") + 
plot_layout(nrow=1, widths=c(1.5, 1, 1)) & facet_null() &
    theme(plot.title=element_text(hjust=0.5, vjust=0.5))

相关文章
|
5月前
|
移动开发 编解码 数据挖掘
空间转录组:从R导入数据
空间转录组:从R导入数据
空间转录组:从R导入数据
|
2月前
|
设计模式 算法 搜索推荐
Java 设计模式之策略模式:灵活切换算法的艺术
策略模式通过封装不同算法并实现灵活切换,将算法与使用解耦。以支付为例,微信、支付宝等支付方式作为独立策略,购物车根据选择调用对应支付逻辑,提升代码可维护性与扩展性,避免冗长条件判断,符合开闭原则。
405 35
|
1月前
|
数据可视化 数据挖掘 容器
空间转录组: Visium HD 数据集分析 (2)
空间转录组: Visium HD 数据集分析 (2)
|
存储 Cloud Native 数据库
云原生之使用docker部署ZPan个人网盘系统
云原生之使用docker部署ZPan个人网盘系统
551 2
云原生之使用docker部署ZPan个人网盘系统
|
1月前
|
机器学习/深度学习 人工智能 监控
番茄叶片病害检测数据集(千张图片已划分)| AI训练适用于目标检测任务
在农业领域,植物病害检测是确保作物健康和提高农业生产效率的关键任务之一。随着计算机视觉技术的快速发展,基于深度学习的目标检测方法成为了病害识别的主流手段。为此,专门针对番茄叶片病害检测任务,我们推出了一个经过精心设计的番茄叶片病害检测数据集。该数据集包含了10,853张带标签的图像,覆盖了10种常见的番茄叶片病害类型,支持YOLO等先进的目标检测模型训练,旨在帮助研究人员和开发者提高农作物病害自动化检测的能力。
381 40
番茄叶片病害检测数据集(千张图片已划分)| AI训练适用于目标检测任务
|
4天前
|
Java 关系型数据库 数据库连接
在Spring Boot + MyBatis项目中实现MySQL读写分离
在Spring Boot和MyBatis项目中实现MySQL读写分离,主要有两种思路:一种是在应用层通过代码和配置手动控制,另一种是借助中间件自动路由。
47 6
|
1月前
|
JSON 前端开发 文件存储
开源项目,全网音乐免费听,太牛逼啦,XiaoMusic 无限点歌机~~~~
XiaoMusic 是一款开源的小爱音箱音乐增强工具,支持全网音乐免费听。通过 NAS 或电脑部署,结合 yt-dlp 下载与本地音乐管理,实现语音点歌、搜索播放、多设备控制,让小爱变身家庭音乐中枢。
838 2
|
5天前
|
运维 监控 数据可视化
2025年一站式测试平台对比:可视化报告与自动化监控最佳实践
2025年一站式测试平台向可视化报告与自动化监控深度整合发展。文章介绍其核心价值、行业趋势,分析全栈整合型和垂直工具链型两类主流解决方案的优劣势,还给出企业落地最佳实践与常见问题解答,助力企业根据自身情况选择适配方案。
|
5天前
|
人工智能 运维 测试技术
2025年高并发系统全链路压测平台对比与瓶颈定位最佳实践
文章聚焦2025年高并发系统全链路压测,介绍主流方案分SaaS化与私有化两类,对比两者优劣。阐述瓶颈定位靠分布式追踪等技术,分享电商、金融场景实践案例。还解答方案选择、核心差异、瓶颈定位关键及避免影响生产环境等问题,提供全链路压测全面指导。
|
2月前
|
人工智能 自然语言处理 算法
AISEO咋做?2025年用AI优化SEO和GEO 的步骤
AISEO是AI与SEO结合的优化技术,通过人工智能生成关键词、标题、内容等,提升网站排名。它支持多语言、自动化创作,并利用高权重平台发布内容,让AI搜索更易抓取引用,实现品牌曝光与流量增长。