引言

本系列讲解 空间转录组学 (Spatial Transcriptomics) 相关基础知识与数据分析教程,持续更新,欢迎关注,转发,文末有交流群!
细胞分割
标准的基于成像的空间转录组数据分析流程依赖显微镜染色来估计边界(例如 细胞核 或 细胞膜 ),并将分子读数分配给它们的细胞来源。这些读数可以是离散点(例如分子位置)或连续分布(例如荧光强度);对于后者,需要做出关于汇总的决策(例如 均值 或 中位数 )。由此产生的特征(例如 基因 或 蛋白质 )× 观测值(例如 细胞 或 斑点 )的测量矩阵构成了众多分析任务的基础。
常见算法
基于图像
cellpose 是一种基于深度学习的方法,利用细胞形态学的基于流的表示来识别和描绘跨多种显微镜图像的细胞。它已在包含多种细胞类型的大型数据集上预训练,无需大量参数调整或重新训练即可很好地泛化。凭借用户友好的界面、处理不规则和重叠细胞的能力以及对自动和用户辅助分割的支持, Cellpose 是生物医学成像和定量细胞分析中广泛使用的多功能工具。
混合方法
Baysor 提供 CLI,也可作为 Julia 包使用。它采用基于 Markov random fields (MRFs)的概率方法,并使用 expectation-maximization (EM)进行优化。多种信息——例如荧光染色(例如通过 DAPI 进行的核染色)、来自 scRNA-seq 参考数据的表达谱等——可以作为先验纳入。然而, Baysor 可以仅使用转录本信息(即位置和身份)进行分割;辅助数据已被证明可以提高性能,但为可选。
基于转录本
proseg 可作为 CLI 和 Julia 包使用。它提出了一种完全无监督的概率方法,基于 cellular Potts model (CPM)模拟框架,在该框架中,细胞形态首先使用核染色初始化,然后随机扩展和改变,直到它们最好地解释观察到的转录本空间分布。
商业解决方案
10x Genomics Xenium 提供一种多模态分割算法,该算法基于在多种组织类型和制备方法(新鲜冷冻、 FFPE )的 Xenium 数据上预训练的定制深度学习模型。首先基于 DAPI 染色对细胞核进行分割。
对于每个细胞,然后按以下三种方式之一(按优先级顺序)获得分割结果:(i)细胞表面标记抗体靶向上皮( E-Cadherin )和免疫细胞( CD45 );(ii)核扩展至内部边缘染色( 18S rRNA );以及(iii)核扩展固定距离(自 v2.0 起为 5 μm,此前为 15 μm),或直到遇到另一个边界。

Spatial bleeding
Mitchel 等已对“Spatial bleeding”现象做出清晰刻画:
- bleeding最频繁出现在细胞的上方/下方以及靠近边缘的位置,即在所有物理维度上。
- 由于bleeding发生在相邻细胞之间,观测到的混合信号反映生物学现象(即某些细胞类型可能彼此吸引或排斥——总体如此,或在健康与病变组织区域等不同背景下)。
- 此外,bleeding会影响差异表达(DE),使得被报告为上调/下调的基因可能反映的是微环境的组成差异。
目前,已有若干方法被提出,可在事后修正分割边界和/或单细胞计数,例如:
- FastReseg 是一个 R 包,通过转录本位置检测并纠正分割错误:(i)对细胞进行“分割不准确”评分;(ii)对错误细胞内的转录本进行“误分配”评分;(iii)重新分配位置错误的转录本。
- segger_dev 依赖图神经网络(GNN),节点代表细胞核与转录本,边连接邻近实例,从而让模型从核内与胞质分子的共现关系中学习。
无需分割
ssam 首先通过高斯核的核密度估计(KDE)计算 mRNA 强度分布。这些分布被解析到像素级别,并堆叠成基因表达向量场。所得表征可用于聚类并注释像素,识别组织域(即“细胞”类型组成均一的区域)。
