玩ST、肿瘤研究的来学习一下!16分Nature子刊的单细胞空间转录组+机器学习

简介: Nature Communications 发表了一项关于空间转录组和机器学习在肿瘤研究中的应用。研究聚焦于HPV阴性口腔鳞状细胞癌,通过整合单细胞和空间转录组分析,揭示了肿瘤核心(TC)和前沿边缘(LE)的独特转录特征。TC和LE的基因表达模式与多种癌症的预后相关,其中LE基因标志关联不良预后,而TC则与较好预后相关。利用机器学习,研究人员建立了预测模型,识别出跨癌症类型的保守TC和LE特征。此外,他们还分析了RNA剪接动态,发现了潜在的治疗脆弱性。这项工作为肿瘤生物学和靶向治疗提供了新见解,并为药物开发提供了依据。

今天给大家分享一篇IF=16.6的空间转录组+机器学习的文章,于2023年8月发表在Nature Communications上:Spatial transcriptomics reveals distinct and conserved tumor core and edge architectures that predict survival and targeted therapy response,空间转录组基于独特且保守的肿瘤中心和边缘结构预测生存和靶向治疗反应


image.png

摘要

研究者发现,肿瘤微环境的空间组织对生物学和治疗反应有深远的影响。他们对HPV阴性的口腔鳞状细胞癌(OSCC)进行了整合的单细胞和空间转录组分析,全面地描述了肿瘤核心(TC)和前沿边缘(LE)的转录架构中的恶性细胞。

他们证明了TC和LE具有独特的转录特征、邻近的细胞组成以及配体-受体相互作用。该团队进一步揭示,与LE相关的基因表达模式在不同的癌症中是保守的,而TC则是组织特异的,强调了肿瘤进展和侵袭背后的共同机制。此外,他们发现与LE相关的基因标志与多种癌症的较差的临床预后相关,而与TC相关的基因标志则与更好的预后有关。

最终,通过计算建模方法,他们描述了与药物反应预测性相关的OSCC中的细胞发展的空间调控模式。该团队的工作为TC和LE的生物学提供了全癌症的见解,并提供了交互式的空间图谱,为开发新的靶向治疗方法奠定了基础。

结果

image.png

图 1 | 对OSCC患者样本进行ST分析和细胞去卷积的实验设计概述

  • a. 示意图表示患者临床数据和样本获取与处理策略。来自所有12个空间分析样本的24,876个点的UMAP投影,根据其颜色进行着色。使用BioRender创建。
  • b. 病理切片注释
  • c. 基于Puram等人的scRNA-seq数据的头颈SCC单细胞去卷积。
  • d. 每个点的CNV概率。
  • e. 恶性点状态。
  • f. 基于去卷积和CNV概率的点注释。
    HPV 人乳头瘤病毒,OSCC 口腔鳞状细胞癌,SCC 鳞状细胞癌,Tregs T调节细胞。

image.png

图 2 | 在OSCC微环境中,TC和LE是空间上独特的区域

  • a. 来自所有12个空间剖析样本的13,950个恶性点的UMAP投影,通过Louvain聚类进行划分,并伴随一个系统发育树,展示了簇的转录组相似性。
  • b. 来自所有12个空间剖析样本的13,950个恶性点的UMAP投影,被划分为三个主要的节点聚类,伴随一个热图展示每个聚类前5个差异表达基因的log2(FC)。
  • c. Nebulosa核密度图,展示了文献验证的OSCC肿瘤核心和前沿标记的基因表达。
  • d. 样本1、2和9的TC注释和LE注释。
  • e. 所有空间剖析样本中TC和LE注释的全转录组Pearson相关性热图。样本根据转录组相似性进行排序。
  • f. Ingenuity路径分析热图,展示了TC和LE途径的预测激活和停用。只有在10个或更多的样本中被激活或停用的途径才会被显示,并根据每个样本中途径的z-分数相似性进行排序。
  • g. Consensus图显示了在超过9个样本中,TC和LE之间显著差异表达的前25个基因的累积平均logFC(调整后的p值 < 0.001,双侧Wilcox秩和检验,Bonferroni校正)。相关的原始数据提供在一个原始数据文件中。UMAP表示均匀流形近似投影,OSCC表示口腔鳞状细胞癌。

image.png

图 3 | TC和LE的癌细胞状态是具有独特配体-受体相互作用的不同实体

  • a. 在TC、LE和其他鳞状细胞癌(SCC)的点上对CSC基因签名的比较表达,用Nebulosa核密度图进行可视化。为了空间参考,提供了TC、LE和临时癌点注释的UMAP。圆圈代表平均值,线代表标准差(n = 12个样本,来自10个独立的患者)。
  • b. Liu等人描述的上皮(eCSC)和间充质癌干细胞(mCSC)标记物的示意表示。
  • c、d. 在TC、LE和其他SCC点上mCSCs(p值 = 2e−04)和eCSC(p值 = 1.5e−06)基因集的比较表达,用nebulosa核密度图可视化mCSCs和eCSC标记。圆圈代表平均值,线代表标准差(n = 12个生物学独立的样本)。
  • e. 通过整体信息流在TC和LE点上对富集的信号通路进行可视化的堆叠条形图。通路按其在TC或LE中的主导性进行着色。
  • f. 描述TC中的癌细胞之间、g. LE中的癌细胞之间、以及h. LE中的ecm-myCAF和癌细胞之间的细胞-细胞相互作用中涉及的空间解卷积的配体-受体对的Circos图。连接带的宽度表示配体-受体相互作用的强度。
  • i. 表示直接邻接于TC和LE点的非癌点数量的比较箱线图。非癌点的身份是基于最富集的非癌细胞类型解卷积确定的。使用Benjamini-Hochberg FDR校正的双侧Wilcoxon秩和检验比较了组。p < 0.05, p < 0.01, p < 0.001, ***p < 0.0001。Cytoxic CD8 T细胞的P值 = 0.003, ecm.myCAF = 2.2e−04, 中间纤维细胞 = 0.002, 巨噬细胞 = 0.008 (n = 12个样本,来自10个独立的患者)。

缩写:CSC 癌干细胞, TC 肿瘤核心, LE 前沿, MET 间充质-上皮转化, EMT 上皮-间充质转化, CD24(−) 逆CD24基因表达(1/CD24),Tregs T调节细胞。

image.png

图 4 | 机器学习模型在多种癌症类型中识别出保守的TC和LE特征

  • a. 描述用于在公开可用的空间分布样本中识别TC和LE基因特征的机器学习策略的信息图。
  • b. 描述随后包括在机器学习训练数据集中的公开可用的空间分布样本的信息图。用BioRender创建。
  • c. 在TC、LE、临时和其他区域中绘制的概率分布。
  • d. 条形图显示了30个不同的空间分布样本中每个空间不同区域的scPred分类得分。该图是基于TC、LE、临时和其他区域的预测比例的相似性进行聚类的。
  • e-h. H&E染色的组织切片(左图)、染色组织上的scPred投影(中图)以及按scPred分类着色的UMAP(右图)代表cSCC、COAD和CESC的空间转录组测试数据集。

UMAP 均匀流形逼近投影,cSCC 皮肤鳞状细胞癌,SCC 鳞状细胞癌,ICC 肝内胆管癌,PRAD 前列腺腺癌,PDAC 胰腺导管癌,CESC 宫颈鳞状细胞癌,COAD 结肠腺癌,IDC 侵袭性导管癌,HCC 肝细胞癌,SKCM 皮肤黑色素瘤,ILC 侵袭性小叶癌,EC 子宫腺癌,CHC 组合性肝细胞和胆管癌,GBM 多形性胶质母细胞瘤,CNS 胚胎中枢神经系统肿瘤,MB 髓母细胞瘤。

image.png

图 5 | TC和LE特征的生存相关性和预后特征

  • a. 描述TC和LE单样本基因组得分策略在TCGA转录组数据的信息图。
  • b. 根据275个OSCC样本中的TC(上图)和LE(下图)基因组富集得分,展示OS、DSS和PFI终点的Kaplan–Meier可视化。显示的P值是使用cox比例风险回归计算的。
  • c、d. 来自TCGA的20种常见癌症类型的TC和LE基因组富集得分的OS和DSS全癌症结果。显示的P值和风险比是使用cox比例风险回归计算的。
  • e、f. 条形图显示相对于相关的临床-病理变量的TC和LE富集得分。显著性是使用双侧Wilcoxon秩和检验确定的,应用了Benjamini–Hochberg FDR修正。误差线代表均值的标准误差(SEM)。p < 0.05, p < 0.01, p < 0.001, ***p < 0.0001。P值对于高级N期= 0.018,LVI = 0.002,III级= 1.8e−06,阳性切缘= 0.02,ECS = 0.002 (n = 275个生物学独立的HPV阴性OSCC样本)。

缩写:TC 肿瘤核心,LE 领先边缘,以及其他癌症类型的缩写。

image.png

图 6 | RNA剪接动态分析揭示了TC和LE的不同发展轨迹和治疗脆弱性

  • a. 空间解卷积的癌细胞斑点的UMAP,上面覆盖了基于TC、过渡期和LE注释的颜色的RNA速度流,以及UMAP图与覆盖的RNA速度置信度。
  • b. 代表性的空间分析样本(样本2和5)与RNA速度流覆盖并按TC和LE癌细胞注释着色。
  • c. 条形图可视化了TC和LE区域内顶部差异剪接的基因(具有动态剪接行为的基因)。条形图由存在于其在TC或LE中的剪接形式的较高比例的基因着色。
  • d. 显示剪接和未剪接RNA的比率的相位肖像,为顶部差异剪接的基因,紫色线描绘预测的剪接稳态。
  • e. 由矢量场整合推断的TC、过渡期和LE注释的细胞命运转变概率状态图。
  • f. 描述用于系统收集药物反应数据和测试计算机内药物干扰的策略的信息图。使用BioRender创建。
  • g. 高AAC药物中富集的细胞命运转变的信息图状态图。
  • h. 盒形图比较基于中位数分层的高AAC和低AAC药物之间的边缘外向矢量场强度。使用双侧Wilcoxon秩和检验比较AAC分组(n = 70个独立药物)。

缩写:AAC 曲线上方面积。

要点

  • 难吗?难,啃了好几天。有用吗?真的有用,格局打开。
  • HPV阴性口腔鳞状细胞癌,选题☑️
  • 通篇是:单细胞+空间转录组分析了TC区和LE区转录特征,癌细胞特异配体-受体相互作用,机器学习模型鉴定了多种癌症中的TC和LE特征,TCGA分析TC和LE基因组与多种癌症的临床预后之间的关系,最后用轨迹分析探讨了可能的药物治疗靶点。
  • 本篇对于新手来说研究套用/复现难,进阶选手可以挑战,其细胞通讯、预后标志物和药物响应模型对于药企/研究院作为肿瘤靶向药物研发有一定的借鉴作用,其次这种研究思路也是值得学习的。


目录
相关文章
|
2月前
|
机器学习/深度学习 算法 数据可视化
可解释性机器学习:基于随机森林和Ceteris-paribus的乳腺癌早期诊断研究
可解释性机器学习:基于随机森林和Ceteris-paribus的乳腺癌早期诊断研究
58 1
|
3月前
|
机器学习/深度学习 算法 数据可视化
计算机视觉+深度学习+机器学习+opencv+目标检测跟踪+一站式学习(代码+视频+PPT)-2
计算机视觉+深度学习+机器学习+opencv+目标检测跟踪+一站式学习(代码+视频+PPT)
100 0
|
3月前
|
机器学习/深度学习 Ubuntu Linux
计算机视觉+深度学习+机器学习+opencv+目标检测跟踪+一站式学习(代码+视频+PPT)-1
计算机视觉+深度学习+机器学习+opencv+目标检测跟踪+一站式学习(代码+视频+PPT)
56 1
|
6天前
|
机器学习/深度学习 数据挖掘 数据中心
利用机器学习优化数据中心能效的策略研究
【4月更文挑战第24天】在数据中心管理和运营中,能效优化是一个长期存在的挑战,它直接关系到成本控制和环境影响的减轻。随着人工智能技术的不断进步,特别是机器学习(ML)方法的广泛应用,为解决数据中心能效问题提供了新的途径。本文旨在探讨如何通过机器学习技术对数据中心的能源消耗进行建模、预测和优化,以实现更高的能效。我们首先分析了数据中心能耗的主要组成部分,然后提出了一种基于机器学习的能效优化框架,并详细阐述了关键技术和方法。最后,通过实验验证了所提出策略的有效性,并讨论了未来的研究方向。
|
11天前
|
机器学习/深度学习 运维 监控
利用机器学习优化数据中心能效的研究
【4月更文挑战第19天】在数据中心的运营成本中,能源消耗占据了显著比例。随着能源价格的不断攀升与环境保护意识的加强,如何降低数据中心的能耗已成为研究的热点。本文提出了一种基于机器学习的方法来优化数据中心的能效。通过分析历史运行数据,构建预测模型,并结合实时监控,动态调整资源分配策略以达到节能目的。实验结果表明,该方法能有效减少能源开销,同时保证服务质量。
|
12天前
|
机器学习/深度学习 资源调度 调度
利用机器学习优化数据中心能效的策略研究
【4月更文挑战第18天】 在数据中心的运营成本中,能源消耗占据了显著比例。为了降低这一开销同时减少环境影响,本文提出一套基于机器学习技术的数据中心能效优化策略。通过分析数据中心的能耗模式和环境变量,构建了一个预测模型来动态调整资源分配,实现能源使用的最大效率。与传统方法相比,本研究提出的策略在保证服务质量的前提下,能有效降低能耗,并具备自我学习和适应的能力。
|
17天前
|
机器学习/深度学习 人工智能 运维
|
18天前
|
机器学习/深度学习 人工智能 自然语言处理
|
2月前
|
机器学习/深度学习 存储 搜索推荐
利用机器学习算法改善电商推荐系统的效率
电商行业日益竞争激烈,提升用户体验成为关键。本文将探讨如何利用机器学习算法优化电商推荐系统,通过分析用户行为数据和商品信息,实现个性化推荐,从而提高推荐效率和准确性。
|
27天前
|
机器学习/深度学习 算法 搜索推荐
Machine Learning机器学习之决策树算法 Decision Tree(附Python代码)
Machine Learning机器学习之决策树算法 Decision Tree(附Python代码)

热门文章

最新文章