玩ST、肿瘤研究的来学习一下!16分Nature子刊的单细胞空间转录组+机器学习

简介: Nature Communications 发表了一项关于空间转录组和机器学习在肿瘤研究中的应用。研究聚焦于HPV阴性口腔鳞状细胞癌,通过整合单细胞和空间转录组分析,揭示了肿瘤核心(TC)和前沿边缘(LE)的独特转录特征。TC和LE的基因表达模式与多种癌症的预后相关,其中LE基因标志关联不良预后,而TC则与较好预后相关。利用机器学习,研究人员建立了预测模型,识别出跨癌症类型的保守TC和LE特征。此外,他们还分析了RNA剪接动态,发现了潜在的治疗脆弱性。这项工作为肿瘤生物学和靶向治疗提供了新见解,并为药物开发提供了依据。

今天给大家分享一篇IF=16.6的空间转录组+机器学习的文章,于2023年8月发表在Nature Communications上:Spatial transcriptomics reveals distinct and conserved tumor core and edge architectures that predict survival and targeted therapy response,空间转录组基于独特且保守的肿瘤中心和边缘结构预测生存和靶向治疗反应


image.png

摘要

研究者发现,肿瘤微环境的空间组织对生物学和治疗反应有深远的影响。他们对HPV阴性的口腔鳞状细胞癌(OSCC)进行了整合的单细胞和空间转录组分析,全面地描述了肿瘤核心(TC)和前沿边缘(LE)的转录架构中的恶性细胞。

他们证明了TC和LE具有独特的转录特征、邻近的细胞组成以及配体-受体相互作用。该团队进一步揭示,与LE相关的基因表达模式在不同的癌症中是保守的,而TC则是组织特异的,强调了肿瘤进展和侵袭背后的共同机制。此外,他们发现与LE相关的基因标志与多种癌症的较差的临床预后相关,而与TC相关的基因标志则与更好的预后有关。

最终,通过计算建模方法,他们描述了与药物反应预测性相关的OSCC中的细胞发展的空间调控模式。该团队的工作为TC和LE的生物学提供了全癌症的见解,并提供了交互式的空间图谱,为开发新的靶向治疗方法奠定了基础。

结果

image.png

图 1 | 对OSCC患者样本进行ST分析和细胞去卷积的实验设计概述

  • a. 示意图表示患者临床数据和样本获取与处理策略。来自所有12个空间分析样本的24,876个点的UMAP投影,根据其颜色进行着色。使用BioRender创建。
  • b. 病理切片注释
  • c. 基于Puram等人的scRNA-seq数据的头颈SCC单细胞去卷积。
  • d. 每个点的CNV概率。
  • e. 恶性点状态。
  • f. 基于去卷积和CNV概率的点注释。
    HPV 人乳头瘤病毒,OSCC 口腔鳞状细胞癌,SCC 鳞状细胞癌,Tregs T调节细胞。

image.png

图 2 | 在OSCC微环境中,TC和LE是空间上独特的区域

  • a. 来自所有12个空间剖析样本的13,950个恶性点的UMAP投影,通过Louvain聚类进行划分,并伴随一个系统发育树,展示了簇的转录组相似性。
  • b. 来自所有12个空间剖析样本的13,950个恶性点的UMAP投影,被划分为三个主要的节点聚类,伴随一个热图展示每个聚类前5个差异表达基因的log2(FC)。
  • c. Nebulosa核密度图,展示了文献验证的OSCC肿瘤核心和前沿标记的基因表达。
  • d. 样本1、2和9的TC注释和LE注释。
  • e. 所有空间剖析样本中TC和LE注释的全转录组Pearson相关性热图。样本根据转录组相似性进行排序。
  • f. Ingenuity路径分析热图,展示了TC和LE途径的预测激活和停用。只有在10个或更多的样本中被激活或停用的途径才会被显示,并根据每个样本中途径的z-分数相似性进行排序。
  • g. Consensus图显示了在超过9个样本中,TC和LE之间显著差异表达的前25个基因的累积平均logFC(调整后的p值 < 0.001,双侧Wilcox秩和检验,Bonferroni校正)。相关的原始数据提供在一个原始数据文件中。UMAP表示均匀流形近似投影,OSCC表示口腔鳞状细胞癌。

image.png

图 3 | TC和LE的癌细胞状态是具有独特配体-受体相互作用的不同实体

  • a. 在TC、LE和其他鳞状细胞癌(SCC)的点上对CSC基因签名的比较表达,用Nebulosa核密度图进行可视化。为了空间参考,提供了TC、LE和临时癌点注释的UMAP。圆圈代表平均值,线代表标准差(n = 12个样本,来自10个独立的患者)。
  • b. Liu等人描述的上皮(eCSC)和间充质癌干细胞(mCSC)标记物的示意表示。
  • c、d. 在TC、LE和其他SCC点上mCSCs(p值 = 2e−04)和eCSC(p值 = 1.5e−06)基因集的比较表达,用nebulosa核密度图可视化mCSCs和eCSC标记。圆圈代表平均值,线代表标准差(n = 12个生物学独立的样本)。
  • e. 通过整体信息流在TC和LE点上对富集的信号通路进行可视化的堆叠条形图。通路按其在TC或LE中的主导性进行着色。
  • f. 描述TC中的癌细胞之间、g. LE中的癌细胞之间、以及h. LE中的ecm-myCAF和癌细胞之间的细胞-细胞相互作用中涉及的空间解卷积的配体-受体对的Circos图。连接带的宽度表示配体-受体相互作用的强度。
  • i. 表示直接邻接于TC和LE点的非癌点数量的比较箱线图。非癌点的身份是基于最富集的非癌细胞类型解卷积确定的。使用Benjamini-Hochberg FDR校正的双侧Wilcoxon秩和检验比较了组。p < 0.05, p < 0.01, p < 0.001, ***p < 0.0001。Cytoxic CD8 T细胞的P值 = 0.003, ecm.myCAF = 2.2e−04, 中间纤维细胞 = 0.002, 巨噬细胞 = 0.008 (n = 12个样本,来自10个独立的患者)。

缩写:CSC 癌干细胞, TC 肿瘤核心, LE 前沿, MET 间充质-上皮转化, EMT 上皮-间充质转化, CD24(−) 逆CD24基因表达(1/CD24),Tregs T调节细胞。

image.png

图 4 | 机器学习模型在多种癌症类型中识别出保守的TC和LE特征

  • a. 描述用于在公开可用的空间分布样本中识别TC和LE基因特征的机器学习策略的信息图。
  • b. 描述随后包括在机器学习训练数据集中的公开可用的空间分布样本的信息图。用BioRender创建。
  • c. 在TC、LE、临时和其他区域中绘制的概率分布。
  • d. 条形图显示了30个不同的空间分布样本中每个空间不同区域的scPred分类得分。该图是基于TC、LE、临时和其他区域的预测比例的相似性进行聚类的。
  • e-h. H&E染色的组织切片(左图)、染色组织上的scPred投影(中图)以及按scPred分类着色的UMAP(右图)代表cSCC、COAD和CESC的空间转录组测试数据集。

UMAP 均匀流形逼近投影,cSCC 皮肤鳞状细胞癌,SCC 鳞状细胞癌,ICC 肝内胆管癌,PRAD 前列腺腺癌,PDAC 胰腺导管癌,CESC 宫颈鳞状细胞癌,COAD 结肠腺癌,IDC 侵袭性导管癌,HCC 肝细胞癌,SKCM 皮肤黑色素瘤,ILC 侵袭性小叶癌,EC 子宫腺癌,CHC 组合性肝细胞和胆管癌,GBM 多形性胶质母细胞瘤,CNS 胚胎中枢神经系统肿瘤,MB 髓母细胞瘤。

image.png

图 5 | TC和LE特征的生存相关性和预后特征

  • a. 描述TC和LE单样本基因组得分策略在TCGA转录组数据的信息图。
  • b. 根据275个OSCC样本中的TC(上图)和LE(下图)基因组富集得分,展示OS、DSS和PFI终点的Kaplan–Meier可视化。显示的P值是使用cox比例风险回归计算的。
  • c、d. 来自TCGA的20种常见癌症类型的TC和LE基因组富集得分的OS和DSS全癌症结果。显示的P值和风险比是使用cox比例风险回归计算的。
  • e、f. 条形图显示相对于相关的临床-病理变量的TC和LE富集得分。显著性是使用双侧Wilcoxon秩和检验确定的,应用了Benjamini–Hochberg FDR修正。误差线代表均值的标准误差(SEM)。p < 0.05, p < 0.01, p < 0.001, ***p < 0.0001。P值对于高级N期= 0.018,LVI = 0.002,III级= 1.8e−06,阳性切缘= 0.02,ECS = 0.002 (n = 275个生物学独立的HPV阴性OSCC样本)。

缩写:TC 肿瘤核心,LE 领先边缘,以及其他癌症类型的缩写。

image.png

图 6 | RNA剪接动态分析揭示了TC和LE的不同发展轨迹和治疗脆弱性

  • a. 空间解卷积的癌细胞斑点的UMAP,上面覆盖了基于TC、过渡期和LE注释的颜色的RNA速度流,以及UMAP图与覆盖的RNA速度置信度。
  • b. 代表性的空间分析样本(样本2和5)与RNA速度流覆盖并按TC和LE癌细胞注释着色。
  • c. 条形图可视化了TC和LE区域内顶部差异剪接的基因(具有动态剪接行为的基因)。条形图由存在于其在TC或LE中的剪接形式的较高比例的基因着色。
  • d. 显示剪接和未剪接RNA的比率的相位肖像,为顶部差异剪接的基因,紫色线描绘预测的剪接稳态。
  • e. 由矢量场整合推断的TC、过渡期和LE注释的细胞命运转变概率状态图。
  • f. 描述用于系统收集药物反应数据和测试计算机内药物干扰的策略的信息图。使用BioRender创建。
  • g. 高AAC药物中富集的细胞命运转变的信息图状态图。
  • h. 盒形图比较基于中位数分层的高AAC和低AAC药物之间的边缘外向矢量场强度。使用双侧Wilcoxon秩和检验比较AAC分组(n = 70个独立药物)。

缩写:AAC 曲线上方面积。

要点

  • 难吗?难,啃了好几天。有用吗?真的有用,格局打开。
  • HPV阴性口腔鳞状细胞癌,选题☑️
  • 通篇是:单细胞+空间转录组分析了TC区和LE区转录特征,癌细胞特异配体-受体相互作用,机器学习模型鉴定了多种癌症中的TC和LE特征,TCGA分析TC和LE基因组与多种癌症的临床预后之间的关系,最后用轨迹分析探讨了可能的药物治疗靶点。
  • 本篇对于新手来说研究套用/复现难,进阶选手可以挑战,其细胞通讯、预后标志物和药物响应模型对于药企/研究院作为肿瘤靶向药物研发有一定的借鉴作用,其次这种研究思路也是值得学习的。


目录
相关文章
|
18天前
|
机器学习/深度学习
自动化机器学习研究MLR-Copilot:利用大型语言模型进行研究加速
【10月更文挑战第21天】在科技快速发展的背景下,机器学习研究面临诸多挑战。为提高研究效率,研究人员提出了MLR-Copilot系统框架,利用大型语言模型(LLM)自动生成和实施研究想法。该框架分为研究想法生成、实验实施和实施执行三个阶段,通过自动化流程显著提升研究生产力。实验结果显示,MLR-Copilot能够生成高质量的假设和实验计划,并显著提高任务性能。然而,该系统仍需大量计算资源和人类监督。
22 4
|
1月前
|
机器学习/深度学习 算法
【机器学习】迅速了解什么是集成学习
【机器学习】迅速了解什么是集成学习
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
【机器学习】机器学习、深度学习、强化学习和迁移学习简介、相互对比、区别与联系。
机器学习、深度学习、强化学习和迁移学习都是人工智能领域的子领域,它们之间有一定的联系和区别。下面分别对这四个概念进行解析,并给出相互对比、区别与联系以及应用场景案例分析。
81 1
|
3月前
|
机器学习/深度学习 开发者 Python
Python 与 R 在机器学习入门中的学习曲线差异
【8月更文第6天】在机器学习领域,Python 和 R 是两种非常流行的编程语言。Python 以其简洁的语法和广泛的社区支持著称,而 R 则以其强大的统计功能和数据分析能力受到青睐。本文将探讨这两种语言在机器学习入门阶段的学习曲线差异,并通过构建一个简单的线性回归模型来比较它们的体验。
66 7
|
3月前
|
机器学习/深度学习 运维 算法
【阿里天池-医学影像报告异常检测】3 机器学习模型训练及集成学习Baseline开源
本文介绍了一个基于XGBoost、LightGBM和逻辑回归的集成学习模型,用于医学影像报告异常检测任务,并公开了达到0.83+准确率的基线代码。
65 9
|
3月前
|
机器学习/深度学习 存储 分布式计算
Hadoop与机器学习的融合:案例研究
【8月更文第28天】随着大数据技术的发展,Hadoop已经成为处理大规模数据集的重要工具。同时,机器学习作为一种数据分析方法,在各个领域都有着广泛的应用。本文将介绍如何利用Hadoop处理大规模数据集,并结合机器学习算法来挖掘有价值的信息。我们将通过一个具体的案例研究——基于用户行为数据预测用户留存率——来展开讨论。
230 0
|
3月前
|
机器学习/深度学习
【机器学习】模型融合Ensemble和集成学习Stacking的实现
文章介绍了使用mlxtend和lightgbm库中的分类器,如EnsembleVoteClassifier和StackingClassifier,以及sklearn库中的SVC、KNeighborsClassifier等进行模型集成的方法。
54 1
|
3月前
|
机器学习/深度学习 人工智能 算法
AI人工智能(ArtificialIntelligence,AI)、 机器学习(MachineLearning,ML)、 深度学习(DeepLearning,DL) 学习路径及推荐书籍
AI人工智能(ArtificialIntelligence,AI)、 机器学习(MachineLearning,ML)、 深度学习(DeepLearning,DL) 学习路径及推荐书籍
125 0
|
4月前
|
机器学习/深度学习 人工智能 缓存
人工智能平台PAI使用问题之如何配置学习任务
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
4月前
|
机器学习/深度学习 算法 Python
强化学习(Reinforcement Learning, RL)** 是一种机器学习技术,其中智能体(Agent)通过与环境(Environment)交互来学习如何执行决策以最大化累积奖励。
强化学习(Reinforcement Learning, RL)** 是一种机器学习技术,其中智能体(Agent)通过与环境(Environment)交互来学习如何执行决策以最大化累积奖励。

热门文章

最新文章