23年9月发表,工作量叠满:线粒体+PCD+多组学+机器学习+泛癌

简介: **摘要:**一项发表在《Journal of Translational Medicine》(IF=7.4)的研究聚焦于低级别胶质瘤(LGG),通过集成机器学习分析线粒体功能与18种细胞死亡模式的交互,开发了一种名为mtPCDI的预后指数。该模型基于1467例全球多中心LGG患者的基因表达数据,揭示了线粒体功能与预后及免疫代谢特征的关联。mtPCDI高分组表现出代谢途径增强和免疫活性,且在调整混杂因素后,其预后价值超过传统临床模型。研究结果强调mtPCDI在个性化风险评估和治疗策略制定中的潜力,并为线粒体介导的细胞死亡研究提供了新视角。

今天给大家分享一篇IF=7.4的非肿瘤线粒体思路的文章,2023年9月发表在Journal of Translational Medicine:Integrated machine learning survival framework develops a prognostic model based on inter-crosstalk definition of mitochondrial function and cell death patterns in a large multicenter cohort for lower-grade glioma,基于线粒体功能与细胞死亡模式之间交互作用定义的集成机器学习生存框架为低级胶质瘤在大型多中心队列中开发了一个预后模型

image.png

摘要

  • 背景:
    低级胶质瘤(LGG)是一种高度异质性的疾病,准确预测患者的预后存在挑战。线粒体在真核细胞的能量代谢中起到中心作用,并可以影响细胞死亡机制,这些机制在肿瘤发生和进展中至关重要。然而,LGG中线粒体功能与细胞死亡之间的相互作用的预后意义还需要进一步研究。
  • 方法:
    我们采用了一个稳健的计算框架,研究了线粒体功能与来自全球六个多中心队列的1467名LGG患者中的18种细胞死亡模式之间的关系。共收集了10种常用的机器学习算法,并随后组合成101个独特的组合。最终,我们使用展现出最佳性能的机器学习模型设计了与线粒体相关的程序性细胞死亡指数(mtPCDI)。
  • 结果:
    由结合了18个高度影响力的基因产生的mtPCDI,对LGG患者的预后具有强烈的预测性能。从生物学上看,mtPCDI与免疫和代谢特征呈现显著的相关性。mtPCDI高的组表现出丰富的代谢途径和增强的免疫活性特征。特别重要的是,即使在调整可能的混杂因素后,我们的mtPCDI仍然保持其作为最有力的预后指标的地位,超过了已建立的临床模型的预测强度。
  • 结论:
    我们利用稳健的机器学习框架强调了mtPCDI在为LGG诊断的个体提供个性化风险评估和针对代谢和免疫治疗的定制建议中的重要潜力。特别重要的是,该特征展示了高度影响力的基因,为未来进一步研究PCD在线粒体功能中的作用提供了进一步的前景。

整体框架

image.png

结果

image.png

图 2. mtPCDI的预后意义

  • A 包含18种PCD模式的关键调节基因的收集。
  • B 识别大脑皮层和LGG组织之间差异表达基因的火山图。
  • C 与正常组织相比,LGG肿瘤组织中有134个与线粒体相关的基因和333个与程序性细胞死亡相关的基因表现出差异表达。
  • D mtPCDI使用的机器学习算法是101种不同的组合。随后,为每个数据集计算了每个模型的c指数(E) TCGA-LGG、CGGA-325、CGGA-693、Rembrandt、GSE16011和E-MTAB-3892按mtPCDI的生存曲线。
  • F 每个数据集中1年、3年和5年OS的ROC曲线。

image.png

图 3. mtPCDI签名基因的特征注释

  • A 热图展示了mtPCDI组与临床特征的关系,以及LGG患者中18个最重要基因的表达。
  • B 热图显示了LGG中某基因对途径产生显著影响(FDR≤0.05)的癌症比例,每个单元格代表相应的百分比值。
  • C 泡沫图展示了18个mtPCDI签名基因表达与LGG中24种免疫细胞类型浸润之间的相关性概要。
  • D 热图显示了18个mtPCDI签名基因涉及的基因-途径。
  • E 热图展示了重要途径的富集分数。

image.png

图 4. 多组学特征描述

  • 在(A) mtPCDI-高和(B) mtPCDI-低中的拷贝数放大和删除的重复区域。观察到mtPCDI高和低的LGG患者之间的拷贝数变异不同的轮廓。
  • C-D,高和低mtPCDI子集中1p/19q并发删除的景观。
  • E Oncoprint展示了受常见拷贝数变异影响的基因,每组中的变异对应比例在右侧的条形图中表示。
  • F Oncoprint显示了常见的体细胞基因突变,每组中的突变对应比例在右侧的条形图中表示。
  • G TCGA-LGG数据集中高和低mtPCDI患者的整倍性得分、变化部分、同源重组缺陷、非沉默突变率和片段数的比较。
  • H TMB的高和低mtPCDI亚组的比较。
  • I 突变负荷和mtPCDI的相关分析。
  • J 根据mtPCDI分类的患者的OS Kaplan-Meier曲线。
  • K mtPCDI和TMB分类的OS Kaplan-Meier曲线。

image.png

图 5. mtPCDI组的功能富集分析

  • A mtPCDI组的KEGG和B GO富集分析。
  • 在C, E低mtPCDI D, F和高mtPCDI组中,GSEA富集的前5个途径。

image.png

图 6. mtPCDI签名的功能注解

  • A 已知的临床和分子特征(年龄、性别、分级、化疗状态、放疗状态、IDH1状态、MGMT启动子甲基化状态、1p/19q并发缺失、TERT启动子甲基化状态、TERT表达状态和ATRT状态)与LGG中的mRNAsi之间的关联。
  • B 已知的临床和分子特征(年龄、性别、分级、化疗状态、放疗状态、IDH1状态、MGMT启动子甲基化状态、1p/19q并发缺失、TERT启动子甲基化状态、TERT表达状态和ATRT状态)与LGG中的mDNAsi之间的关联。
  • C mRNAsi与mtPCDI之间的关联,以及两个mtPCDI组之间的mRNAsi差异。
  • D mDNAsi与mtPCDI之间的关联,以及两个mtPCDI组之间的mDNAsi差异。E TIS与mtPCDI之间的关联,以及高和低mtPCDI组之间的TIS差异。
  • F 盒形图描绘了两个mtPCDI组之间的癌症免疫周期的差异。
  • G 雷达图显示了两个mtPCDI组之间的肿瘤浸润免疫细胞。
  • H 条形图显示了肿瘤浸润免疫细胞的相对比例。
  • I 热图展示了与抗癌免疫相关的178个步骤特异性签名基因在七步癌症-免疫周期中所有样本的表达水平。

image.png

图 7. 肿瘤免疫微环境的探索

  • A 通过使用多种算法估算两个mtPCDI亚组之间的免疫浸润细胞。
  • B 估计两个mtPCDI亚组之间的免疫调节分子。
  • C 相关性分析估算免疫浸润细胞的数量。
  • D 相关性分析估算免疫调节化学物质的存在。
  • E 两个mtPCDI组之间浸润免疫细胞的评分差异和F 免疫相关功能。
  • G 两个mtPCDI组的估计得分、免疫得分、基质得分和肿瘤纯度。
  • H 蝴蝶图展示了mtPCDI与浸润免疫细胞以及免疫相关功能之间的相关性。

image.png

图 8. 构建和验证标度图

  • A 单变量和B 多因素分析。
  • C 标度图预测1年、3年和5年的生存率。
  • D 1年、3年和5年OS的标度图校准曲线。
  • E 标度图模型中包含的变量的AUC分析。
  • F 对LGG患者的1年、3年和5年期间的DCA曲线进行了比较。

image.png

图 9. 通过共识聚类描绘了两个不同的LGG簇

  • A, B 对k=2到9的共识聚类CDF。
  • C k=2的共识聚类。
  • D LGG患者在两个亚组中的OS的Kaplan-Meier生存曲线。
  • E 两个不同亚组之间的tSNE分析和PCA分析。
  • F 热图显示了两个不同亚组与LGG患者的临床特征和18个最有价值基因的表达之间的关系。
  • G 两个不同亚组中mtPCDI签名基因表达差异的分析。
  • H 基于ssGSEA算法,两个不同亚组之间的途径活动。

image.png

图 10. 两个不同亚组之间肿瘤的免疫状态

  • A C1和C2亚组中的估计得分、免疫得分、基质得分和肿瘤纯度。
  • B C1和C2亚组中浸润免疫细胞的得分和C 免疫相关功能的得分。
  • D 使用多种算法估算两个不同亚组之间的免疫浸润细胞。
  • E 两个不同亚组之间的免疫调节分子比较。

image.png
图 11. mtPCDI签名基因在泛癌分析中的景观

  • A 展示了选定的癌症类型和基因组符号的风险比和Cox P值。行代表基因组符号,而列代表癌症类型。气泡的颜色和大小分别表示风险比和Cox P值的显著性。使用蓝到红的颜色渐变表示从低到高的风险比,而较大的气泡对应于Cox P值的更大统计显著性。黑色轮廓边框突出显示Cox P值≤0.05的阈值。
  • 在B中,图表展示了每种癌症类型的签名基因的logFC和FDR。红色和蓝色分别表示明显上调和下调的基因。此外,C显示了一个热图,展示了恶性肿瘤中签名基因的不同甲基化模式。使用Wilcoxon秩和测试评估统计显著性的程度,超甲基化和低甲基化的基因分别用红色和蓝色表示。
  • D是一个条形图,展示了每个签名基因和癌症类型的拷贝数变异变化的频率。
  • 最后,E和F分别展示了给定的恶性肿瘤的签名基因突变频率和单核苷酸变异oncoplot。

image.png

图 12. 18个mtPCDI签名基因的基因表达和免疫组化分析

  • A-R显示了ACAA2、CTSL、MRPS16、ACACB、ECHDC2、MSH6、ANGPTL2、ERCC4、MTPAP、ANXA5、GNS、NCOA4、BRCA1、IFI16、PABPC5、BRCA2、MCUB和PDE2A的结果。

小总结

  • 似乎告别了传统的生信套路,但其实是集结了所有主流建模方法,有点像方法学的“meta”,流程图已经把思路展现的很透彻了:线粒体基因差异分析、18种程序性死亡综合打分、预后模型、多组学、通路富集、临床表征、免疫浸润、构建指标变量模型、一致性聚类、组间免疫浸润、泛癌分析、表达表征和免疫组化
  • 虽说其实换个疾病闷头复现一遍又是篇文章,但笔者认为还是要打开格局,LGG作为原发性脑肿瘤不论是肿瘤研究还是药物开发,都很难、其多变性、易误诊性、靶向药物的复杂性,因此分型分期分类分组,指向于基础研究和临床医学检验衍生出这套算法模型。
  • 不过这种多变量多指标结合评估模型也不算“新菜”了,在精准医疗和肿瘤靶向药物开发算常见了,只是在生信发文上确实是万花丛中一点绿,感觉不错的小伙伴们学起来~



这个分段的文章前面也有总结了几篇大家可以看一下

欢迎大家添加为星标推荐👇

目录
相关文章
|
2天前
|
机器学习/深度学习 数据采集 算法
Python技术应用案例——基于机器学习的信用评分模型
【2月更文挑战第11天】机器学习作为当下最热门的技术之一,已经在各个领域获得了广泛的应用。本文将介绍一个基于Python机器学习算法的信用评分模型,通过对数据集的处理和模型训练,实现对客户信用评级的自动化判定,提高了银行的工作效率和准确性。
201 4
|
11月前
|
机器学习/深度学习 算法 知识图谱
浙大团队将化学知识引入机器学习,提出可外推、可解释的分子图模型预测反应性能
浙大团队将化学知识引入机器学习,提出可外推、可解释的分子图模型预测反应性能
145 0
|
机器学习/深度学习
机器学习 模型评估课后题
机器学习 模型评估课后题
169 0
机器学习 模型评估课后题
|
机器学习/深度学习 数据采集 搜索推荐
机器学习评估指标的十个常见面试问题
评估指标是用于评估机器学习模型性能的定量指标。本文整理了10个常见的问题。
153 0
机器学习评估指标的十个常见面试问题
|
机器学习/深度学习 编解码 人工智能
机器学习(十一)时间序列模型
机器学习(十一)时间序列模型
490 0
机器学习(十一)时间序列模型
|
机器学习/深度学习 算法 数据挖掘
从零开始带你了解商业数据分析模型——线性回归模型理论介绍
本文我们将分为两篇文章,分别是线性回归模型理论介绍和线性回归模型实践演练。 摘要随着数据导向型决策、数据科学、大数据分析等话题日益火热,各行各业都开始关注数据分析这个课题。数字化转型成了很多企业在未来十年的重大举措。
|
算法 机器学习/深度学习
如何用机器学习方法,提升另一半的满意指数?
今天我们来探讨一个严肃又甜蜜的重要问题,一个你可能正在关注、或者终要关注的人生课题:如何用机器学习方法,为你生命里的另一半,挑选最适宜的母婴产品,提升幸福满意指数。
742 0
|
机器学习/深度学习 人工智能 算法
机器学习实战篇——用支撑向量算法在Kaggle上跑个分
之前写了关于人工智能和机器学习的理论基础文章,今天就理论联系实际,用机器学习算法跑个分。 机器学习最重要的就是数据,Kaggle平台提供了大量数据为机器学习的学习者和研究者提供一个跑分的平台。
1223 0
|
机器学习/深度学习 人工智能 算法
机器学习实战篇——用卷积神经网络算法在Kaggle上跑个分
之前的文章简单介绍了Kaggle平台以及如何用支撑向量(SVM)的机器学习算法识别手写数字图片。可见即使不用神经网络,传统的机器学习算法在图像识别的领域也能取得不错的成绩(我跑出来了97.2% 的正确率), 但是要将正确率再往上提升就会遇到瓶颈了。
1124 0
|
机器学习/深度学习 人工智能 算法