中科院医学2区7.4分|双疾病思路,学习一下cMAP

简介: 这篇研究通过综合生物信息学分析和机器学习,探讨了慢性肾脏病(CKD)与钙化性主动脉瓣疾病(CAVD)之间的关联,发现了17个潜在的诊断标志物,并构建了基于SLPI/MMP9的CAVD诊断列线图。该研究揭示了CKD相关CAVD的免疫途径,为未来血清诊断和治疗提供了新视角。文章发表在《Journal of Translational Medicine》上,IF为7.4。

今天给大家分享一篇IF=7.4的肿瘤分型的文章,2023年6月发表在Journal of Translational Medicine:Screening of immune-related secretory proteins linking chronic kidney disease with calcific aortic valve disease based on comprehensive bioinformatics analysis and machine learning,基于综合生物信息学分析和机器学习的慢性肾脏病与钙化性主动脉瓣疾病免疫相关分泌蛋白筛选

image.png

摘要

  • 背景:慢性肾脏病(CKD)是最重要的心血管危险因素之一,在钙化性主动脉瓣疾病(CAVD)等各种心血管疾病中起着至关重要的作用。我们的目标是探索可能涉及CAVD发病机制的CKD相关基因,并发现诊断CAVD的CKD候选生物标志物。
  • 方法:从GEO数据库中获得了3个CAVD,1个CKD-PBMC和1个CKD-肾脏表达谱数据集。首先,为检测CAVD关键基因和CKD相关分泌蛋白,采用差异表达分析和WGCNA进行检测。采用蛋白质-蛋白质相互作用(PPI)、功能富集和cMAP分析揭示CKD相关致病基因和CKD相关CAVD的潜在机制,以及CAVD治疗的潜在药物。然后,采用LASSO回归和随机森林等机器学习算法筛选候选生物标志物,构建诊断列线图,预测CKD相关CAVD。此外,采用ROC曲线、校准曲线和决策曲线分析对列线图的诊断性能进行评价。最后,利用CIBERSORT算法探索CAVD中的免疫细胞浸润。
  • 结果:集成的CAVD数据集通过交叉差异表达和WGCNA分析确定了124个CAVD关键基因。通过CKD-PBMC/肾脏数据集的差异表达分析筛选出983个CKD相关分泌蛋白。PPI分析确定了两个包含76个节点的关键模块,被认为是CAVD中CKD相关致病基因,它们主要通过富集分析富集炎症和免疫调节。cMAP分析显示美替拉酮是一种更潜在的CAVD治疗药物。CAVD关键基因与CKD相关分泌蛋白之间有17个基因重叠,选择9个枢纽基因作为候选生物标志物,通过机器学习开发具有理想诊断性能的列线图。此外,SLPI / MMP9表达模式在我们的外部队列中得到证实,列线图可以作为区分CAVD的新诊断模型。最后,免疫细胞浸润结果揭示了CAVD的免疫失调,SLPI/MMP<>与侵袭性免疫细胞显著相关。
  • 结论:我们揭示了CKD相关CAVD的炎症免疫途径,并开发了基于SLPI / MMP9的CAVD诊断列线图,为未来基于血清的CKD诊断和CAVD治疗干预提供了新的见解。

分析流程

image.png

结果

image.png

图 2.CAVD数据集的整合和CAVD数据集的差异表达分析

  • A 批处理效应校正前三个原始 CAVD 数据集的 PCA。
  • B 批量效应校正后集成CAVD数据集的PCA。
  • C 表示集成 CAVD 数据集中 CAVD DEG 的火山图。上调基因以红点表示,而下调基因以蓝点表示。
  • D 热图显示了集成CAVD数据集中前30个上调和30个下调DEG。

image.png

图 3.通过WGCNA,关键模块基因和DEG交集

  • A 利用无标度拓扑模型确定最佳β值,根据平均连通性和尺度独立性选择β = 5作为软阈值。
  • B 显示基因树状图和模块特征基因的网络热图。
  • C 表示模块特征基因的簇树状图。
  • D 揭示模块特征基因与CAVD状态之间关系的热图。介绍了模块特征基因的相关性(上)和p值(下)与CAVD的状态。与CAVD相关的粉红色和黄色模块分别表现出最高和最低的相关系数,被确定为CAVD的关键模块。
  • E 粉色模块成员与粉色模块中基因的基因意义的相关图。
  • F 黄色模块成员与黄色模块中基因的基因意义的相关图。
  • G 通过维恩图选取关键模块基因与DEGs的交集,共鉴定出CAVD中124个关键基因。


图 4.PMBC和CKD肾组织中分泌蛋白的差异表达分析

  • A 火山图揭示了CKD-PMBC数据集中的DEG。
  • B 代表 CKD-PBMC 数据集中前 30 个上调和 30 个下调 DEG 的热图。
  • C 显示 CKD-肾脏数据集中 DEG 的火山图。
  • D 热图显示 CKD-肾脏数据集中前 30 个上调和 30 个下调 DEG。
  • E CKD-PMBC DEGs与通过维恩图编码分泌蛋白的基因的交集。
  • F 通过维恩图将CKD-肾脏DEG与编码分泌蛋白的基因相交,共鉴定出983个CKD相关分泌蛋白。

image.png

图 5.CKD相关分泌蛋白与CAVD关键基因之间的PPI分析,富集分析

  • A 基于Cytoscape插件MCODE分析的模块1基因的PPI网络,得分最高。鲑鱼节点被标记为CAVD关键基因的成员,黄色节点被标记为CKD相关分泌蛋白的成员,而红色节点被标记为两组的共同基因。
  • B 根据MCODE分析,模块1基因的PPI网络得分最高。
  • C–F 显示 GO 富集分析结果的气泡图,包括模块 2 和模块 2 中包含的基因的生物过程 (C)、细胞成分 (D) 和分子功能 (E)。
  • F Circos 图表示模块 1 和模块 2 中包含的基因的 KEGG 分析结果。

image.png

图 6.通过cMAP分析筛选用于治疗CAVD的潜在小分子化合物

  • A 基于cMAP分析的热图显示了10个细胞系中富集得分最高的前10种化合物。
  • B 前10种化合物的描述。
  • C 显示了这10种化合物的化学结构。


图 7.通过机器学习方法鉴定CKD相关CAVD的潜在诊断生物标志物

  • A 维恩图显示了CKD相关分泌蛋白,CAVD DEG和CAVD关键模块基因的17个重叠基因。
  • B, C 诊断生物标志物(n = 8)的最小值(B)和λ值(C)通过LASSO logistic回归算法进行识别。
  • D 选取CAVD中17个基因的MeanReductionGini和6个评分大于2.0的生物标志物的RF算法。
  • E 维恩图显示了LASSO和RF算法之间的两个共同基因,它们被确定为CKD相关CAVD中的枢纽基因。

image.png


图 8.诊断列线图模型和疗效评估的构建

  • A 列线图是根据诊断生物标志物构建的。
  • B-D 每个候选生物标志物(包括SLPI(B)和MMP9(C))的诊断性能的ROC曲线,以及为CKD相关CAVD构建的列线图模型(D)。
  • E CKD相关CAVD中列线图模型预测的校准曲线。虚线标记为“理想”,代表标准曲线,代表理想模型的完美预测。虚线标记为“表观”,表示未校准的预测曲线,而实线标记为“偏差校正”,表示校准的预测曲线。
  • F 列线图模型的 DCA。黑线标记为“无”,代表假设没有患者患有CAVD的净收益。灰线标记为“全部”,表示假设所有患者都有CAVD的净获益,紫线标记为“列线图”,表示根据列线图模型预测的CAVD诊断值识别CKD相关CAVD的假设的净收益。
  • G 来自 GEO 数据库的列线图模型在预测硬化性主动脉瓣患者方面的诊断性能的 ROC 曲线。

image.png

图 9.CAVD中的免疫细胞浸润分析

  • A CAVD和对照组之间免疫细胞比例的堆叠直方图。
  • B 小提琴图显示了CAVD和对照组之间22种免疫细胞的比较。红色和蓝色星星分别代表CAVD组中免疫细胞比例的增加和减少。
  • C 热图揭示了22种免疫细胞浸润在p<0.05阈值上的相关性。
  • D 代表差异浸润免疫细胞与两个枢纽基因在p < 0.05阈值上的关联的相关图。

image.png

图 10.验证钙化主动脉瓣样本中枢纽基因的表达,并评估列线图模型诊断性能

  • A RT-qPCR 显示钙化主动脉瓣样本中 SLPI 和 MMP9 的 mRNA 水平升高。
  • B ELISA 分析显示 CKD 和 CAVD 患者以及 CKD 伴 CAVD 患者的血清 SLPI 和 MMP9 水平升高。
  • C 列线图A是基于诊断生物标志物开发的,用于预测CAVD的风险。
  • D 每个候选生物标志物(SLPI 和 MMP9)和列线图 A 的预测性能的 ROC 曲线。
  • E CAVD 患者列线图 A 预测的校准曲线。列线图 A 的 F DCA。
  • G 列线图 B 是基于诊断生物标志物开发的,用于预测 CKD 患者患有 CAVD 的风险。
  • H 每个候选生物标志物(SLPI 和 MMP9)和列线图 B 的预测性能的 ROC 曲线。
  • I 列线图 B 预测在 CKD 伴 CAVD 患者中的校准曲线。
  • J DCA 用于列线图 B

小总结

  • 这是一篇很典型的双疾病免疫靶点筛选的生信文章,本篇的思维导图对于研究思路的整体框架清晰明了:CAVD整合数据集、CAVD差异分析和WGCNA分析取交集;CKD外周血和组织的差异表达基因取并集;PPI网络-cMAP分析-功能通路富集分析;LASSO回归和随机森林;构建诊断模型;验证
  • 对于小分子药物,cMAP分析小伙伴们可以学习一下,给传统的筛选疾病生物标志物增添几分“色彩”


目录
相关文章
|
14天前
|
机器学习/深度学习 监控 数据可视化
【BetterBench博士】2024年中国研究生数学建模竞赛 E题:高速公路应急车道紧急启用模型 问题分析、数学模型及Python代码
2024年中国研究生数学建模竞赛E题要求建立高速公路应急车道紧急启用模型,以缓解特定路段的拥堵问题。题目提供了四个视频观测点的数据,需分析交通流参数随时间的变化规律,建立拥堵预警模型,并验证模型有效性。此外,还需设计合理的应急车道启用规则和算法,优化视频监控点布局,以提升决策科学性和成本效益。涉及视频数据处理、非线性动态系统建模和机器学习等技术。适合交通工程、数学、计算机科学等多个专业学生参与。需利用Python等工具进行数据处理和建模。具体问题包括统计参数变化、建立拥堵模型、验证模型有效性、设计启用规则和优化监控点布局。
679 12
【BetterBench博士】2024年中国研究生数学建模竞赛 E题:高速公路应急车道紧急启用模型 问题分析、数学模型及Python代码
|
2月前
|
机器学习/深度学习 算法 Python
【2023 华数杯全国大学生数学建模竞赛】 A题 隔热材料的结构优化控制研究 问题分析、模型建立及参考文献
本文提供了2023年华数杯全国大学生数学建模竞赛A题的详细分析、数学模型建立及参考文献,聚焦于隔热材料的结构优化控制研究,旨在解决单根隔热材料纤维的热导率测量难题,并探讨如何通过优化织物编织结构来提升隔热性能。
19 0
【2023 华数杯全国大学生数学建模竞赛】 A题 隔热材料的结构优化控制研究 问题分析、模型建立及参考文献
|
2月前
【2023 华数杯全国大学生数学建模竞赛】 A题 隔热材料的结构优化控制研究 问题分析及完整论文
本文提供了2023年华数杯全国大学生数学建模竞赛A题的完整论文,深入分析了隔热材料的结构优化控制研究,包括建立数学模型、求解单根纤维的热导率、优化织物结构参数以及考虑对流换热影响的模型调整,旨在开发出具有更优隔热性能的新型织物。
51 0
【2023 华数杯全国大学生数学建模竞赛】 A题 隔热材料的结构优化控制研究 问题分析及完整论文
|
2月前
|
数据可视化 决策智能 Python
【江西省研究生数学建模竞赛】题目之二 国际“合作-冲突”的演化规律研究 建模方案及参考文献
本文介绍了江西省研究生数学建模竞赛题目之二“国际‘合作-冲突’的演化规律研究”的建模方案和参考文献,探讨了如何通过博弈论和决策树模型来分析和预测国家间的合作与冲突行为,并提出了评估国际环境和应对突发事件的策略。
32 0
【江西省研究生数学建模竞赛】题目之二 国际“合作-冲突”的演化规律研究 建模方案及参考文献
|
2月前
|
人工智能 算法 安全
【2023 年第十三届 MathorCup 高校数学建模挑战赛】C 题 电商物流网络包裹应急调运与结构优化问题 赛后总结之31页论文及代码
本文总结了2023年第十三届MathorCup高校数学建模挑战赛C题的解题过程,详细阐述了电商物流网络在面临突发事件时的包裹应急调运与结构优化问题,提出了基于时间序列预测、多目标优化、遗传算法和重要性评价模型的综合解决方案,并提供了相应的31页论文和代码实现。
54 0
|
5月前
|
数据挖掘
R语言主成分、因子分析、聚类对我国城镇私营单位就业人员平均工资数据研究与分析
R语言主成分、因子分析、聚类对我国城镇私营单位就业人员平均工资数据研究与分析
|
5月前
|
Go 数据库 知识图谱
中科院一区7.9分top刊|好久不见,网络药理学(实验为主生信为辅)
`Phytomedicine` 杂志2023年6月发表了一篇关于网络药理学的文章,研究了肾康注射液(SKI)治疗糖尿病肾病(DKD)的机制,重点关注其通过Keap1/Nrf2/Ho-1信号通路对抗氧化应激的影响。研究表明,SKI可能通过调节氧化还原相关信号,减轻AGEs诱导的氧化应激,从而改善DKD。在动物实验中,SKI降低了DKD大鼠的尿蛋白、Scr水平,改善了肾功能和血脂,减少了氧化应激指标,并在细胞实验中显示了类似的效果,激活了Keap1/Nrf2/Ho-1通路。
143 1
|
5月前
|
数据可视化 Go
快刀斩乱麻,二区7分今年9月发表,孟德尔随机化如何做药靶筛选?
该文章是2023年9月发表在《Journal of Translational Medicine》的孟德尔随机化研究,探索风湿性关节炎(RA)的潜在药物靶点。研究通过遗传学方法鉴定,发现7个可能的药物靶点,这些基因与免疫功能相关,有望为RA药物开发提供新方向,节省成本,并增加临床试验成功的可能性。分析过程包括MR分析、共定位、功能富集和药物预测等步骤。
86 0
|
5月前
|
数据库
文献速读|毕设不愁了,中科院二区5分非肿瘤双疾病分析思路
研究摘要:一项发表于2023年《Molecular Neurobiology》(IF=5.1)的论文探讨了帕金森病(PD)与重度抑郁症(MDD)的共病基因。研究通过分析基因表达谱数据识别出PD和MDD的共同基因,特别是AQP9、SPI1和RPH3A三个关键基因。这些基因在两种疾病中均表现出显著差异表达,且与中性粒细胞和单核细胞的功能有关。研究使用生物信息学方法进行基因功能注释和蛋白质相互作用网络分析,并通过实验验证了基因在模型系统中的作用,强调了这些基因在疾病病理生理中的潜在角色。
95 0
|
机器学习/深度学习 传感器 算法
2023美赛D题-确定联合国可持续发展目标的优先级思路及matlab代码
2023美赛D题-确定联合国可持续发展目标的优先级思路及matlab代码
下一篇
无影云桌面