中科院医学2区7.4分|双疾病思路,学习一下cMAP

简介: 这篇研究通过综合生物信息学分析和机器学习,探讨了慢性肾脏病(CKD)与钙化性主动脉瓣疾病(CAVD)之间的关联,发现了17个潜在的诊断标志物,并构建了基于SLPI/MMP9的CAVD诊断列线图。该研究揭示了CKD相关CAVD的免疫途径,为未来血清诊断和治疗提供了新视角。文章发表在《Journal of Translational Medicine》上,IF为7.4。

今天给大家分享一篇IF=7.4的肿瘤分型的文章,2023年6月发表在Journal of Translational Medicine:Screening of immune-related secretory proteins linking chronic kidney disease with calcific aortic valve disease based on comprehensive bioinformatics analysis and machine learning,基于综合生物信息学分析和机器学习的慢性肾脏病与钙化性主动脉瓣疾病免疫相关分泌蛋白筛选

image.png

摘要

  • 背景:慢性肾脏病(CKD)是最重要的心血管危险因素之一,在钙化性主动脉瓣疾病(CAVD)等各种心血管疾病中起着至关重要的作用。我们的目标是探索可能涉及CAVD发病机制的CKD相关基因,并发现诊断CAVD的CKD候选生物标志物。
  • 方法:从GEO数据库中获得了3个CAVD,1个CKD-PBMC和1个CKD-肾脏表达谱数据集。首先,为检测CAVD关键基因和CKD相关分泌蛋白,采用差异表达分析和WGCNA进行检测。采用蛋白质-蛋白质相互作用(PPI)、功能富集和cMAP分析揭示CKD相关致病基因和CKD相关CAVD的潜在机制,以及CAVD治疗的潜在药物。然后,采用LASSO回归和随机森林等机器学习算法筛选候选生物标志物,构建诊断列线图,预测CKD相关CAVD。此外,采用ROC曲线、校准曲线和决策曲线分析对列线图的诊断性能进行评价。最后,利用CIBERSORT算法探索CAVD中的免疫细胞浸润。
  • 结果:集成的CAVD数据集通过交叉差异表达和WGCNA分析确定了124个CAVD关键基因。通过CKD-PBMC/肾脏数据集的差异表达分析筛选出983个CKD相关分泌蛋白。PPI分析确定了两个包含76个节点的关键模块,被认为是CAVD中CKD相关致病基因,它们主要通过富集分析富集炎症和免疫调节。cMAP分析显示美替拉酮是一种更潜在的CAVD治疗药物。CAVD关键基因与CKD相关分泌蛋白之间有17个基因重叠,选择9个枢纽基因作为候选生物标志物,通过机器学习开发具有理想诊断性能的列线图。此外,SLPI / MMP9表达模式在我们的外部队列中得到证实,列线图可以作为区分CAVD的新诊断模型。最后,免疫细胞浸润结果揭示了CAVD的免疫失调,SLPI/MMP<>与侵袭性免疫细胞显著相关。
  • 结论:我们揭示了CKD相关CAVD的炎症免疫途径,并开发了基于SLPI / MMP9的CAVD诊断列线图,为未来基于血清的CKD诊断和CAVD治疗干预提供了新的见解。

分析流程

image.png

结果

image.png

图 2.CAVD数据集的整合和CAVD数据集的差异表达分析

  • A 批处理效应校正前三个原始 CAVD 数据集的 PCA。
  • B 批量效应校正后集成CAVD数据集的PCA。
  • C 表示集成 CAVD 数据集中 CAVD DEG 的火山图。上调基因以红点表示,而下调基因以蓝点表示。
  • D 热图显示了集成CAVD数据集中前30个上调和30个下调DEG。

image.png

图 3.通过WGCNA,关键模块基因和DEG交集

  • A 利用无标度拓扑模型确定最佳β值,根据平均连通性和尺度独立性选择β = 5作为软阈值。
  • B 显示基因树状图和模块特征基因的网络热图。
  • C 表示模块特征基因的簇树状图。
  • D 揭示模块特征基因与CAVD状态之间关系的热图。介绍了模块特征基因的相关性(上)和p值(下)与CAVD的状态。与CAVD相关的粉红色和黄色模块分别表现出最高和最低的相关系数,被确定为CAVD的关键模块。
  • E 粉色模块成员与粉色模块中基因的基因意义的相关图。
  • F 黄色模块成员与黄色模块中基因的基因意义的相关图。
  • G 通过维恩图选取关键模块基因与DEGs的交集,共鉴定出CAVD中124个关键基因。


图 4.PMBC和CKD肾组织中分泌蛋白的差异表达分析

  • A 火山图揭示了CKD-PMBC数据集中的DEG。
  • B 代表 CKD-PBMC 数据集中前 30 个上调和 30 个下调 DEG 的热图。
  • C 显示 CKD-肾脏数据集中 DEG 的火山图。
  • D 热图显示 CKD-肾脏数据集中前 30 个上调和 30 个下调 DEG。
  • E CKD-PMBC DEGs与通过维恩图编码分泌蛋白的基因的交集。
  • F 通过维恩图将CKD-肾脏DEG与编码分泌蛋白的基因相交,共鉴定出983个CKD相关分泌蛋白。

image.png

图 5.CKD相关分泌蛋白与CAVD关键基因之间的PPI分析,富集分析

  • A 基于Cytoscape插件MCODE分析的模块1基因的PPI网络,得分最高。鲑鱼节点被标记为CAVD关键基因的成员,黄色节点被标记为CKD相关分泌蛋白的成员,而红色节点被标记为两组的共同基因。
  • B 根据MCODE分析,模块1基因的PPI网络得分最高。
  • C–F 显示 GO 富集分析结果的气泡图,包括模块 2 和模块 2 中包含的基因的生物过程 (C)、细胞成分 (D) 和分子功能 (E)。
  • F Circos 图表示模块 1 和模块 2 中包含的基因的 KEGG 分析结果。

image.png

图 6.通过cMAP分析筛选用于治疗CAVD的潜在小分子化合物

  • A 基于cMAP分析的热图显示了10个细胞系中富集得分最高的前10种化合物。
  • B 前10种化合物的描述。
  • C 显示了这10种化合物的化学结构。


图 7.通过机器学习方法鉴定CKD相关CAVD的潜在诊断生物标志物

  • A 维恩图显示了CKD相关分泌蛋白,CAVD DEG和CAVD关键模块基因的17个重叠基因。
  • B, C 诊断生物标志物(n = 8)的最小值(B)和λ值(C)通过LASSO logistic回归算法进行识别。
  • D 选取CAVD中17个基因的MeanReductionGini和6个评分大于2.0的生物标志物的RF算法。
  • E 维恩图显示了LASSO和RF算法之间的两个共同基因,它们被确定为CKD相关CAVD中的枢纽基因。

image.png


图 8.诊断列线图模型和疗效评估的构建

  • A 列线图是根据诊断生物标志物构建的。
  • B-D 每个候选生物标志物(包括SLPI(B)和MMP9(C))的诊断性能的ROC曲线,以及为CKD相关CAVD构建的列线图模型(D)。
  • E CKD相关CAVD中列线图模型预测的校准曲线。虚线标记为“理想”,代表标准曲线,代表理想模型的完美预测。虚线标记为“表观”,表示未校准的预测曲线,而实线标记为“偏差校正”,表示校准的预测曲线。
  • F 列线图模型的 DCA。黑线标记为“无”,代表假设没有患者患有CAVD的净收益。灰线标记为“全部”,表示假设所有患者都有CAVD的净获益,紫线标记为“列线图”,表示根据列线图模型预测的CAVD诊断值识别CKD相关CAVD的假设的净收益。
  • G 来自 GEO 数据库的列线图模型在预测硬化性主动脉瓣患者方面的诊断性能的 ROC 曲线。

image.png

图 9.CAVD中的免疫细胞浸润分析

  • A CAVD和对照组之间免疫细胞比例的堆叠直方图。
  • B 小提琴图显示了CAVD和对照组之间22种免疫细胞的比较。红色和蓝色星星分别代表CAVD组中免疫细胞比例的增加和减少。
  • C 热图揭示了22种免疫细胞浸润在p<0.05阈值上的相关性。
  • D 代表差异浸润免疫细胞与两个枢纽基因在p < 0.05阈值上的关联的相关图。

image.png

图 10.验证钙化主动脉瓣样本中枢纽基因的表达,并评估列线图模型诊断性能

  • A RT-qPCR 显示钙化主动脉瓣样本中 SLPI 和 MMP9 的 mRNA 水平升高。
  • B ELISA 分析显示 CKD 和 CAVD 患者以及 CKD 伴 CAVD 患者的血清 SLPI 和 MMP9 水平升高。
  • C 列线图A是基于诊断生物标志物开发的,用于预测CAVD的风险。
  • D 每个候选生物标志物(SLPI 和 MMP9)和列线图 A 的预测性能的 ROC 曲线。
  • E CAVD 患者列线图 A 预测的校准曲线。列线图 A 的 F DCA。
  • G 列线图 B 是基于诊断生物标志物开发的,用于预测 CKD 患者患有 CAVD 的风险。
  • H 每个候选生物标志物(SLPI 和 MMP9)和列线图 B 的预测性能的 ROC 曲线。
  • I 列线图 B 预测在 CKD 伴 CAVD 患者中的校准曲线。
  • J DCA 用于列线图 B

小总结

  • 这是一篇很典型的双疾病免疫靶点筛选的生信文章,本篇的思维导图对于研究思路的整体框架清晰明了:CAVD整合数据集、CAVD差异分析和WGCNA分析取交集;CKD外周血和组织的差异表达基因取并集;PPI网络-cMAP分析-功能通路富集分析;LASSO回归和随机森林;构建诊断模型;验证
  • 对于小分子药物,cMAP分析小伙伴们可以学习一下,给传统的筛选疾病生物标志物增添几分“色彩”


目录
相关文章
|
6月前
|
机器学习/深度学习 Go 数据库
中科院二区7.7分的纯生信|还是铁死亡,还是肿瘤预后模型
该研究发表在2023年8月的《Computers in Biology and Medicine》杂志上,构建了一个基于铁死亡基因的乳腺癌预后模型。研究发现11个与乳腺癌生存相关的基因,建立了预测模型,并通过TCGA和GEO数据集验证。模型显示良好预测能力,揭示了铁死亡在乳腺癌中的关键角色,特别是JUN基因。此外,还鉴别出10个潜在的免疫治疗靶点,为乳腺癌治疗提供了新方向。
109 2
|
3月前
|
传感器 机器学习/深度学习 数据采集
2022年第十一届认证杯数学中国数学建模国际赛小美赛:C 题 对人类活动进行分类 建模方案及代码实现
本文提供了2022年第十一届认证杯数学中国数学建模国际赛小美赛C题"对人类活动进行分类"的建模方案和Python代码实现,包括数据预处理、特征提取、LSTM网络模型构建和训练评估过程。
58 11
2022年第十一届认证杯数学中国数学建模国际赛小美赛:C 题 对人类活动进行分类 建模方案及代码实现
|
2月前
|
机器学习/深度学习 监控 数据可视化
【BetterBench博士】2024年中国研究生数学建模竞赛 E题:高速公路应急车道紧急启用模型 问题分析、数学模型及Python代码
2024年中国研究生数学建模竞赛E题要求建立高速公路应急车道紧急启用模型,以缓解特定路段的拥堵问题。题目提供了四个视频观测点的数据,需分析交通流参数随时间的变化规律,建立拥堵预警模型,并验证模型有效性。此外,还需设计合理的应急车道启用规则和算法,优化视频监控点布局,以提升决策科学性和成本效益。涉及视频数据处理、非线性动态系统建模和机器学习等技术。适合交通工程、数学、计算机科学等多个专业学生参与。需利用Python等工具进行数据处理和建模。具体问题包括统计参数变化、建立拥堵模型、验证模型有效性、设计启用规则和优化监控点布局。
840 12
【BetterBench博士】2024年中国研究生数学建模竞赛 E题:高速公路应急车道紧急启用模型 问题分析、数学模型及Python代码
|
3月前
|
传感器 人工智能
上交、智源、北大等提出空间大模型SpatialBot
【8月更文挑战第29天】近年来,人工智能技术迅猛发展,视觉语言模型(VLMs)在2D图像理解上取得显著成就,但在空间理解方面仍面临挑战。上交、智源、北大等机构的研究人员提出了结合RGB和深度图像的空间大模型SpatialBot,以提升空间理解精度。通过使用包含多层次深度信息的SpatialQA数据集进行训练,并基于全面评估基准SpatialBench测试,SpatialBot在多个任务中表现出色,显著提升了空间理解能力。然而,其应用仍受限于部署成本和数据集泛化能力等问题。论文链接: https://arxiv.org/abs/2406.13642
46 3
|
3月前
|
机器学习/深度学习 数据挖掘
|
3月前
|
数据可视化 决策智能 Python
【江西省研究生数学建模竞赛】题目之二 国际“合作-冲突”的演化规律研究 建模方案及参考文献
本文介绍了江西省研究生数学建模竞赛题目之二“国际‘合作-冲突’的演化规律研究”的建模方案和参考文献,探讨了如何通过博弈论和决策树模型来分析和预测国家间的合作与冲突行为,并提出了评估国际环境和应对突发事件的策略。
44 0
【江西省研究生数学建模竞赛】题目之二 国际“合作-冲突”的演化规律研究 建模方案及参考文献
|
3月前
【2023 华数杯全国大学生数学建模竞赛】 A题 隔热材料的结构优化控制研究 问题分析及完整论文
本文提供了2023年华数杯全国大学生数学建模竞赛A题的完整论文,深入分析了隔热材料的结构优化控制研究,包括建立数学模型、求解单根纤维的热导率、优化织物结构参数以及考虑对流换热影响的模型调整,旨在开发出具有更优隔热性能的新型织物。
63 0
【2023 华数杯全国大学生数学建模竞赛】 A题 隔热材料的结构优化控制研究 问题分析及完整论文
|
3月前
|
机器学习/深度学习 算法 Python
【2023 华数杯全国大学生数学建模竞赛】 A题 隔热材料的结构优化控制研究 问题分析、模型建立及参考文献
本文提供了2023年华数杯全国大学生数学建模竞赛A题的详细分析、数学模型建立及参考文献,聚焦于隔热材料的结构优化控制研究,旨在解决单根隔热材料纤维的热导率测量难题,并探讨如何通过优化织物编织结构来提升隔热性能。
28 0
【2023 华数杯全国大学生数学建模竞赛】 A题 隔热材料的结构优化控制研究 问题分析、模型建立及参考文献
|
6月前
|
数据可视化 Go
快刀斩乱麻,二区7分今年9月发表,孟德尔随机化如何做药靶筛选?
该文章是2023年9月发表在《Journal of Translational Medicine》的孟德尔随机化研究,探索风湿性关节炎(RA)的潜在药物靶点。研究通过遗传学方法鉴定,发现7个可能的药物靶点,这些基因与免疫功能相关,有望为RA药物开发提供新方向,节省成本,并增加临床试验成功的可能性。分析过程包括MR分析、共定位、功能富集和药物预测等步骤。
100 0
|
6月前
|
算法 数据可视化 数据挖掘
JCR一区10.9分|单细胞:有一手数据的肿瘤课题组怎么冲高分文章
这篇文章介绍了在《肿瘤免疫疗法》杂志上发表的一项研究,该研究利用单细胞RNA测序技术揭示了肝细胞癌(HCC)中FABP1(脂肪酸结合蛋白1)依赖的免疫抑制环境。研究分析了II期和III期HCC患者样本的免疫细胞,发现FABP1在III期HCC的肿瘤相关巨噬细胞(TAMs)中过度表达,并与免疫抑制有关。FABP1与PPARG(过氧化物酶体增殖物激活受体伽玛)相互作用,促进了HCC中的脂肪酸氧化,进而影响免疫应答。
86 0