今天给大家分享一篇IF=7.4
的肿瘤分型的文章,2023年6月发表在Journal of Translational Medicine:Screening of immune-related secretory proteins linking chronic kidney disease with calcific aortic valve disease based on comprehensive bioinformatics analysis and machine learning,基于综合生物信息学分析和机器学习的慢性肾脏病与钙化性主动脉瓣疾病免疫相关分泌蛋白筛选
摘要
- 背景:慢性肾脏病(
CKD
)是最重要的心血管危险因素之一,在钙化性主动脉瓣疾病(CAVD
)等各种心血管疾病中起着至关重要的作用。我们的目标是探索可能涉及CAVD发病机制的CKD相关基因,并发现诊断CAVD的CKD候选生物标志物。 - 方法:从GEO数据库中获得了3个CAVD,1个CKD-PBMC和1个CKD-肾脏表达谱数据集。首先,为检测CAVD关键基因和CKD相关分泌蛋白,采用差异表达分析和WGCNA进行检测。采用蛋白质-蛋白质相互作用(
PPI
)、功能富集和cMAP分析揭示CKD相关致病基因和CKD相关CAVD的潜在机制,以及CAVD治疗的潜在药物。然后,采用LASSO回归和随机森林等机器学习算法筛选候选生物标志物,构建诊断列线图,预测CKD相关CAVD。此外,采用ROC曲线、校准曲线和决策曲线分析对列线图的诊断性能进行评价。最后,利用CIBERSORT算法探索CAVD中的免疫细胞浸润。 - 结果:集成的CAVD数据集通过交叉差异表达和WGCNA分析确定了124个CAVD关键基因。通过CKD-PBMC/肾脏数据集的差异表达分析筛选出983个CKD相关分泌蛋白。PPI分析确定了两个包含76个节点的关键模块,被认为是CAVD中CKD相关致病基因,它们主要通过富集分析富集炎症和免疫调节。cMAP分析显示美替拉酮是一种更潜在的CAVD治疗药物。CAVD关键基因与CKD相关分泌蛋白之间有17个基因重叠,选择9个枢纽基因作为候选生物标志物,通过机器学习开发具有理想诊断性能的列线图。此外,SLPI / MMP9表达模式在我们的外部队列中得到证实,列线图可以作为区分CAVD的新诊断模型。最后,免疫细胞浸润结果揭示了CAVD的免疫失调,SLPI/MMP<>与侵袭性免疫细胞显著相关。
- 结论:我们揭示了CKD相关CAVD的炎症免疫途径,并开发了基于SLPI / MMP9的CAVD诊断列线图,为未来基于血清的CKD诊断和CAVD治疗干预提供了新的见解。
分析流程
结果
图 2.CAVD数据集的整合和CAVD数据集的差异表达分析
- A 批处理效应校正前三个原始 CAVD 数据集的 PCA。
- B 批量效应校正后集成CAVD数据集的PCA。
- C 表示集成 CAVD 数据集中 CAVD DEG 的火山图。上调基因以红点表示,而下调基因以蓝点表示。
- D 热图显示了集成CAVD数据集中前30个上调和30个下调DEG。
图 3.通过WGCNA,关键模块基因和DEG交集
- A 利用无标度拓扑模型确定最佳β值,根据平均连通性和尺度独立性选择β = 5作为软阈值。
- B 显示基因树状图和模块特征基因的网络热图。
- C 表示模块特征基因的簇树状图。
- D 揭示模块特征基因与CAVD状态之间关系的热图。介绍了模块特征基因的相关性(上)和p值(下)与CAVD的状态。与CAVD相关的粉红色和黄色模块分别表现出最高和最低的相关系数,被确定为CAVD的关键模块。
- E 粉色模块成员与粉色模块中基因的基因意义的相关图。
- F 黄色模块成员与黄色模块中基因的基因意义的相关图。
- G 通过维恩图选取关键模块基因与DEGs的交集,共鉴定出CAVD中124个关键基因。
图 4.PMBC和CKD肾组织中分泌蛋白的差异表达分析
- A 火山图揭示了CKD-PMBC数据集中的DEG。
- B 代表 CKD-PBMC 数据集中前 30 个上调和 30 个下调 DEG 的热图。
- C 显示 CKD-肾脏数据集中 DEG 的火山图。
- D 热图显示 CKD-肾脏数据集中前 30 个上调和 30 个下调 DEG。
- E CKD-PMBC DEGs与通过维恩图编码分泌蛋白的基因的交集。
- F 通过维恩图将CKD-肾脏DEG与编码分泌蛋白的基因相交,共鉴定出983个CKD相关分泌蛋白。
图 5.CKD相关分泌蛋白与CAVD关键基因之间的PPI分析,富集分析
- A 基于Cytoscape插件MCODE分析的模块1基因的PPI网络,得分最高。鲑鱼节点被标记为CAVD关键基因的成员,黄色节点被标记为CKD相关分泌蛋白的成员,而红色节点被标记为两组的共同基因。
- B 根据MCODE分析,模块1基因的PPI网络得分最高。
- C–F 显示 GO 富集分析结果的气泡图,包括模块 2 和模块 2 中包含的基因的生物过程 (C)、细胞成分 (D) 和分子功能 (E)。
- F Circos 图表示模块 1 和模块 2 中包含的基因的 KEGG 分析结果。
图 6.通过cMAP分析筛选用于治疗CAVD的潜在小分子化合物
- A 基于cMAP分析的热图显示了10个细胞系中富集得分最高的前10种化合物。
- B 前10种化合物的描述。
- C 显示了这10种化合物的化学结构。
图 7.通过机器学习方法鉴定CKD相关CAVD的潜在诊断生物标志物
- A 维恩图显示了CKD相关分泌蛋白,CAVD DEG和CAVD关键模块基因的17个重叠基因。
- B, C 诊断生物标志物(n = 8)的最小值(B)和λ值(C)通过LASSO logistic回归算法进行识别。
- D 选取CAVD中17个基因的MeanReductionGini和6个评分大于2.0的生物标志物的RF算法。
- E 维恩图显示了LASSO和RF算法之间的两个共同基因,它们被确定为CKD相关CAVD中的枢纽基因。
图 8.诊断列线图模型和疗效评估的构建
- A 列线图是根据诊断生物标志物构建的。
- B-D 每个候选生物标志物(包括SLPI(B)和MMP9(C))的诊断性能的ROC曲线,以及为CKD相关CAVD构建的列线图模型(D)。
- E CKD相关CAVD中列线图模型预测的校准曲线。虚线标记为“理想”,代表标准曲线,代表理想模型的完美预测。虚线标记为“表观”,表示未校准的预测曲线,而实线标记为“偏差校正”,表示校准的预测曲线。
- F 列线图模型的 DCA。黑线标记为“无”,代表假设没有患者患有CAVD的净收益。灰线标记为“全部”,表示假设所有患者都有CAVD的净获益,紫线标记为“列线图”,表示根据列线图模型预测的CAVD诊断值识别CKD相关CAVD的假设的净收益。
- G 来自 GEO 数据库的列线图模型在预测硬化性主动脉瓣患者方面的诊断性能的 ROC 曲线。
图 9.CAVD中的免疫细胞浸润分析
- A CAVD和对照组之间免疫细胞比例的堆叠直方图。
- B 小提琴图显示了CAVD和对照组之间22种免疫细胞的比较。红色和蓝色星星分别代表CAVD组中免疫细胞比例的增加和减少。
- C 热图揭示了22种免疫细胞浸润在p<0.05阈值上的相关性。
- D 代表差异浸润免疫细胞与两个枢纽基因在p < 0.05阈值上的关联的相关图。
图 10.验证钙化主动脉瓣样本中枢纽基因的表达,并评估列线图模型诊断性能
- A RT-qPCR 显示钙化主动脉瓣样本中 SLPI 和 MMP9 的 mRNA 水平升高。
- B ELISA 分析显示 CKD 和 CAVD 患者以及 CKD 伴 CAVD 患者的血清 SLPI 和 MMP9 水平升高。
- C 列线图A是基于诊断生物标志物开发的,用于预测CAVD的风险。
- D 每个候选生物标志物(SLPI 和 MMP9)和列线图 A 的预测性能的 ROC 曲线。
- E CAVD 患者列线图 A 预测的校准曲线。列线图 A 的 F DCA。
- G 列线图 B 是基于诊断生物标志物开发的,用于预测 CKD 患者患有 CAVD 的风险。
- H 每个候选生物标志物(SLPI 和 MMP9)和列线图 B 的预测性能的 ROC 曲线。
- I 列线图 B 预测在 CKD 伴 CAVD 患者中的校准曲线。
- J DCA 用于列线图 B
小总结
- 这是一篇很典型的双疾病免疫靶点筛选的生信文章,本篇的思维导图对于研究思路的整体框架清晰明了:CAVD整合数据集、CAVD差异分析和WGCNA分析取交集;CKD外周血和组织的差异表达基因取并集;PPI网络-cMAP分析-功能通路富集分析;LASSO回归和随机森林;构建诊断模型;验证
- 对于小分子药物,cMAP分析小伙伴们可以学习一下,给传统的筛选疾病生物标志物增添几分“色彩”