一区9.3分top刊|多组学SNF数据融合的正确打开方式

简介: 这篇研究文章聚焦于多组学在揭示胎盘功能障碍中的作用,发表于2023年9月的《BMC Medicine》,IF为9.3。研究通过整合转录组学、蛋白质组学和代谢组学数据,鉴定出与常见产科综合征(如先兆子痫、胎儿生长受限和自发性早产)无关的胎盘集群。使用人工智能的无偏相似性网络融合(SNF)方法,分析发现四个不同的胎盘簇,其中早发性先兆子痫的簇显示强烈的功能障碍模式,而以自发性早产为主的簇则较弱。研究结果增加了对病理过程的理解,可能促进个性化干预措施的发展。

今天给大家分享一篇IF=9.3的多组学的文章,2023年9月发表在BMC Medicine:Integrated unbiased multiomics defines disease-independent placental clusters in common obstetrical syndromes,整合无偏见的多组学鉴定常见产科综合征中与疾病无关的胎盘集群

image.png

摘要

  • 背景:胎盘功能障碍是影响人类妊娠的常见综合征的根本原因,例如先兆子痫 (PE)、胎儿生长受限 (FGR) 和自发性早产 (sPTD),但其定义仍然不明确。这些常见但临床上不同的产科综合征具有相似的胎盘组织病理学模式,而每种综合征中的个体表现出独特的分子变化,挑战我们的理解并阻碍我们预防和治疗这些综合征的能力。
  • 方法:利用我们广泛的生物库,我们确定了患有严重 PE ( n  = 75)、FGR ( n  = 40)、FGR 伴高血压疾病 (FGR + HDP; n  = 33)、sPTD ( n  = 72) 和两名简单对照的女性组、足月组 ( n  = 113) 和早产儿组,无 PE、FGR 或 sPTD ( n  = 16)。我们使用胎盘活检进行转录组学、蛋白质组学、代谢组学数据和组织学评估。经过传统的成对比较后,我们部署了基于人工智能的无偏相似性网络融合(SNF)来整合数据类型并识别组学定义的胎盘簇。我们使用贝叶斯模型选择来比较组织病理学特征和疾病状况与SNF 簇之间的关联。
  • 结果:基于疾病的成对比较显示出相对较小的差异,可能反映了临床综合征的异质性。因此,我们部署了无偏倚、基于组学的 SNF 方法。我们的分析得出了四个不同的簇,它们主要由特定的综合征主导。值得注意的是,以早发性 PE 为主的簇表现出强烈的胎盘功能障碍模式,而以 sPTD 为主的簇中的损伤模式较弱。与预先定义的疾病组相比,SNF 定义的簇与组织病理学表现出更好的相关性。
  • 结论:我们的结果表明,基于组学的综合 SNF 独特地重新分类了常见产科综合征背后的胎盘功能障碍模式,提高了我们对病理过程的理解,并可以促进对更个性化干预措施的探索。

结果

image.png

图1 FGR + HDP 组与所有组学数据类型的对照组的成对比较。

  • A – D火山图显示 log 2 FC(x轴)和 -log 10 p 值(y轴),用于 FGR + HDP( n  = 33)和对照(n  = 113)组的比较。A RNA、B miRNA、C蛋白质和D代谢物。每个点代表一种分析物。FDR < 0.05 的分析物以红色表示。浅灰色线代表(垂直)log 2 FC > 1 或 < − 1,(水平)FDR < 0.05。每种模式的 FDR 最低的五种分析物均已标记。
  • E – H使用每种数据类型中 FDR 最低的 25 个 DE 分析物进行分层聚类。E RNA、F miRNA、G蛋白和H代谢物。每列代表一个胎盘。每一行对应一种分析物。色标代表标准化的表达水平。红色表示级别较高;蓝色表示较低水平。胎龄和临床状况的分布显示在热图顶部。差异表达模型以孕龄、种族、母亲孕前体重指数、母亲吸烟状况、分娩类型、婴儿性别、临产起始和临产情况为条件。FGR + HDP,胎儿生长受限合并妊娠期高血压疾病;FC,倍数变化;FDR,错误发现率,使用 Benjamini-Hochberg 程序计算


图2 相似性网络融合识别临床相关的集群。

  • A 相似性网络融合 (SNF) 后的胎盘相似性矩阵。结合所有分子数据类型的无监督聚类确定了队列中的四个聚类(n  = 271),用虚线划分。
  • B 条形图显示 SNF 集群中临床病例的分布。左边——数字。对——百分比。右侧的条形代表基于整个研究队列的预期比例。该表显示了每个 SNF 簇内每个临床组的胎盘百分比。*与所有其他簇不同,**与簇 III 和 IV 不同。卡方检验与事后配对 Fisher 精确检验。通过 Holm-Bonferroni 程序调整事后 Fisher 精确检验p值以进行多重比较。
  • C各集群中早发性肺栓塞病例分布的饼图。
  • D SNF 簇中早发型 (< 34)与晚发型 PE (≥ 34 周)的比例。Control-PT,控制早产;PE、先兆子痫;FGR,胎儿生长受限;FGR + HDP,胎儿生长受限合并妊娠期高血压疾病;sPTD-- 自发性早产


图3 跨组学数据类型的 SNF 簇标记。

  • 热图显示了每个簇 AUROC 最高的 10 种组学分析物与其余顶级 DE 分析物的标准化表达水平。A RNA、B miRNA、C蛋白质和D代谢物。每列代表一个胎盘,按簇分组。每行对应一种分析物,根据 AUROC 值进行排名。色标代表标准化的表达水平。红色表示级别较高;蓝色表示较低水平


图4 SNF 簇中已知胎盘功能障碍分析物的表达水平。
热图显示了 SNF 簇中已知胎盘功能障碍标记物的标准化平均表达水平。在 38 种分析物中的 27 种中,簇 II 和 III 具有相反的极端表达水平。B对 HDP 进行相同的分析,其中包括妊娠期间患有任何类型高血压的胎盘(严重 PE 和 FGR + HDP 组)。同样,簇 II 和 III 具有相反的极端表达水平。分析物根据其在簇 III 中的表达水平进行排序。色标代表标准化的表达水平。红色表示级别较高;蓝色表示较低水平。HDP-- 妊娠高血压疾病

image.png

图5 主要组织病理学诊断和MVM病变在临床疾病和SNF簇中的比例。

  • A 病理学诊断和 B MVM 病变在临床疾病(左图)和 SNF 簇(右图)中的比例;病理诊断数据从病理报告中提取,MVM 病变数据基于石蜡包埋胎盘活检分析。MVM,母体血管灌注不良;FVM,胎儿血管灌注不良;AI,急性炎症;CI,慢性炎症;DVH,远端绒毛发育不全;AVM,加速绒毛成熟。 p  < 0.05; p  < 0.01; p  < 0.001;红色——与所有其他群体不同。卡方检验与事后配对 Fisher 精确检验。通过 Holm-Bonferroni 程序调整事后 Fisher 精确检验p值以进行多重比较

image.png

图6 比较预测组织病理学的贝叶斯信息标准评分。

  • 该表显示了每个回归模型在预测组织病理学方面的 BIC 评分。分数越低表明模型性能越好。颜色深浅代表最佳模型和次佳模型之间证据的大小。较深的阴影表示支持模型优越性的更有力证据。柱形图描绘了三个回归模型之间BIC得分差异的绝对值:模型1—SNF聚类(四个类别);模型2——疾病状况(六类);模型 3——疾病状况,我们将两个疾病对照组和 FGR + HDP 与严重 PE 组结合起来,形成相等数量的组(四类)。BIC,贝叶斯信息准则;MVM,母体血管灌注不良;FVM,胎儿血管灌注不良;AI,急性炎症;CI,慢性炎症;DVH,远端绒毛发育不全;AVM-- 加速绒毛成熟

image.png

图7 SNF 簇的 RNA 经典途径分析。
点图显示每个簇与其他簇的前 10 个富集典型途径(Reactome),按基因比率(x轴)排名,基因比率是发现在每个途径(y轴)中富集的 RNA 的比例。色标表示 FDR,点大小表示在通路中发现的数据集中的 RNA 数量。FDR = 错误发现率,Benjamini-Hochberg 程序

image.png

图8 使用弹性网络回归和因果模型进行 SNF 聚类标签预测。

  • A由弹性网络多项式逻辑回归选择的特征,用于在 10 次重复的 10 倍交叉验证中预测聚类标签。条形图表示从 100 个经过训练的模型中选择每种分析物的次数。仅显示至少一半模型中选择的分析物。
  • B、C因果图形模型,描述与聚类标签 ( B ) 直接相关的预测性临床变量和分析物,特别是在聚类 III ( C ) 中,考虑到所有其他强预测性临床变量和分析物。边缘厚度表示 100 个 bootstrap 样本中因果模型中每个邻接的稳定性。不同的边类型表示不同的因果信息,通过FCI-Max算法推断:A → B表示A导致B,A B表示A和B存在潜在混杂因素,A o→ B表示B不是 a A 的原因,但不清楚是 A 导致 B 还是潜在的混杂因素导致 A 和 B,并且 A o-o B 表明 A 和 B 之间存在相互作用,但相互作用的因果方向无法确定。因果图模型中的邻接被控制在 FDR < 0.05,使用 Benjamini-Hochberg 程序计算

小总结

  • 六个数据:严重PE、FGR、FGR+HDP、sPTD,足月和无PE、FGR和sPTD的早产儿两个对照组。
  • 捋一捋:四个组学数据的差异分析(火山图和热图),SNF分簇,簇间多重比较检验,簇间ROC后计算AUC绘制热图筛选标志物,四个簇的表达水平排序,检验了各病变在不同簇间的诊断效果,构建回归评分模型,KEGG通路富集分析,最后构建了个弹性网络回归和因果模型进行验证。
  • 本篇课题是做胎盘分析的,方向可能比较小众,但是行文思路和方法学值得学习,SNF分型+弹性网络和因果模型验证也同样适用于肿瘤研究,非常的新颖~




目录
相关文章
|
6月前
|
机器学习/深度学习 数据挖掘 Go
JCR一区5.2分|RNA修饰如何打开格局,一篇非肿瘤m6A带入门
这篇文章探讨了m6A修饰在绝经后骨质疏松症(PMOP)中的作用,通过生物信息学分析和实验验证,鉴定了7个m6A调节剂作为诊断标志物。研究发现这些调节剂可能影响疾病的亚型分类,并提出了m6A模式作为潜在的治疗靶点。文章提供了PMOP新的分子机制理解,为未来诊断和免疫治疗策略提供了依据。
79 0
|
6月前
求幂级数展开的部分和 (20 分)新鲜出炉!!!
求幂级数展开的部分和 (20 分)新鲜出炉!!!
43 0
|
5月前
|
机器学习/深度学习
填补AlphaFold3空白,字节跳动提出物理引导的方法让蛋白质动起来
【6月更文挑战第8天】字节跳动研究人员推出ConfDiff,一种融合物理引导的蛋白质构象生成方法,弥补AlphaFold3在动态构象生成上的不足。ConfDiff结合力引导网络和数据驱动模型,提高生成构象的真实性和准确性。实验显示,它在预测准确性和多样性上超越现有方法,助力蛋白质功能理解与药物研发。然而,高计算成本和泛化能力限制仍是挑战。论文链接:http://arxiv.org/abs/2403.14088
73 9
|
6月前
|
Go 数据库 知识图谱
中科院一区7.9分top刊|好久不见,网络药理学(实验为主生信为辅)
`Phytomedicine` 杂志2023年6月发表了一篇关于网络药理学的文章,研究了肾康注射液(SKI)治疗糖尿病肾病(DKD)的机制,重点关注其通过Keap1/Nrf2/Ho-1信号通路对抗氧化应激的影响。研究表明,SKI可能通过调节氧化还原相关信号,减轻AGEs诱导的氧化应激,从而改善DKD。在动物实验中,SKI降低了DKD大鼠的尿蛋白、Scr水平,改善了肾功能和血脂,减少了氧化应激指标,并在细胞实验中显示了类似的效果,激活了Keap1/Nrf2/Ho-1通路。
189 1
|
数据采集 数据挖掘 数据处理
探索“数据菜谱”无限可能:首届Data-Juicer大模型数据竞赛
数据是LLaMA、Alpaca等大语言模型(LLM) 的“食物” ,你心中的大模型米其林菜单会是什么样呢?
|
Cloud Native Go 开发工具
如何让CSDN学习成就个人能力六边形全是100分:解析个人能力雷达图的窍门
如何让CSDN学习成就个人能力六边形全是100分:解析个人能力雷达图的窍门
297 0
|
6月前
|
数据可视化 Go
快刀斩乱麻,二区7分今年9月发表,孟德尔随机化如何做药靶筛选?
该文章是2023年9月发表在《Journal of Translational Medicine》的孟德尔随机化研究,探索风湿性关节炎(RA)的潜在药物靶点。研究通过遗传学方法鉴定,发现7个可能的药物靶点,这些基因与免疫功能相关,有望为RA药物开发提供新方向,节省成本,并增加临床试验成功的可能性。分析过程包括MR分析、共定位、功能富集和药物预测等步骤。
120 0
|
6月前
|
分布式计算 资源调度 大数据
一图胜千言:大数据入门必备的16张数据流转图(建议收藏)
一图胜千言:大数据入门必备的16张数据流转图(建议收藏)
563 0
|
定位技术
ArcGIS:如何进行缓冲区分析(以市区选择住房位置为例)?
ArcGIS:如何进行缓冲区分析(以市区选择住房位置为例)?
1020 0
|
机器学习/深度学习 存储 SQL
带你读《2022年开源大数据热力报告》——TOP项目热力跃迁逻辑研究
带你读《2022年开源大数据热力报告》——TOP项目热力跃迁逻辑研究
213 0