今天给大家分享一篇IF=9.3
的多组学的文章,2023年9月发表在BMC Medicine:Integrated unbiased multiomics defines disease-independent placental clusters in common obstetrical syndromes,整合无偏见的多组学鉴定常见产科综合征中与疾病无关的胎盘集群
摘要
- 背景:胎盘功能障碍是影响人类妊娠的常见综合征的根本原因,例如先兆子痫 (
PE
)、胎儿生长受限 (FGR
) 和自发性早产 (sPTD
),但其定义仍然不明确。这些常见但临床上不同的产科综合征具有相似的胎盘组织病理学模式,而每种综合征中的个体表现出独特的分子变化,挑战我们的理解并阻碍我们预防和治疗这些综合征的能力。 - 方法:利用我们广泛的生物库,我们确定了患有
严重 PE
( n = 75)、FGR
( n = 40)、FGR 伴高血压疾病
(FGR + HDP; n = 33)、sPTD
( n = 72) 和两名简单对照
的女性组、足月组
( n = 113) 和早产儿组,无 PE、FGR 或 sPTD
( n = 16)。我们使用胎盘活检进行转录组学、蛋白质组学、代谢组学数据和组织学评估。经过传统的成对比较后,我们部署了基于人工智能的无偏相似性网络融合(SNF)来整合数据类型并识别组学定义的胎盘簇。我们使用贝叶斯模型选择来比较组织病理学特征和疾病状况与SNF 簇之间的关联。 - 结果:基于疾病的成对比较显示出相对较小的差异,可能反映了临床综合征的异质性。因此,我们部署了无偏倚、基于组学的 SNF 方法。我们的分析得出了四个不同的簇,它们主要由特定的综合征主导。值得注意的是,以早发性 PE 为主的簇表现出强烈的胎盘功能障碍模式,而以 sPTD 为主的簇中的损伤模式较弱。与预先定义的疾病组相比,SNF 定义的簇与组织病理学表现出更好的相关性。
- 结论:我们的结果表明,基于组学的综合 SNF 独特地重新分类了常见产科综合征背后的胎盘功能障碍模式,提高了我们对病理过程的理解,并可以促进对更个性化干预措施的探索。
结果
图1 FGR + HDP 组与所有组学数据类型的对照组的成对比较。
- A – D火山图显示 log 2 FC(x轴)和 -log 10 p 值(y轴),用于 FGR + HDP( n = 33)和对照(n = 113)组的比较。A RNA、B miRNA、C蛋白质和D代谢物。每个点代表一种分析物。FDR < 0.05 的分析物以红色表示。浅灰色线代表(垂直)log 2 FC > 1 或 < − 1,(水平)FDR < 0.05。每种模式的 FDR 最低的五种分析物均已标记。
- E – H使用每种数据类型中 FDR 最低的 25 个 DE 分析物进行分层聚类。E RNA、F miRNA、G蛋白和H代谢物。每列代表一个胎盘。每一行对应一种分析物。色标代表标准化的表达水平。红色表示级别较高;蓝色表示较低水平。胎龄和临床状况的分布显示在热图顶部。差异表达模型以孕龄、种族、母亲孕前体重指数、母亲吸烟状况、分娩类型、婴儿性别、临产起始和临产情况为条件。FGR + HDP,胎儿生长受限合并妊娠期高血压疾病;FC,倍数变化;FDR,错误发现率,使用 Benjamini-Hochberg 程序计算
图2 相似性网络融合识别临床相关的集群。
- A 相似性网络融合 (SNF) 后的胎盘相似性矩阵。结合所有分子数据类型的无监督聚类确定了队列中的四个聚类(n = 271),用虚线划分。
- B 条形图显示 SNF 集群中临床病例的分布。左边——数字。对——百分比。右侧的条形代表基于整个研究队列的预期比例。该表显示了每个 SNF 簇内每个临床组的胎盘百分比。*与所有其他簇不同,**与簇 III 和 IV 不同。卡方检验与事后配对 Fisher 精确检验。通过 Holm-Bonferroni 程序调整事后 Fisher 精确检验p值以进行多重比较。
- C各集群中早发性肺栓塞病例分布的饼图。
- D SNF 簇中早发型 (< 34)与晚发型 PE (≥ 34 周)的比例。Control-PT,控制早产;PE、先兆子痫;FGR,胎儿生长受限;FGR + HDP,胎儿生长受限合并妊娠期高血压疾病;sPTD-- 自发性早产
图3 跨组学数据类型的 SNF 簇标记。
- 热图显示了每个簇 AUROC 最高的 10 种组学分析物与其余顶级 DE 分析物的标准化表达水平。A RNA、B miRNA、C蛋白质和D代谢物。每列代表一个胎盘,按簇分组。每行对应一种分析物,根据 AUROC 值进行排名。色标代表标准化的表达水平。红色表示级别较高;蓝色表示较低水平
图4 SNF 簇中已知胎盘功能障碍分析物的表达水平。
热图显示了 SNF 簇中已知胎盘功能障碍标记物的标准化平均表达水平。在 38 种分析物中的 27 种中,簇 II 和 III 具有相反的极端表达水平。B对 HDP 进行相同的分析,其中包括妊娠期间患有任何类型高血压的胎盘(严重 PE 和 FGR + HDP 组)。同样,簇 II 和 III 具有相反的极端表达水平。分析物根据其在簇 III 中的表达水平进行排序。色标代表标准化的表达水平。红色表示级别较高;蓝色表示较低水平。HDP-- 妊娠高血压疾病
图5 主要组织病理学诊断和MVM病变在临床疾病和SNF簇中的比例。
- A 病理学诊断和 B MVM 病变在临床疾病(左图)和 SNF 簇(右图)中的比例;病理诊断数据从病理报告中提取,MVM 病变数据基于石蜡包埋胎盘活检分析。MVM,母体血管灌注不良;FVM,胎儿血管灌注不良;AI,急性炎症;CI,慢性炎症;DVH,远端绒毛发育不全;AVM,加速绒毛成熟。 p < 0.05; p < 0.01; p < 0.001;红色——与所有其他群体不同。卡方检验与事后配对 Fisher 精确检验。通过 Holm-Bonferroni 程序调整事后 Fisher 精确检验p值以进行多重比较
图6 比较预测组织病理学的贝叶斯信息标准评分。
- 该表显示了每个回归模型在预测组织病理学方面的 BIC 评分。分数越低表明模型性能越好。颜色深浅代表最佳模型和次佳模型之间证据的大小。较深的阴影表示支持模型优越性的更有力证据。柱形图描绘了三个回归模型之间BIC得分差异的绝对值:模型1—SNF聚类(四个类别);模型2——疾病状况(六类);模型 3——疾病状况,我们将两个疾病对照组和 FGR + HDP 与严重 PE 组结合起来,形成相等数量的组(四类)。BIC,贝叶斯信息准则;MVM,母体血管灌注不良;FVM,胎儿血管灌注不良;AI,急性炎症;CI,慢性炎症;DVH,远端绒毛发育不全;AVM-- 加速绒毛成熟
图7 SNF 簇的 RNA 经典途径分析。
点图显示每个簇与其他簇的前 10 个富集典型途径(Reactome),按基因比率(x轴)排名,基因比率是发现在每个途径(y轴)中富集的 RNA 的比例。色标表示 FDR,点大小表示在通路中发现的数据集中的 RNA 数量。FDR = 错误发现率,Benjamini-Hochberg 程序
图8 使用弹性网络回归和因果模型进行 SNF 聚类标签预测。
- A由弹性网络多项式逻辑回归选择的特征,用于在 10 次重复的 10 倍交叉验证中预测聚类标签。条形图表示从 100 个经过训练的模型中选择每种分析物的次数。仅显示至少一半模型中选择的分析物。
- B、C因果图形模型,描述与聚类标签 ( B ) 直接相关的预测性临床变量和分析物,特别是在聚类 III ( C ) 中,考虑到所有其他强预测性临床变量和分析物。边缘厚度表示 100 个 bootstrap 样本中因果模型中每个邻接的稳定性。不同的边类型表示不同的因果信息,通过FCI-Max算法推断:A → B表示A导致B,A ↔ B表示A和B存在潜在混杂因素,A o→ B表示B不是 a A 的原因,但不清楚是 A 导致 B 还是潜在的混杂因素导致 A 和 B,并且 A o-o B 表明 A 和 B 之间存在相互作用,但相互作用的因果方向无法确定。因果图模型中的邻接被控制在 FDR < 0.05,使用 Benjamini-Hochberg 程序计算
小总结
- 六个数据:严重PE、FGR、FGR+HDP、sPTD,足月和无PE、FGR和sPTD的早产儿两个对照组。
- 捋一捋:四个组学数据的差异分析(火山图和热图),SNF分簇,簇间多重比较检验,簇间ROC后计算AUC绘制热图筛选标志物,四个簇的表达水平排序,检验了各病变在不同簇间的诊断效果,构建回归评分模型,KEGG通路富集分析,最后构建了个弹性网络回归和因果模型进行验证。
- 本篇课题是做胎盘分析的,方向可能比较小众,但是行文思路和方法学值得学习,
SNF分型+弹性网络和因果模型验证
也同样适用于肿瘤研究,非常的新颖~