今天给大家介绍华中科技大学人工智能与自动化学院Xueming Liu课题组、哈佛医学院Joseph Loscalzo团队和伦斯勒理工学院Jianxi Gao课题组合作发表在 Nature Communication上的一篇文章“Robustness and lethality in multilayer biological molecular networks”。作者构建了人体多层生物分子网络模型并提出了一个框架来理解基因、蛋白质和代谢物之间的相互作用如何决定一个异质生物网络的鲁棒性。
1
研究背景
鲁棒性定义为系统在外界扰动或内在噪声存在的情况下仍保持自身功能的能力,这对大多数生物体的生存至关重要。以往的相关研究大多集中在孤立的分子网络上,如基因调控网络、蛋白质相互作用网络和代谢网络等。据生物体内的“中心法则”可知,不同生物分子之间联系紧密,共同决定着细胞的功能,如基因编码蛋白质,蛋白质调控基因的调控并参与代谢反应。如何整合多源数据并构建一个更能反应细胞内分子机制的多层生物分子网络模型并揭示其内在鲁棒机制是一个亟待解决的关键问题。针对该问题,论文构建了人体多层生物分子网络模型,根据分子间的影响关系提出了鲁棒性分析框架,并发现多层生物分子网络中对模型鲁棒性重要的基因更倾向于是生物上的关键基因,敲除基因调控网络中代谢疾病相关基因会对代谢网络鲁棒性造成较大伤害,验证了模型的有效性。
图 1多层生物分子网络模型中的级联失效过程
2
研究方法
2.1构建多层生物网络
作者分别构建了基因调控网络、蛋白质网络、代谢网络三层网络,根据基因与蛋白质的编码关系将基因调控网络中的基因与蛋白质相互作用网络中的蛋白质连接,从而在基因调控网络和蛋白质相互作用网络之间产生了双向的层间连接,最后通过挖掘数据库中大量代谢物与蛋白质的关系实现了蛋白质相互作用网络与代谢网络之间的互连,从而构建了三层有联系的异构网络。
2.2模拟多层生物网络的功能和鲁棒性
为了模拟多层生物网络的功能和鲁棒性,作者定义了一种模拟网络中扰动影响的级联失效机制。从分子角度来看,级联反应对应于一个过程,即一些受干扰的转录因子失去了调节其目标的能力,导致一些基因在调控网络中处于不受调控的状态,最终影响它们在蛋白质相互作用网络中编码的蛋白质的表达。这些蛋白质表达的改变反过来破坏新陈代谢的反应。
3
数据
基因调控网络有两种类型:一般的基因调控网络和三种组织特异性基因调控网络。作者使用Cheng et al等人建立的综合人类交互体构建蛋白质相互作用网络,由15906个蛋白质组成,有213874个边。代谢网络是通过挖掘来自STITCH数据库的生化-生化(代谢物-代谢物)相互作用,然后映射到人类代谢物数据库(HMDB)中的代谢物来构建的。基因调控网络和蛋白质相互作用网络之间有10255个双向层间连接。蛋白质和代谢物网络,有141283个层间连接将12039个蛋白质与1211个代谢物连接起来。
4
实验
在耦合的基因调控网络与蛋白质相互作用网络模型中,根据敲除基因调控网络中某基因对蛋白质相互作用网络鲁棒性的影响,定义了该基因的影响力分数。通过基因富集性分析发现,影响力分数更大的基因在关键基因和癌症基因中富集。并且通过与孤立的蛋白质相互作用网络对比,耦合模型中的富集性更高,表明影响力分数在识别参与关键细胞过程的基因方面具有更高的敏感性。
图2 耦合和非耦合情况的比较
在多层生物分子网络模型中,敲除基因调控网络中的基因会影响到蛋白质相互作用网络,从而进一步影响代谢网络。作者评估了敲除基因调控网络中基因对代谢层鲁棒性的影响,发现移除基因层中代谢疾病相关基因会对代谢层的鲁棒性造成更大的破坏。通过与度保留的随机删除实验对比,验证了该结果的统计有效性。
图 2针对与血脂异常相关的基因(红)比随机攻击(蓝)对代谢网络造成更大的破坏
为了确定真实生物分子网络的鲁棒性程度,作者考虑了多种版本的随机模型:(1)层内随机模型,即随机化过程发生在基因调控层、PPI层或代谢层内;(2)层间随机模型,基因-蛋白质或蛋白质-代谢物被随机重新连接。结果发现真实网络模型比随机模型具有更强的鲁棒性。
图 3比较真实生物多层网络和随机模型的鲁棒性
模拟大规模生物分子网络中基因失效的过程往往复杂且耗时,作者根据生成函数和渗流理论提出了一个解析框架,通过对里面公式的数值计算,可快速有效预测大鲁棒性规模生物分子网络中的级联失效过程合最终的鲁棒性大小,该预测结果与与仿真实验结果一致,验证了该框架的有效性。
图 4从一般基因调节网络(a)和特异性网络(b)中随机去除1 - p部分基因后,多层分子网络中最终功能节点的大小
5
结论
作者提出了一个包含调节、蛋白质和代谢相互作用的多层分子网络的极简模型,并为分析系统的鲁棒性建立了一个理论框架。设计了一个模拟的扰动过程来表征每个基因对整个系统的鲁棒性的贡献,发现有影响的基因在基本基因和癌症基因中丰富。预示了代谢层在代谢疾病相关的基因受到干扰时更容易受到影响。此外,发现实际网络比预期的鲁棒性更强。最后,从层内和层间的度分布出发,分析推导出多层生物网络的鲁棒性。这些结果可帮助理解遗传扰动后细胞内动力演化过程,验证了在复杂生物系统模型中包括相互作用的不同层次之间的耦合的重要性。