今天给大家介绍Agnieszka Wołos等人在Science上发表的文章“Synthetic connectivity, emergence, and self-regeneration in the network of prebiotic chemistry”。前生命化学的挑战是追踪少数原始底物的生命关键构件的合成。作者在文章中报告了一种正向合成算法,该算法可以生成一个完整的前生命化学的反应网络,该网络可以在普遍接受的条件下从这些基质中获得。这个网络包含了已报道的和以前未被发现的通往生物目标的途径,以及非生物分子的合理合成。它还表现出三种形式的非平凡的化学出现,因为网络内的分子可以作为下游反应类型的催化剂;形成功能性的化学系统,包括自我再生循环;并产生与原始形式的生物分化相关的表面活性剂。为了支持这些说法,通过实验验证了计算机预测的几种生物分子的前生物合成以及亚氨基二乙酸的多步骤、自我再生循环。
前生命化学网络(Network of prebiotic chemistry) …
计算模拟可信的前生物反应,建立了一个可从前生物底物中合成的分子网络,并建立了多个未报道的,但现在实验验证的前生物目标的合成以及自我再生循环。示意图中,浅蓝色节点代表非生物分子,深蓝色节点代表新发现的尿酸和柠檬酸的前生物合成的分子,红色节点代表其他生物分子。
1
背景
虽然数百种有机反应已经在共识的前生物条件下得到了验证,但对于这些单独的步骤如何结合成完整的合成途径以产生生命的构件,其他非生物分子也可能形成,独立的反应如何产生化学体系,以及封装这些体系的膜如何产生,研究人员仍然只有零碎的了解。要回答这样的问题,需要考虑非常多的可能的合成途径,甚至从几个原始底物(如H2O、N2、HCN、NH3、CH4和H2S)开始,生物前可合成分子的数量迅速增长到数万个。对这一空间及其合成连接性的详细分析可能超出了单个化学家的认知范围,但可以通过智能计算算法进行。
2
基本原理
研究人员利用计算辅助有机合成的力量,绘制了可从基本的生物前原料合成的分子网络图。通过将目前已知的前生物反应编码成机器可读的格式,用不相容基团和反应条件的信息增强这些反应变换,然后将它们反复应用于一组基本前生物底物。这样创建的反应网络被算法查询,以确定完整的合成路线以及跟踪反应系统,特别是反应循环。所有的计算都得到了一个软件应用程序的支持,该软件可供科学界免费使用。
3
材料和方法
介绍Allchemy的主要程序和理论方法的概要。
Allchemy平台概况
Allchemy网络应用基于Django框架,使用PostgreSQL存储计算结果。网络应用程序使用d3.js库进行图形表示,使用Chemwriter进行化学结构的可视化。网络应用和Allchemy后端之间的通信由Redis和RQ队列系统支持。周期搜索算法使用NetworkX或graph-tool库实现。
Allchemy将以SMARTS编码的反应规则应用于以SMILES格式表示的一组底物分子。该过程从用户指定的初始底物池开始,可以是SMILES格式,也可以是在Chemwriter中绘制分子结构。每次迭代过程中,反应规则被应用到当前的化合物池中,其中包括初始底物和前几代的产物。更具体地说,每一代都需要进行以下操作:
将分子与反应模板相匹配;
反应运行;
产物的后期过滤;
反应路径的构建;
反应周期的确定。
4
结果
研究人员的研究结果证明,这个网络由更多的非生物分子而不是生物分子组成。生物性化合物与非生物性化合物在几个方面有所不同。生物性化合物的亲水性更强,热力学更稳定,所含的氢键供体和受体更平衡,并且可以沿着条件变化较少的路线合成。该网络不仅包含了所有已知的生物化合物的合成,而且还包含了以前未发现的路线,其中有几条路线(如乙醛和二甘氨酸的生前合成,以及苹果酸、富马酸、柠檬酸和尿酸)通过实验进行了验证。研究人员还证明了三种显著的化学出现形式。(i)网络内创建的分子本身可以使新类型的前生物反应得以实现;(ii)短短的几代合成内,简单的化学系统(包括自我再生循环)开始出现;(iii)网络中包含了通往表面活性剂物种的前生物路线,从而勾勒出一条通往生物分化的道路。研究人员用实验结果支持这些结论,建立了以前未描述的前生物反应和整个反应系统,特别是亚氨基二乙酸的自我再生循环。
5
结论
计算机生成的反应网络对于确定通往生物前相关目标的合成路线非常有用,对于发现生物前化学体系是不可或缺的,否则就很难辨别。随着研究人员的网络通过对新验证的前生物反应进行众包而不断发展,它将允许继续模拟化学反应的发生,从简单的水、氨和甲烷等分子开始,到越来越复杂的目标分子,包括那些目前在化学和制药行业感兴趣的目标分子。