深入了解各类化学物质的最佳一般反应条件,可以加速创新和药物发现,并使复杂的化学过程自动化且易于使用,对生物医药、材料研究具有重要意义。
然而,有机反应的一般条件很重要但很少见,以往识别它们的研究通常只考虑化学空间的狭窄区域。发现更一般的反应条件需要考虑从与反应条件的高维矩阵交叉的大基质基质衍生的广阔化学空间区域,使得详尽的实验不切实际。
在这里,伊利诺伊大学厄巴纳-香槟分校以及来自波兰、加拿大的研究人员报告了一个简单的闭环工作流程,该工作流程利用数据引导矩阵向下选择、不确定性最小化机器学习和机器人实验来发现一般反应条件。
应用于杂芳基 Suzuki-Miyaura 交叉偶联的具有挑战性和后果性的问题,确定了相对于先前使用传统方法开发的广泛使用的基准而言平均产量翻倍的条件。为解决具有大搜索空间的多维化学优化问题提供了实用的路线图。
该研究以「Closed-loop optimization of general reaction conditions for heteroaryl Suzuki-Miyaura coupling」为题,于 2022 年 10 月 27 日发布在《Science》。
肽、核酸和多糖的自动合成方法的开发需要发现适用于广泛的构件组合的高度通用的反应条件。相比之下,在小有机分子的合成中,通常开发定制的反应条件以最大化每个目标分子的产率、最小化副产物或最小化相应过程的成本。
每个目标的反应优化通常是必要的,因为合成方法通常仅在一对或几对底物上进行优化,然后应用于更广泛的底物组合,很少实现相同条件通常会导致高产率的希望。即使将机器学习应用于优化协议也不能确保通用性,这对于小分子制造过程的自动化、加速和最终民主化至关重要。
这种一般条件的识别是困难的,因为搜索空间——跨越所有可能的底物组合乘以所有可能的反应条件组合——是巨大的,因此使用标准方法导航是不切实际的。
杂芳基分子片段普遍存在于许多工业相关的功能分子中,包括药物、材料、催化剂、染料和天然产物。在所有这些空间中,综合仍然是一个关键瓶颈。因此,寻找(杂)芳基 Suzuki-Miyaura 交叉偶联(SMC)的一般条件是一个重要问题。
这也是一个具有挑战性且很大程度上未解决的问题,主要是由于在非常大且多样化的潜在杂芳基和芳基底物范围内所需和不希望的反应性程度不同。伊利诺伊大学的研究人员曾尝试使用机器学习 (ML) 通过挖掘关于(杂)芳基 SMC 的大量化学文献来发现一般反应条件,但未能成功。
「要区分好坏,你需要对坏事有所了解,但人们只会公布成功。」该研究的共同负责人 Bartosz A. Grzybowski 说,这里失败的原因在于,已发表的文献中报道的条件选择缺乏与底物结构的因果联系,并且因为缺乏已发表(或以其他方式存档)的负面结果。
图示:广义杂环交叉偶联的问题定义和底物范围。(来源:论文)
在这里,这个以伊利诺伊大学为主的多团队合作小组报告了一个简单的闭环工作流程,可以有效地导航广阔的底物条件空间以发现一般反应条件。
该方法利用:(i)数据引导的矩阵向下选择以使巨大的搜索空间易于处理,同时保持对整体的有效性;(ii) 将不确定性最小化 ML 以有效推动预测优化;(iii) 机器人实验,以提高按需递归生成的数据集的吞吐量、精度和可重复性。
研究人员证明该工作流程成功地确定了(杂)芳基 SMC 反应的一般反应条件。
与之前通过传统人工引导实验(JACS 2009)开发的基准一般条件相比,优化后的解决方案使平均产量翻了一番,并且此后已在全球学术和工业实验室中广泛使用(在超过 590 篇论文和专利申请中被引用)。
因此,这种方法可以在广阔的多维搜索空间中找到强大的解决方案,并有助于加速有机化学领域向自动化和民主化的小分子合成迈进,这需要更通用的反应条件。
图示:初始训练集的自动合成。(来源:论文)
「通用性对于自动化至关重要,因此即使是非化学家也可以进行分子创新,」该研究的共同负责人、伊利诺伊州卡尔伊利诺伊医学院的化学教授和医学博士 Martin D. Burke 博士说,「挑战在于可能的反应条件的大海捞针是天文数字,而针隐藏在里面的某个地方。通过利用人工智能和『积木』化学的力量来创建反馈循环,我们能够缩小大海捞针。我们找到了针。」
这个简单工作流程能够加速发现改进的一般反应条件,用于困难的 C-C 键形成反应,代表了提高小分子合成效率、通用性和可及性的关键一步。该结果还强调了向下选择作为进入大型多维搜索空间的入口点的力量,从头 ML 方法通过生成数据集来导航此类空间的独特优势,这些数据集在优化过程中均匀地反映了正面和负面数据的现实,以及机器人化学特别适用于生成高质量、可重复的数据。
图示:用于 ML 发现的反应条件的测试集。(来源:论文)
研究人员表示,未来的研究将结合下一代配体和试剂,以进一步改善一般反应条件,为自动化小分子合成创造一条可行的路径,以实现接近自动化肽合成的反应效率。这种通用工作流程应该适用于 SMC 以外的反应优化,因为它不需要大量的先前文献数据即可成功。
论文链接:https://www.science.org/doi/10.1126/science.adc8743
相关报道:https://phys.org/news/2022-10-artificial-intelligence-molecule-machine-automated.html