数据驱动着药物发现,但它仍然是该行业面临的最大挑战之一。实验通常是不可重复的,并且数据解释受人类的偏见和限制。
分子未能成为市场上出售的药物有很多原因。为了避免这种情况,必须从最准确的科学表示中做出决定;否则,失败的风险只会增加。不断发展的技术提供了许多机会,不仅可以逆转潮流,而且可以利用数据带来前所未有的收益。
在过去的几十年中,信息时代见证了数据的爆炸式增长,但是更多的数据并不能固有地产生更好的理解。人脑处理数据的能力受到限制,而且偏见使得出的结论的可靠性进一步复杂化。此外,人脑在经过一定时间后通常不会回忆起所有数据,因此随着时间的流逝,回顾性分析变得具有挑战性,不可能或完全不准确。
尽管这些困难很难解决,但技术可能会带来一些答案。人工智能(AI)是使机器思考和学习的软件技术。机器与人类不同,可以快速对大型数据集执行复杂的计算。能够一致地执行任务;并且不受情绪影响。但是,机器通常依靠直接的显式指令来执行任务。例如:在原始文字处理软件中输入单个字母将在计算机屏幕上显示该字母;这是直接输入和响应,仅反映提供的单个输入。人工智能为利用机器的优势打开了大门,可以在人类缺乏的地方进行复杂的分析。在搜索引擎中键入相同的字母会生成针对用户量身定制的建议搜索词列表。这些建议是由数据智能技术生成的,该技术利用许多辅助数据点(称为元数据)的组合来解释字母,例如个人的先前浏览历史和当前事件。如果每个人都被要求从单个字母和一小组元数据中列出搜索建议,则他们可能会产生类似的列表。随着数据量的增长,人的数据容量变得饱和,并且预测可能会变得越来越分歧。没有数据智能,字母只是屏幕上的字母,大数据集可能会比知识贡献更多的噪音。但是,智能软件为分析带来了一致性和完整性,并且在包含元数据时具有更大的相关性。
解释数据
在药物发现中,数据智能技术具有众多应用。其中之一是数据解释,其中上下文为实验数据提供了至关重要的背景,从而提供了仅凭实验数据无法捕获的见解。例如,生物学测定的荧光信号可以与已知的感兴趣的相互作用有关。但是,信号可能对温度敏感,或者测试物质是荧光的。可能增加复杂性的另一种可能性是,没有一个依赖关系是已知的。如果不考虑温度和物质特性,仅对实验数据的解释将完全具有误导性,并可能造成灾难性的后果。可能促进无活性的化合物的发展,浪费宝贵的资源;甚至更糟的是 可能的先导化合物会被丢弃或遗忘。每个实验都有数百个这些数据点来补充每个实验数据点。这些数据点不仅限于单个实验,还涉及样品中每个成分的完整运动,条件和过程。这些数据点中的大多数当前未使用或没有收集,而是依靠控件来调整可变性和未知性。数据智能为使用这些数据点和探索实验数据背后隐藏的内容提供了机会。也许可以解释化验变异性,或者可以阐明有关靶标的新见解。就像搜索引擎处理单个字母一样,情报技术可以通过包含用于全面上下文分析的元数据来为实验数据提供更好的含义。
尽管人工智能可以在实验后从数据中获得新的见解,但它也可以帮助在实验室进行科学研究。先导化合物优化是一种晚期药物发现过程,可改进分子的安全性和有效性,以抵抗疾病的工作周期是根据生物学数据设计分子,对其进行合成,然后测试其生物学活性。许多生物学测定可在一天内测试数千种化合物。但是,药物化学家设计的每个分子都必须合成和纯化,这可能需要几天或几周才能完成。化学反应可能是未知的,多步骤且耗时的。正在开发自动合成和人工智能技术来帮助解决其中一些挑战。逆合成是解决合成化合物的每个步骤的过程,从产品开始,再回到商业或易于使用的试剂。有数百万个已知的单步化学反应,因此化学家不可能一无所知。取而代之的是,化学家通常的做法是分析文献,以寻找可以解决该问题的已报告化学方法,这既费时又非常适合智能软件。逆合成软件将人工智能应用于参考已知的化学反应并解决反应方案,就像化学家一样。不同之处在于,软件可以访问所有已知的化学反应并执行预测路线的复杂分析,而化学家则受其知识以及可以找到和阅读的参考文献的限制。这种软件的开发已经进行了多年,并且已经报道了重要的最新进展。随着逆合成软件的改进,解决合成问题可能只需单击几下。
自动化的作用
尽管软件可以缩短解决分子制造问题的时间,但该反应仍必须在实验室中进行。化学家通常一次分配多种化合物,并且必须能够使它们高效。困难的化学反应通常需要尝试在多种条件和试剂下进行多种测试反应,以找到一种有效的方法。常规合成反应缓慢且劳动强度大,需要每个反应进行单独设置和运行。可以消除这些瓶颈的几种自动化合成方法已有报道,并且正在不断开发中。自动化只需设置一次即可运行多个反应,而无需化学家进一步努力。它可以连续运行以生成目标化合物,并在许多条件下有条不紊地进行迭代以解决具有挑战性的转化。自动化合成方法可使化学家摆脱重复的费时任务,并减少获取和测试新化学物质的时间。
单独使用时,在药物发现中应用人工智能的潜力巨大,但机器智能将使研究人员更进一步。药物发现机器人已经广泛应用于测试分子的生物测定中。自动化合成、逆合成和数据智能方面的进步开创了一场完美的风暴,将生物学和化学结合成一个全自动的闭环过程,并且正在努力实现这一目标。合成方法由逆合成软件确定,并发送到自动合成设备,在此设备中分子被合成,纯化并转移到测定中。化合物转移后,将自动触发机器人以执行测定并收集每个样品的数据。智能软件不仅可以根据实验,还可以根据组织中的所有数据来解释实验和元数据。然后,该软件将设计下一轮分子,并在每一轮后通过软件学习来重复该循环。这听起来像科幻小说,但是其中许多功能正在迅速发展或已经存在-尽管可以肯定的是,为了创建一个真正的自动化药物发现系统,人工智能和自动化领域仍存在着重大发展。