2018年12月,DeepMind 推出的 AlphaFold 根据基因序列成功预测蛋白质结构,成为 AI 技术驱动和加速科学发现的重要里程碑,引起业内广泛关注。2020年12月,DeepMind推出升级版本 AlphaFold 2,破解了蛋白质分子折叠问题,并宣称「它将改变一切」。2021年7月,DeepMind 宣布开源 AlphaFold 2 模型代码,并与 EMBL-EBI 合作开放 AlphaFold 蛋白结构数据库。
可以说,AlphaFold 与 AlphaFold 2 的相继推出拉开了人工智能与生物学交叉融合的序幕。但我们还应看到,由于自身的性能特点和巨大的内存消耗,AlphaFold 模型的训练和推理耗时长且成本高昂,这就要求学界对它既要借鉴又要创新。
后 AlphaFold 时代,国内在蛋白质预测领域也取得很多成就,比如在 CASP14 蛋白质测试集评估中仅次于 AlphaFold 2 的国产蛋白结构预测平台 TRFold 以及蛋白质结构预测模型的高效实现 FastFold 等。
人工智能技术与生物学的融合成为近年来的研究热点,尤其在蛋白质预测和药物设计方面。生物之外,在物理、数学、化学、材料、地质等多领域,AI 与基础科学相互影响并共同进步。