二、 Uni-Fold概览
Uni-Fold为了打破AlphaFold的限制。目前已开源的Uni-Fold训练代码,经过MPI并行、数据异步读取、混合精度训练等优化工作,支持高效GPU训练。
基于优化后的训练代码,深势科技团队实现在128块NVIDIA GPU上进行AlphaFold2模型的全规模训练,并将持续优化所得模型。Uni-Fold的推理代码更加轻量、高效,在相同硬件环境下,可获得与公布的Alphafold2代码相比2-3倍的效率提升。
在2022年8月,深势科技最新发布的功能是对称蛋白的结构预测。跟据统计,在已知的蛋白结构中,72%的蛋白具有对称结构,包括离子通道、蛋白酶等重要类型对生命科学研究具有重大意义。
深势科技长期关注蛋白质折叠方法及其相关应用。自AlphaFold2发布后,深势科技团队第一时间与之对标,研发自主方案Uni-Fold。2021年12月,深势科技推出Uni-Fold v1.0.0,国际首次复现了AlphaFold2官方代码的全尺寸从头训练,并开源了训练与推理代码。
今年4月,深势科技于Hermite药物设计平台上线Uni-Fold v1.1.0,将代码框架由JAX迁移至PyTorch,并取得了对AlphaFold精度、速度的“双超越”;今年5月,深势科技上线Uni-Fold v2.0.0,国际首次复现了蛋白复合物结构预测模型AlphaFold-Multimer的全尺寸从头训练,并达到更优精度。
伴随新一轮的精度与效率提升,深势科技开源了最新版本Uni-Fold的代码与模型参数。借助本次开源,我们希望与志同道合的伙伴合作互助,共同开发下一代的蛋白质折叠模型。深势科技将继续关注领域最新进展,不断打磨算法与产品,为用户提供更加优质的服务,探索创造更多可能。
目前,AlphaFold的代码、模型、数据都已经开放。相关网址,如上图所示。
AlphaFold已经在ModelScope社区开源,大家可以在线体验。只要输入一个蛋白序列,就可以预测蛋白结构。
除此之外,AlphaFold的数据全部放到了ModelScope社区,用户可以直接使用数据进行训练,无需要任何额外的处理。