魔搭中文开源模型社区:模型即服务-药物设计中的开源AI模型Uni-Fold及Uni-Mol(上)

本文涉及的产品
交互式建模 PAI-DSW,5000CU*H 3个月
简介: 魔搭中文开源模型社区:模型即服务

 

作者:柯国霖深势科技机器学习负责人

 

一、 蛋白质测序背景

 

image.png

 

在药物设计中,最关键的两个对象是蛋白质和小分子其,主要特征是小分子药物。比如口服药物进入体内之后,跟身体内某些蛋白的靶点结合,从而改变蛋白的某些功能,实现药物效果。综上所述,靶点药物最关键的是蛋白结构,所以蛋白质结构预测是非常关键的问题。

 

对于小分子来说,小分子药物是否有毒?好不好代谢?好不好溶解?能否跟靶点结合?这些问题都是非常有挑战性的。

 

image.png

 

蛋白结构预测的本质是通过蛋白的一级结构,即氨基酸序列,预测蛋白质的三级结构,即安基酸序列上所有原子在空间上的坐标。

 

目前已知的蛋白序列高达几十亿,但解除蛋白质结构非常消耗实验资源,已知的蛋白结构只有十几万。

 

image.png

 

常见的蛋白质有两种,即单链蛋白和多链蛋白。最近,很多科研人员将工作集中在单链结构预测上,这些链来自于多聚体组合,利用MSA和自振数据,被DeepMind和AlphaFold很好地解决了。

 

在自然界中,蛋白质是由多条链组成的集合体,PDB中超过50%的蛋白质是多聚体。所以多聚体的结构预测更具挑战性,但也更重要,但多聚体获得的关注较少。

 

image.png

 

接下来,讲一讲AlphaFold。AlphaFold是DeepMind开源的人工智能系统,借助AlphaFold可以更加准确的预测蛋白质的形状。目前,主要应用于医疗保健和生命科学领域,有可能加速药物的研究与发现。

 

image.png

 

虽然AlphaFold有开源代码,但只开放了推理代码,训练代码和训练数据其实没有开放。除此之外,AlphaFold的资源的消耗非常大,给科研人员带来了很多新的困难。

 


相关文章
|
1天前
|
机器学习/深度学习 人工智能 算法
AI大模型学习理论基础
本文探讨了AI大模型学习的理论基础,包括深度学习(模拟神经元工作原理,通过多层非线性变换提取特征)、神经网络结构(如前馈、循环和卷积网络)、训练方法(监督、无监督、强化学习)、优化算法(如SGD及其变种)、正则化(L1、L2和dropout防止过拟合)以及迁移学习(利用预训练模型加速新任务学习)。这些理论基础推动了AI大模型在复杂任务中的应用和人工智能的发展。
|
4天前
|
人工智能 搜索推荐 决策智能
【AI Agent系列】【阿里AgentScope框架】1. 深入源码:详细解读AgentScope中的智能体定义以及模型配置的流程
【AI Agent系列】【阿里AgentScope框架】1. 深入源码:详细解读AgentScope中的智能体定义以及模型配置的流程
35 0
|
4天前
|
数据采集 存储 人工智能
【AI大模型应用开发】【LangChain系列】实战案例4:再战RAG问答,提取在线网页数据,并返回生成答案的来源
【AI大模型应用开发】【LangChain系列】实战案例4:再战RAG问答,提取在线网页数据,并返回生成答案的来源
29 0
|
4天前
|
数据采集 存储 人工智能
【AI大模型应用开发】【LangChain系列】实战案例2:通过URL加载网页内容 - LangChain对爬虫功能的封装
【AI大模型应用开发】【LangChain系列】实战案例2:通过URL加载网页内容 - LangChain对爬虫功能的封装
14 0
|
4天前
|
人工智能 Python
【AI大模型应用开发】【LangChain系列】实战案例1:用LangChain写Python代码并执行来生成答案
【AI大模型应用开发】【LangChain系列】实战案例1:用LangChain写Python代码并执行来生成答案
9 0
|
机器学习/深度学习 人工智能 自然语言处理
搜狗翻宝Pro机再次开挂,智能翻译硬件成中国人工智能的新风口
第五届世界互联网大会正在如火如荼的举行。
搜狗翻宝Pro机再次开挂,智能翻译硬件成中国人工智能的新风口
|
机器学习/深度学习 人工智能 自然语言处理
与世界同行 2017中国人工智能大会有感
与世界同行 2017中国人工智能大会有感
1543 0
与世界同行 2017中国人工智能大会有感
|
人工智能 自动驾驶
2019年上半年收集到的中国人工智能发展详情文章
2019年上半年收集到的中国人工智能发展详情文章
|
人工智能 芯片
中国人工智能计划,我来说几句
中国人工智能计划,我来说几句