魔搭中文开源模型社区:模型即服务-药物设计中的开源AI模型Uni-Fold及Uni-Mol(上)

本文涉及的产品
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
交互式建模 PAI-DSW,每月250计算时 3个月
模型训练 PAI-DLC,5000CU*H 3个月
简介: 魔搭中文开源模型社区:模型即服务

 

作者:柯国霖深势科技机器学习负责人

 

一、 蛋白质测序背景

 

image.png

 

在药物设计中,最关键的两个对象是蛋白质和小分子其,主要特征是小分子药物。比如口服药物进入体内之后,跟身体内某些蛋白的靶点结合,从而改变蛋白的某些功能,实现药物效果。综上所述,靶点药物最关键的是蛋白结构,所以蛋白质结构预测是非常关键的问题。

 

对于小分子来说,小分子药物是否有毒?好不好代谢?好不好溶解?能否跟靶点结合?这些问题都是非常有挑战性的。

 

image.png

 

蛋白结构预测的本质是通过蛋白的一级结构,即氨基酸序列,预测蛋白质的三级结构,即安基酸序列上所有原子在空间上的坐标。

 

目前已知的蛋白序列高达几十亿,但解除蛋白质结构非常消耗实验资源,已知的蛋白结构只有十几万。

 

image.png

 

常见的蛋白质有两种,即单链蛋白和多链蛋白。最近,很多科研人员将工作集中在单链结构预测上,这些链来自于多聚体组合,利用MSA和自振数据,被DeepMind和AlphaFold很好地解决了。

 

在自然界中,蛋白质是由多条链组成的集合体,PDB中超过50%的蛋白质是多聚体。所以多聚体的结构预测更具挑战性,但也更重要,但多聚体获得的关注较少。

 

image.png

 

接下来,讲一讲AlphaFold。AlphaFold是DeepMind开源的人工智能系统,借助AlphaFold可以更加准确的预测蛋白质的形状。目前,主要应用于医疗保健和生命科学领域,有可能加速药物的研究与发现。

 

image.png

 

虽然AlphaFold有开源代码,但只开放了推理代码,训练代码和训练数据其实没有开放。除此之外,AlphaFold的资源的消耗非常大,给科研人员带来了很多新的困难。

 


相关文章
|
29天前
|
机器学习/深度学习 人工智能 并行计算
"震撼!CLIP模型:OpenAI的跨模态奇迹,让图像与文字共舞,解锁AI理解新纪元!"
【10月更文挑战第14天】CLIP是由OpenAI在2021年推出的一种图像和文本联合表示学习模型,通过对比学习方法预训练,能有效理解图像与文本的关系。该模型由图像编码器和文本编码器组成,分别处理图像和文本数据,通过共享向量空间实现信息融合。CLIP利用大规模图像-文本对数据集进行训练,能够实现zero-shot图像分类、文本-图像检索等多种任务,展现出强大的跨模态理解能力。
79 2
|
14天前
|
机器学习/深度学习 人工智能 算法
整合海量公共数据,谷歌开源AI统计学专家DataGemma
【10月更文挑战第28天】谷歌近期开源了DataGemma,一款AI统计学专家工具,旨在帮助用户轻松整合和利用海量公共数据。DataGemma不仅提供便捷的数据访问和处理功能,还具备强大的数据分析能力,支持描述性统计、回归分析和聚类分析等。其开源性质和广泛的数据来源使其成为AI研究和应用的重要工具,有助于加速研究进展和推动数据共享。
43 6
|
14天前
|
存储 人工智能 SEO
全开源免费AI网址导航网站源码
Aigotools 可以帮助用户快速创建和管理导航站点,内置站点管理和自动收录功能,同时提供国际化、SEO、多种图片存储方案。让用户可以快速部署上线自己的导航站。
32 1
|
20天前
|
人工智能
AI科学家太多,谁靠谱一试便知!普林斯顿新基准CORE-Bench:最强模型仅有21%准确率
【10月更文挑战第21天】普林斯顿大学研究人员提出了CORE-Bench,一个基于计算可重复性的AI代理基准,涵盖计算机科学、社会科学和医学领域的270个任务。该基准旨在评估AI代理在科学研究中的准确性,具有多样性、难度级别和现实相关性等特点,有助于推动AI代理的发展并提高计算可重复性。
40 4
|
30天前
|
人工智能 自然语言处理
从迷茫到精通:揭秘模型微调如何助你轻松驾驭AI新热点,解锁预训练模型的无限潜能!
【10月更文挑战第13天】本文通过简单的问题解答形式,结合示例代码,详细介绍了模型微调的全流程。从选择预训练模型、准备新任务数据集、设置微调参数,到进行微调训练和评估调优,帮助读者全面理解模型微调的技术细节和应用场景。
67 6
|
28天前
|
人工智能 自然语言处理 数据可视化
阿里云AI大模型助力客户对话分析——全方位提升服务与体验
随着数字化转型的推进,企业愈发重视客户互动数据的价值。阿里云推出了一套基于AI大模型的客户对话分析解决方案,通过自动化手段分析大量客户对话数据,提取有价值信息,优化服务流程,提升客户体验。本文将结合技术文档和实际体验,全面评测这一解决方案。
51 2
|
机器学习/深度学习 TensorFlow 算法框架/工具
阿里云弹性AI服务 -- 基于Docker和EGS一键创建高性能Tensorflow分布式训练
Tensorflow是目前使用最为广泛的深度学习框架之一,但是目前搭建分布式多机多卡训练比较困难,而且Tensorflow原生的分布式的性能很差。为了解决这个问题,我们创建了一个容器镜像:registry.
5037 0
|
4天前
|
机器学习/深度学习 人工智能 自然语言处理
当前AI大模型在软件开发中的创新应用与挑战
2024年,AI大模型在软件开发领域的应用正重塑传统流程,从自动化编码、智能协作到代码审查和测试,显著提升了开发效率和代码质量。然而,技术挑战、伦理安全及模型可解释性等问题仍需解决。未来,AI将继续推动软件开发向更高效、智能化方向发展。
|
8天前
|
机器学习/深度学习 人工智能 自然语言处理
AI在医疗领域的应用及其挑战
【10月更文挑战第34天】本文将探讨人工智能(AI)在医疗领域的应用及其面临的挑战。我们将从AI技术的基本概念入手,然后详细介绍其在医疗领域的各种应用,如疾病诊断、药物研发、患者护理等。最后,我们将讨论AI在医疗领域面临的主要挑战,包括数据隐私、算法偏见、法规合规等问题。
28 1
|
6天前
|
机器学习/深度学习 人工智能 算法
AI在医疗领域的应用与挑战
本文探讨了人工智能(AI)在医疗领域的应用,包括其在疾病诊断、治疗方案制定、患者管理等方面的优势和潜力。同时,也分析了AI在医疗领域面临的挑战,如数据隐私、伦理问题以及技术局限性等。通过对这些内容的深入分析,旨在为读者提供一个全面了解AI在医疗领域现状和未来发展的视角。
35 10

热门文章

最新文章