斯坦福伯克利重磅发现DNA Scaling Law,Evo荣登Science封面!AI设计DNA/RNA/蛋白质再突破

简介: 近日,斯坦福大学和加州大学伯克利分校在《科学》杂志发表重要成果,发现DNA Scaling Law规律,揭示了DNA、RNA和蛋白质分子长度与碱基对数量之间的比例关系。该研究为AI设计生物分子带来突破,通过数据收集、模型训练和优化设计等步骤,显著提高设计效率和准确性,降低成本,并拓展应用范围。论文地址:https://www.science.org/doi/10.1126/science.ado9336。

近日,斯坦福大学和加州大学伯克利分校的研究团队在《科学》杂志上发表了一项重要研究成果,他们发现了一种名为DNA Scaling Law的规律,为AI设计DNA、RNA和蛋白质带来了新的突破。这项研究的成果不仅在学术界引起了广泛关注,还登上了《科学》杂志的封面。

DNA Scaling Law是一种描述DNA分子中碱基对数量与DNA分子长度之间关系的数学模型。通过研究DNA分子的结构和功能,研究人员发现DNA分子的长度与其碱基对的数量之间存在一种特定的比例关系。这种比例关系不仅适用于DNA分子,还适用于RNA和蛋白质分子。

这一发现对于AI设计DNA、RNA和蛋白质具有重要意义。传统的DNA、RNA和蛋白质设计方法主要依赖于经验和试错,效率较低且成本较高。而基于DNA Scaling Law的AI设计方法可以通过预测DNA、RNA和蛋白质分子的长度和结构,提高设计效率和准确性。

具体来说,基于DNA Scaling Law的AI设计方法可以通过以下几个步骤实现:

  1. 数据收集:收集大量已知DNA、RNA和蛋白质分子的序列和结构数据。
  2. 模型训练:利用这些数据训练机器学习模型,使其能够根据序列预测分子的长度和结构。
  3. 设计优化:根据预测结果,对DNA、RNA和蛋白质分子进行优化设计,使其具有所需的功能和特性。
  4. 实验验证:通过实验验证设计结果,确保其具有预期的功能和特性。

基于DNA Scaling Law的AI设计方法具有以下几个优点:

  1. 提高效率:通过预测分子的长度和结构,可以减少试错次数,提高设计效率。
  2. 降低成本:减少试错次数可以降低实验成本,提高研究效率。
  3. 提高准确性:基于大量数据训练的机器学习模型可以提高预测准确性,从而提高设计准确性。
  4. 拓展应用:DNA Scaling Law不仅适用于DNA分子,还适用于RNA和蛋白质分子,可以拓展AI设计的应用范围。

然而,基于DNA Scaling Law的AI设计方法也存在一些挑战和限制:

  1. 数据依赖性:机器学习模型的性能取决于训练数据的质量和数量,如果数据不足或质量不高,可能会影响模型的预测准确性。
  2. 计算复杂度:预测DNA、RNA和蛋白质分子的长度和结构需要大量的计算资源,对于大规模设计任务来说,计算复杂度可能会成为限制因素。
  3. 实验验证:虽然AI设计方法可以提高设计效率和准确性,但仍然需要通过实验验证设计结果,这可能会增加研究时间和成本。

论文地址:https://www.science.org/doi/10.1126/science.ado9336

目录
相关文章
|
11月前
|
人工智能 并行计算 Linux
斯坦福黑科技让笔记本GPU也能玩转AI视频生成!FramePack:压缩输入帧上下文长度!仅需6GB显存即可生成高清动画
斯坦福大学推出的FramePack技术通过压缩输入帧上下文长度,解决视频生成中的"遗忘"和"漂移"问题,仅需6GB显存即可在普通笔记本上实时生成高清视频。
2563 19
斯坦福黑科技让笔记本GPU也能玩转AI视频生成!FramePack:压缩输入帧上下文长度!仅需6GB显存即可生成高清动画
|
9月前
|
机器学习/深度学习 人工智能 API
基于昇腾适配Meta AI在Science正刊发表的蛋白质结构预测模型ESMFold
ESMFold是由Meta AI团队开发的一种基于深度学习的高效蛋白质结构预测模型,其核心目标是利用大规模蛋白质语言模型(ESM)直接从氨基酸序列快速推断蛋白质的三维结构。ESMFold通过预训练的语言模型捕捉序列中的进化与结构关联性,结合几何优化模块生成高精度原子坐标,显著降低了传统方法对多重序列比对(MSA)和模板依赖的计算成本。该模型在蛋白质从头预测(de novo prediction)、功能位点解析、突变效应模拟等领域具有重要价值,以高效的推理性能,推动结构预测技术的普惠化应用。
|
8月前
|
机器学习/深度学习 人工智能 自然语言处理
AI 加速科学发现丨Al For Science 专场直播
AI 科学家时代正加速到来,但科研智能体真的做好准备了吗?真实科研场景中,多模态智能体能否在推理、规划与执行等关键能力上达到人类科研人员的水平?我们又该如何准确评估它们的科学认知能力和数据分析表现?
196 0
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
用AI精准定位问题代码,调试时间直接砍半!LocAgent:斯坦福开源代码调试神器,多跳推理锁定问题代码
LocAgent是由斯坦福大学、耶鲁大学等顶尖机构联合开发的代码定位框架,通过将代码库转化为图结构并利用大语言模型的多跳推理能力,实现精准的问题代码定位。
1095 1
用AI精准定位问题代码,调试时间直接砍半!LocAgent:斯坦福开源代码调试神器,多跳推理锁定问题代码
|
机器学习/深度学习 人工智能 算法
ProtGPS:MIT再造生命科学新基建!蛋白质AI一键预测定位+设计新序列,登Nature子刊
ProtGPS 是麻省理工学院和怀特黑德研究所联合开发的蛋白质语言模型,能够预测蛋白质在细胞内的亚细胞定位,并设计具有特定亚细胞定位的新型蛋白质。
1018 17
ProtGPS:MIT再造生命科学新基建!蛋白质AI一键预测定位+设计新序列,登Nature子刊
|
人工智能 NoSQL Redis
Collaborative Gym:斯坦福人机协作框架开源!异步交互+三方感知,让你的AI学会主动补位
介绍Collaborative Gym,一个专注于人机协作的框架,支持异步交互和多种任务环境。
509 14
Collaborative Gym:斯坦福人机协作框架开源!异步交互+三方感知,让你的AI学会主动补位
|
机器学习/深度学习 人工智能 搜索推荐
BioEmu:微软黑科技炸场!生成式AI重构蛋白质模拟:千倍效率碾压传统计算,新药研发周期砍半
BioEmu 是微软推出的生成式深度学习系统,可在单个 GPU 上每小时生成数千种蛋白质结构样本,支持模拟动态变化、预测热力学性质,并显著降低计算成本。
744 2
BioEmu:微软黑科技炸场!生成式AI重构蛋白质模拟:千倍效率碾压传统计算,新药研发周期砍半
|
机器学习/深度学习 人工智能 编解码
Evo 2:基因编程AI革命!!DNA版GPT-4问世:100万碱基全解析,自动设计基因编辑器
Evo 2 是一款由 Acr 研究所、英伟达和斯坦福大学联合开发的 DNA 语言模型,可处理长达百万碱基对的序列,支持基因组设计、变异预测及合成生物学研究。
934 5
|
人工智能 自然语言处理 算法
于云栖处,探索 AI+Science 的大规模工程化
在语音识别、图片搜索和数据处理等功能遍布于个人设备,将人们从繁琐、机械的工作中解放出来的同时,在科学领域,AI正在蓄力等待一个深入渗透进生物、化学、物理、工程等基础科学领域的契机。
于云栖处,探索 AI+Science 的大规模工程化
|
5月前
|
消息中间件 人工智能 安全
云原生进化论:加速构建 AI 应用
本文将和大家分享过去一年在支持企业构建 AI 应用过程的一些实践和思考。
1347 54

热门文章

最新文章