机器人走路未必笨拙,DeepMind新方法训练的人工智能走得就很飘逸

简介: 雷锋网(公众号:雷锋网) AI 科技评论按:无论是在树木间乱窜的猴子,还是躲避对手和进击目标的足球运动员,他们灵活敏捷的速度,都让人十分惊叹。掌握这种复杂的电机控制是物理智能研究的方向,是 AI 研究的重要组成部分。

机器人走路未必笨拙,DeepMind新方法训练的人工智能走得就很飘逸

雷锋网(公众号:雷锋网) AI 科技评论按:无论是在树木间乱窜的猴子,还是躲避对手和进击目标的足球运动员,他们灵活敏捷的速度,都让人十分惊叹。掌握这种复杂的电机控制是物理智能研究的方向,是 AI 研究的重要组成部分。

真正的智能电机需要在一系列复杂的环境中,学习如何调节控制身体使其更加灵活来完成任务。目前,很多领域开始研究如何控制模拟人,包括计算机动画和生物力学领域。智能电机的另一种发展趋势是,使用手工制作的目标或运动捕捉的数据来产生特定的行为。 然而,这可能需要相当多技术工作的努力,也可能会导致智能电机面对新任务时,难以重新调整行为。

在以下 3 篇新的论文中,阐述了 DeepMind 已经找到了 AI 学习灵活行为的方式,这种方式不仅能够重复使用,还能解决任务。

一、丰富的环境中表现的运动行为

如果玩 Atari 或 Go 时,目标很容易描述,就是赢。但是你如何描述一个后空翻表演的过程?或者仅仅只是单纯描述一下“跳”这个动作?当 DeepMind 把运动技能教授给人工系统时,常常会遇到这个问题,就是很难准确描述一个复杂的行为。 DeepMind 目前的工作就是研究如何在简单高水平的目标下,使身体能够从头开始与环境相互作用来完成复杂的行为,例如向前移动而不会下降。更具体地说,他们训练了各种模拟人,让他们在不同的地形上进行跳跃,转弯或者蹲伏。结果显示,模拟人完成这些复杂的技能前,并没有收到具体的指示。 DeepMind 需要找到一种方法,可以训练系统中明显不同的模拟人。下面的 GIF 显示了能够产生高质量的运动的技术。

机器人走路未必笨拙,DeepMind新方法训练的人工智能走得就很飘逸
模拟的“平面”步行者反复尝试

机器人走路未必笨拙,DeepMind新方法训练的人工智能走得就很飘逸

模拟的“蚂蚁”步行者在学习如何在木板之间精确地跳跃

二、通过对抗模仿学习人体行为

上述的模拟人解决突发行为的能力非常强大,但是由于这些动作必须从头开始,所以模拟人的动作看起来和人类行为不太一样。在 DeepMind 的第 2 篇论文中,阐述了如何通过运动捕捉数据来构建一个模仿人类行为的政策网络,需要预先学习一些技能,例如步行、起步、跑步和转弯等等。目前,模拟人已经产生了类似人类的行为,可以通过重新调整这些行为来完成其他任务,比如爬楼梯,通过导航绕过围墙等等。

下面的 GIF 可以查看模拟人的行为。

机器人走路未必笨拙,DeepMind新方法训练的人工智能走得就很飘逸
人形步行者产生类似人类的行走行为

机器人走路未必笨拙,DeepMind新方法训练的人工智能走得就很飘逸

人形步行者摔倒后立即站起来

三、模拟人模仿人类各种行为

第 3 篇论文提出了构建一种最先进的生成模型的神经网络结构,它能够学习不同行为之间的关系,并模仿它所显示的具体动作。经过训练之后, DeepMind 的系统可以编码观察到的动作,还可以创建新的小动作。尽管模拟人并没有看到动作之间的过渡,依旧可以在不同类型的动作之间切换,例如在行走风格之间的转换。

机器人走路未必笨拙,DeepMind新方法训练的人工智能走得就很飘逸
GIF 中左侧和中间演示了两个行为;GIF 中右侧展示了模拟人在不同行为之间产生了它从未见过的过渡
机器人走路未必笨拙,DeepMind新方法训练的人工智能走得就很飘逸
GIF 中左侧平面步行者演示了特定的行走风格;GIF 中右侧展示了我们的模拟人使用单一政策网络来模仿这种行走风格

实现模拟人行动灵活且适应控制是 AI 研究的关键要素。 DeepMind 的工作旨在开发一套系统,能够通过学习和调整技能来解决电机控制任务,同时减少手动工程。 DeepMind 未来的研究工作主要是扩展这些方法,以便在更复杂的情况下完成更多的任务。雷锋网 AI 科技评论也会继续保持关注。

论文地址:

via DeepMind,雷锋网 AI 科技评论编译

本文作者:白及

本文转自雷锋网禁止二次转载,原文链接

相关文章
|
3天前
|
机器学习/深度学习 人工智能 自然语言处理
PeterCat:一键创建开源项目 AI 问答机器人,自动抓取 GitHub 仓库信息、文档和 issue 等构建知识库
PeterCat 是一款开源的智能答疑机器人,能够自动抓取 GitHub 上的文档和 issue 构建知识库,提供对话式答疑服务,帮助开发者和社区维护者高效解决技术问题。
40 7
PeterCat:一键创建开源项目 AI 问答机器人,自动抓取 GitHub 仓库信息、文档和 issue 等构建知识库
|
16天前
|
传感器 人工智能 自然语言处理
RDT:清华开源全球最大的双臂机器人操作任务扩散基础模型、代码与训练集,基于模仿能力机器人能够自主完成复杂任务
RDT(Robotics Diffusion Transformer)是由清华大学AI研究院TSAIL团队推出的全球最大的双臂机器人操作任务扩散基础模型。RDT具备十亿参数量,能够在无需人类操控的情况下自主完成复杂任务,如调酒和遛狗。
83 22
RDT:清华开源全球最大的双臂机器人操作任务扩散基础模型、代码与训练集,基于模仿能力机器人能够自主完成复杂任务
|
2月前
|
人工智能 自然语言处理 算法
具身智能高校实训解决方案 ----从AI大模型+机器人到通用具身智能
在具身智能的发展历程中,AI 大模型的出现成为了关键的推动力量。高校作为培养未来科技人才的摇篮,需要紧跟这一前沿趋势,开展具身智能实训课程。通过将 AI 大模型与具备 3D 视觉的机器人相结合,为学生搭建一个实践平台。
203 64
|
11天前
|
机器学习/深度学习 人工智能 算法
人工智能与机器人的结合:智能化世界的未来
人工智能与机器人的结合:智能化世界的未来
99 32
|
5天前
|
人工智能 安全 搜索推荐
新手指南:人工智能poe ai 怎么用?国内使用poe记住这个方法就够了!
由于国内网络限制,许多用户在尝试访问Poe AI时面临障碍。幸运的是,现在国内用户也能轻松畅玩Poe AI,告别繁琐的设置,直接开启AI创作之旅!🎉
47 13
|
11天前
|
人工智能 安全 机器人
OpenAI重拾规则系统,用AI版机器人定律守护大模型安全
在人工智能领域,大语言模型(LLM)展现出强大的语言理解和生成能力,但也带来了安全性和可靠性挑战。OpenAI研究人员提出“规则基于奖励(RBR)”方法,通过明确规则引导LLM行为,确保其符合人类价值观和道德准则。实验显示,RBR方法在安全性与有用性之间取得了良好平衡,F1分数达97.1。然而,规则制定和维护复杂,且难以完全捕捉语言的多样性。论文:https://arxiv.org/pdf/2411.01111。
53 13
|
2月前
|
人工智能 机器人 Shell
AI语音机器人安装方法 AI机器人安装代码
AI语音机器人安装方法 AI机器人安装代码
35 2
|
2月前
|
数据采集 安全 算法
李飞飞数字表兄弟破解机器人训练难题!零样本sim2real成功率高达90%
李飞飞团队提出“数字表兄弟”(Digital Cousins)概念,通过自动化创建数字表兄弟(ACDC)方法,大幅提升了机器人在真实环境中的训练效果。该方法在零样本sim2real迁移实验中成功率达到90%,显著优于传统方法。
49 3
|
3月前
|
机器学习/深度学习 人工智能 自动驾驶
2024.10|AI/大模型在机器人/自动驾驶/智能驾舱领域的最新应用和深度洞察
本文介绍了AI和大模型在机器人、自动驾驶和智能座舱领域的最新应用和技术进展。涵盖多模态大语言模型在机器人控制中的应用、移动机器人(AMRs)的规模化部署、协作机器人的智能与安全性提升、AR/VR技术在机器人培训中的应用、数字孪生技术的优化作用、Rust语言在机器人编程中的崛起,以及大模型在自动驾驶中的核心地位、端到端自动驾驶解决方案、全球自动驾驶的前沿进展、智能座舱的核心技术演变和未来发展趋势。
222 2
|
2月前
|
存储 人工智能 搜索推荐
AI智能语音机器人的基本业务流程
简介: 先画个图,了解下AI语音机器人的基本业务流程。上图是一个AI语音机器人的业务流程,简单来说就是首先要配置话术,就是告诉机器人在遇到问题该怎么回答,这个不同公司不同行业的差别比较大,所以一般每个客户都会配置其个性化的话术。话术配置完成后,需要给账号配置线路,目的就是能够顺利的把电话打出去。线路配完后,就是建立任务了,说白了就是导入电话号码,因为资源有限,不可能导入一批立即打完,所以需要以任务的形式分配给机器人,然后机器人逐个完成。值得一提的是,如果有多条线路,创建任务时建议提供线路选择功能,很多公司的业务不止一个城市,而大家又是比较习惯接听自己所在城市的电话,所以这个选择主