朱玉可团队新作：看一眼就能模仿，大模型让机器人轻松学会撒盐-阿里云开发者社区

朱玉可团队新作：看一眼就能模仿，大模型让机器人轻松学会撒盐

2024-11-27 41

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 朱玉可团队来自UT Austin和NVIDIA Research，提出了一种名为OKAMI的新方法，通过模仿人类行为视频，使机器人能快速学会操作技能，如撒盐、放玩具等。OKAMI分为参考计划生成和对象感知重定位两阶段，显著提高了机器人的操作精度和适应能力，减少了传统方法所需的大量示范和训练时间。

在人工智能领域，机器人的操作技能学习一直是一个挑战性的问题。传统的机器人学习方法需要大量的示范和训练，这不仅耗时耗力，而且难以适应复杂的现实环境。然而，朱玉可团队的最新研究为这个问题提供了一种创新的解决方案。

朱玉可团队来自UT Austin和NVIDIA Research，他们致力于研究如何通过模仿人类行为来教会机器人操作技能。他们的目标是让机器人能够通过观察人类的示范视频，快速学会各种操作技能，而不需要大量的示范和训练。

为了实现这个目标，朱玉可团队提出了一种名为OKAMI（Object-aware Kinematic retArgeting for huManoid Imitation）的方法。这种方法的核心思想是利用大模型来识别视频中的物体和人类动作，然后根据这些信息来生成机器人的操作计划。

具体来说，OKAMI方法包括两个阶段：

参考计划生成：在这个阶段，OKAMI方法会分析示范视频中的物体和人类动作，并生成一个参考计划。这个计划包括机器人需要执行的每个步骤，以及每个步骤中需要操作的物体。
对象感知重定位：在这个阶段，OKAMI方法会根据参考计划和当前的环境条件，生成机器人的操作动作。这些动作会根据物体的位置和姿态进行调整，以确保机器人能够准确地操作物体。

为了验证OKAMI方法的有效性，朱玉可团队进行了一系列的实验。他们选择了六个不同的操作任务，包括撒盐、放玩具进篮子、关抽屉、关笔记本电脑、放零食在盘子上和装袋。

在实验中，他们使用了一个配备两个6-DoF Inspire灵巧手和D435i Intel RealSense相机的Fourier GR1机器人。他们使用OKAMI方法来生成机器人的操作计划，并使用这些计划来控制机器人执行任务。

实验结果表明，OKAMI方法在所有六个任务中都表现出了出色的性能。机器人能够准确地操作物体，并成功完成任务。特别是在撒盐任务中，机器人能够准确地将盐撒入碗中，表现出了很高的操作精度。

朱玉可团队的这项研究为机器人操作技能学习提供了一种创新的解决方案。通过利用大模型来识别视频中的物体和人类动作，OKAMI方法能够快速生成机器人的操作计划，并根据这些计划来控制机器人执行任务。

这种基于模仿学习的方法具有很大的潜力，可以帮助机器人更快地学习各种操作技能，并适应复杂的现实环境。它还可以减少机器人学习所需的时间和精力，提高机器人的操作效率。

然而，OKAMI方法也存在一些局限性。首先，它需要高质量的示范视频，以便准确识别物体和人类动作。其次，它可能无法处理一些复杂的操作任务，例如需要多个步骤或多个物体交互的任务。

此外，OKAMI方法的实现也需要一些技术上的挑战，例如如何准确跟踪物体的位置和姿态，以及如何生成平滑的机器人动作。这些挑战可能需要进一步的研究和开发来解决。

论文链接：https://arxiv.org/pdf/2410.11792

朱玉可团队新作：看一眼就能模仿，大模型让机器人轻松学会撒盐

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

直播

下载

镜像站

技术资料

朱玉可团队新作：看一眼就能模仿，大模型让机器人轻松学会撒盐

热门文章

最新文章

相关课程

相关电子书

相关实验场景