一看就会!英伟达新研究教机器人仅通过观察人类行为完成任务

简介: NVIDIA的研究人员开发了第一个可以教机器人仅通过观察人类的行为来完成任务的深度学习系统。该方法利用合成数据来训练神经网络,是第一次在机器人上使用以图像为中心的域随机化方法。

来自NVIDIA的研究人员开发了一个基于深度学习的系统,该系统可以教机器人仅通过观察人类的行为来完成任务。该方法旨在加强人与机器人之间的交流,同时进一步研究如何使人类无缝地与机器人一起工作。这是第一个这样的系统,研究由Stan Birchfield和Jonathan Tremblay领导。

“要想让机器人在现实世界中执行有用的任务,必须要能很容易地将任务传达给机器人。这包括预期的结果以及任何关于达到该结果的最佳方法的提示。”研究人员在他们的研究报告中指出。“通过演示,用户可以将任务传达给机器人,并向机器人提供如何以最佳的方式执行任务的线索。”

研究人员使用NVIDIA TITAN X GPU训练了一系列神经网络来执行与感知、程序生成和程序执行相关的任务。结果显示,机器人能够通过观察现实世界的单个演示来学习任务

336b1d38b0151efd9be94f41fe19a4d06d846d26

该方法的工作方式:一个摄像机被用来捕获场景的实时视频流,并且通过两个神经网络实时地对场景中对象的位置和关系进行推断。由此产生的知觉被输入到另一个网络中,该网络生成一个解释如何重建这些感知的计划。 最后,一个执行网络读取该计划并为机器人生成动作,同时考虑到当前场景的状态,以确保对外部干扰的稳健性。

一旦机器人得到一个任务,它就会生成一个人类可读取的关于重新执行该任务所需步骤的描述。该描述让用户能够在机器人执行之前快速识别和纠正机器人对人类演示的解释中的问题。

实现这种能力的关键是利用合成数据来训练神经网络。目前训练神经网络的方法需要大量有标记的训练数据,这对这类系统来说是一个瓶颈。通过合成数据生成,不用太费力就可以生成几乎无限的标记训练数据。

这也是第一次在机器人上使用以图像为中心的域随机化方法。域随机化(domain randomization)是一种产生大量多样性的合成数据的技术,然后愚弄感知网络将真实界的数据看作是其训练数据的另一种变体。研究人员选择以图像为中心的方式处理数据,以确保网络不依赖于摄像机或环境。

研究人员说:“如描述所示,这个感知网络适用于任何固态的现实世界物体,这些物体可以通过其3D边界立方体(bounding cuboid)来模拟。”“尽管训练过程中从未观察到真实的图像,但感知网络能够在真实图像中可靠地检测到物体的bounding cuboid,即使在有严重的遮挡的情况下也是如此。”

在他们的演示中,研究团队用几个彩色积木和一辆玩具汽车训练目标检测器。系统被教授“块”(blocks)的物理关系,不管这些“块”是堆叠在一起还是彼此相邻放置。

24c9c00eb23bb26e4f4725b0cd88cef8d6a6cc84

在上面的演示视频中,人类操作员向机器人展示了一组立方块。系统然后推断一个适当的程序并按正确的顺序将立方块正确地放置好。因为它在执行过程中会考虑当前世界的状态,因此系统能够实时地从错误中恢复过来。

研究人员将在本周于澳大利亚布里斯班举行的机器人与自动化国际会议(ICRA)上发表他们的研究论文和工作。

该团队表示,他们将继续探索使用合成训练数据进行机器人操纵,以将他们的方法扩展到其他场景。


原文发布时间为:2018-05-23

本文作者:肖琴

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”。

原文链接:一看就会!英伟达新研究教机器人仅通过观察人类行为完成任务

相关文章
|
1月前
|
人工智能 机器人 芯片
英伟达最强 AI 芯片、人形机器人模型炸场!黄仁勋放言英语将成最强大编程语言
在2024年的GTC大会上,英伟达创始人黄仁勋揭幕了新一代AI芯片Blackwell,号称是史上最强AI芯片,目标是推动AI领域的重大进步。
|
1月前
|
人工智能 机器人 Go
人类发明及研究AI机器人是在作死吗?
生化武器、X战警,当时看电影时只是感觉电影很精彩,佩服导演的脑洞大,制作团队技术精湛。但自从 alpha go、chatGPT 越来越多的AI 场景被大众认知,越来越相信总有一天这个美丽的蓝色星球未来的主人会变成机器人,人类将不复存在。
42 3
|
8月前
|
人工智能 自然语言处理 机器人
开箱即用的对话机器人解决方案,涵盖问答型对话、任务型对话和聊天型对话等多种场景,为您提供全方位的对话交互体验。
开箱即用的对话机器人解决方案,涵盖问答型对话、任务型对话和聊天型对话等多种场景,为您提供全方位的对话交互体验。
开箱即用的对话机器人解决方案,涵盖问答型对话、任务型对话和聊天型对话等多种场景,为您提供全方位的对话交互体验。
|
8月前
|
算法 机器人 图形学
具有电动驱动的四足机器人模型研究(Simulink&Matlab代码)
具有电动驱动的四足机器人模型研究(Simulink&Matlab代码)
|
8月前
|
算法 机器人
三自由度PUMA机器人非线性控制研究(Matlab代码、Simulink仿真实现)
三自由度PUMA机器人非线性控制研究(Matlab代码、Simulink仿真实现)
107 0
|
8月前
|
传感器 算法 机器人
使用贝叶斯滤波器通过运动模型和嘈杂的墙壁传感器定位机器人研究(Matlab代码实现)
使用贝叶斯滤波器通过运动模型和嘈杂的墙壁传感器定位机器人研究(Matlab代码实现)
|
8月前
|
机器学习/深度学习 算法 机器人
基于应用值迭代的马尔可夫决策过程(MDP)的策略的机器人研究(Matlab代码实现)
基于应用值迭代的马尔可夫决策过程(MDP)的策略的机器人研究(Matlab代码实现)
|
9月前
|
算法 机器人
遗传算法在机器人路径规划中的应用研究(Matlab代码实现)
遗传算法在机器人路径规划中的应用研究(Matlab代码实现)
|
9月前
|
算法 机器人 定位技术
使用WiFi测量仪进行机器人定位的粒子过滤器研究(Matlab代码实现)
使用WiFi测量仪进行机器人定位的粒子过滤器研究(Matlab代码实现)
|
11月前
|
机器学习/深度学习 人工智能 机器人
一项人工智能、化学和分子机器人的交叉研究,加速创新和药物发现,并简化复杂的化学过程自动化
一项人工智能、化学和分子机器人的交叉研究,加速创新和药物发现,并简化复杂的化学过程自动化

热门文章

最新文章