机器人,给我来一瓶82年的农夫山泉

本文涉及的产品
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_高级版,每接口累计50万次
NLP自然语言处理_基础版,每接口每天50万次
简介: MIT计算机科学和人工智能实验室(CSAIL)和多伦多大学的研究人员开发一个虚拟家园“VirtualHome” ,不仅让虚拟机器人成功做家务,还创建了一个用自然语言描述的家庭任务数据库,将来可能有助于亚马逊的Alexa等系统执行更复杂的任务。

“机器人,给我来一瓶82年的农夫山泉。”

收到这个指令,机器人肯定一脸懵逼。

先不说82年的农夫山泉肯定找不到,更现实的问题是,即便是有一瓶现成的农夫山泉,机器人也需要人类更明确、程序化的指令才能完成这个任务,他们不能轻易推断和推理。

MIT计算机科学和人工智能实验室(CSAIL)和多伦多大学的研究人员受《模拟人生》(The Sims)启发,开发一个虚拟家园“VirtualHome” ,不仅让虚拟机器人成功地制作了咖啡、打开烤面包机、在沙发上休息,研究人员还创建了一个用自然语言描述的家庭任务数据库,将来可能有助于亚马逊的Alexa等系统执行更复杂的任务。

00cfe809ff490016d1070a1873bc465d7a841ed5

VirtualHome:模拟家庭八个场景中的1000个交互

VirtualHome是一个3D环境,它允许模拟和生成活动的视频,并将它们作为动作和交互的序列。

VirtualHome基于三个主要模块:

家庭任务的知识库,包含如何执行某些公共任务的指令;VirtualHome环境,一个模拟和生成这些任务的视频的3D模拟器,以及允许从描述或视频演示生成程序的脚本生成模型

eba18dc1378b7d12205e7e085abe24c93fa8cf97

团队使用了近3000个不同活动的程序来训练这个系统,这些活动被进一步细分为计算机的子任务来理解。这是因为机器人与人类不同,它们需要更明确的指令来完成简单的任务,不能轻易地推断和推理。

例如,一个人可能会告诉另外一个人:“打开电视,在沙发上看吧。”在这句话中,像诸如“拿遥控器”和“坐/躺在沙发上”这样的动作被省略了,因为它们是人类常识的一部分。

为了更好地向机器人演示这类任务,需要更详细地描述操作。

006649ee118aeebadd12305e111dcf16148d1b7c

仅看电视这个任务,就分了多个步骤

为此,研究团队首先收集了家庭活动的口头描述,然后将它们翻译成简单的代码。像“打开电视,在沙发上看吧”这样的指令可能包括以下步骤:

走到电视前,打开电视,走到沙发前,坐在沙发上,看电视。

2462bc75105ee1e9daafcc36103a458ce8d1405c

一旦这些程序被创建,这个团队将它们输入到VirtualHome 3-D模拟器,然后将它们转换成视频,虚拟代理将执行程序定义的任务,无论这些任务是看电视、将锅放在炉子上,还是打开和关闭烤面包机。

该团队的虚拟机器人可以在VirtualHome的世界中执行1000个这样的交互,其中有八个不同的场景,包括客厅、厨房、餐厅、卧室和家庭办公室。

程序的独特之处:包含了执行活动所需的所有步骤

来看一看是具体怎么操作的。

团队收集了一个专门针对机器人的家庭活动的大型知识库,数据集包含活动以及程序的自然语言描述,以一系列步骤的形式表示活动的正式符号。这些程序的独特之处在于它们包含了执行活动所需的所有步骤。

每个任务都有一个高级名称和一个自然语言指令,然后团队为这些任务收集“程序”(下图左中),标注者(annotators)将指令“翻译”为简单的代码。

904e7155d8cc1e4132422a141a9951d7f5172f13

接着,团队在VirtualHome-3D模拟器中执行最频繁的(内部)操作,能够驱动代理执行由程序定义的任务。团队提出了从文本(上图顶部)和视频(上图底部)自动生成程序的方法,从而通过语言和视频演示驱动代理。

1bfbdf763968589c2d9bd14dd500519b65fbeae2

上图描述在VirtualHome中,代理根据描述执行生成的程序。注意,最上面的代理使用他的左手打开冰箱和抓取一个物品,因为他右手已经拿了一个物体。另外,代理还有一些限制,例如,在第三排,代理穿着衣服坐在马桶上。此外,有时携带的物品会由于对撞机的不精确而轻微地穿透代理的身体。

未来:机器人可能摆脱制造商编写的任务,从YouTube上也能学习

该项目由CSAIL和多伦多大学等高校的研究人员共同开发,将在本月在盐湖城举行的CVPR会议上present。

亚利桑那州立大学艺术媒体和工程系的研究助理Qiao Wang说:“这一工作将有助于未来真正的机器人个人助理,机器人都可以通过聆听或观察身边的特定人员来学习任务,而不是制造商编写的每项任务。这使得机器人可以以个性化的方式完成任务,甚至有一天可以通过这种个性化的学习过程调用情感联系。“

此外,研究的结果不仅仅是完成一个训练机器人做家务的系统,它还是一个使用自然语言描述的家庭任务的大型数据库。像亚马逊这样的公司正在努力在家里开发类似Alexa的机器人系统,最终可以使用这些数据来训练他们的模型来完成更复杂的任务。

未来,该团队希望使用实际视频来训练机器人,而不是《模拟人生》这样风格的模拟视频,这将使机器人通过观看YouTube视频来学习。该团队还致力于实施奖励学习系统,让代理在正确执行任务时得到积极的反馈。


原文发布时间为:2018-06-3

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”。

原文链接:机器人,给我来一瓶82年的农夫山泉

相关文章
|
7月前
|
运维 安全 机器人
客服机器人
客服机器人
145 2
|
4月前
|
监控 前端开发 机器人
RPA机器人
【8月更文挑战第4天】RPA机器人
205 3
|
7月前
|
传感器 人工智能 监控
牧业机器人
牧业机器人
64 2
|
机器学习/深度学习 敏捷开发 传感器
四足机器人
四足机器人的步态研究和分析是机器人控制和运动学领域的重要研究方向,主要涉及到四足机器人的运动规划、运动控制、步态优化和机器人稳定性等问题。
289 2
|
机器学习/深度学习 算法 机器人
智能问答机器人
    智能问答机器人目前已经在自动化客服领域得到了广泛的应用,取得不错的效果。这种技术可以比较好地使用在各种咨询类的场景中,如售前的导购、售后的服务、医院的导诊、甚至医疗的辅助诊断等等。机器人可以迅速地响应用户的请求,提升服务的体验。也可以同时服务大量的用户,极大降低企业提供服务的成本。智能问答机器人一般采用一问一答的方式,高级一些的会采用多轮对话和主动对话的方式,
12038 0
|
机器人
扣扣机器人
牙叔教程 简单易学 使用场景 群内关键词触发, 发送指定文本
115 0
扣扣机器人
|
传感器 机器人 大数据
机器人能互相学习?
机器人能互相学习?
148 0
机器人能互相学习?
|
人工智能 机器人
人和机器人的未来
人和机器人的未来
152 0
|
安全 机器人
机器人的宿命
我们假定机器人象征的是一个被奴化的性欲,那么我们也会承认,机器人的解体对人来说是一场他自身性欲望解放的象征剧——人在以他自己的形象为模范,将它奴役之后,又将之摧毁。
166 0
|
机器人 开发工具
小I机器人初探
很早就知道小I机器人做的不错,但是一直没有时间去研究,趁着元旦放假,下来.Net的SDK好好研究了一下
679 0