开发者社区> 玄学酱> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

BAIR论文:通过“元学习”和“一次性学习”算法,让机器人快速掌握新技能

简介: 并且已经成功应用到包括计算机视觉和药物研发在内的具有高维数据的领域。今年5月,OpenAI也发布了类似的在虚拟场景下通过一次性学习,完成堆叠方块等任务的论文。
+关注继续查看

我们都知道,深度学习是在大数据的背景下火起来的,传统的基于梯度的深度神经网络需要大量的数据学习,而绝大多数的深度学习内容否基于大数据量下的广泛迭代训练,当遇到新信息时往往会出现模型失效的情况从而需要重新进行学习。在机器人领域,深度神经网络可以是机器人展示出复杂的技能,但在实际应用中,一旦环境发生变化,从头学习技能并不可行。因此,如何让机器“一次性学习”,即在“看”了一次演示后无需事先了解新的环境场景,能在不同环境中重复工作尤为重要。

研究发现,具有增强记忆能力的架构如神经图灵机(NTMs)可以快速编码和见多新信息,从而起到消除常规模型的缺点。在本论文中,作者介绍了一种元-模拟学习(Meta-Imitation Learning,MIL)算法,使机器人可以更有效学习如何自我学习,从而在一次演示后即可学得新的技能。与之前的单次学习模拟方法不同的是,这一方法可以扩展到原始像素输入,并且需要用于学习新技能的训练数据明显减少。从在模拟平台和真实的机器人平台上的试验也表明了这一点。

BAIR论文:通过元学习和一次性学习算法,让机器人快速掌握新技能

目标:赋予机器人在只“看过”一次演示的情况下,学习与新物品互动的能力。

做法:

  • 收集大量任务的Demo;

  • 使用元-模拟学习进行训练;

  • 在未知的新任务中进行测试。


BAIR论文:通过元学习和一次性学习算法,让机器人快速掌握新技能

创新内容:在第一个全连接层通过偏差转换增加梯度表现。

BAIR论文:通过元学习和一次性学习算法,让机器人快速掌握新技能

模拟测试环节,这一环节使用算法提供的虚拟3D物品进行模拟,MIL比Contexual和LSTM更好地完成了任务。

BAIR论文:通过元学习和一次性学习算法,让机器人快速掌握新技能

在实际场景测试环节,该团队设计了一个抓取物品并将其放到指定容器中的任务。从上图我们可以看到,在这一环节用于训练的物品与实际测试的物品无论在形状、大小、纹理上都有着差别,MIL算法同样较好地完成了任务。

BAIR论文:通过元学习和一次性学习算法,让机器人快速掌握新技能

雷锋网发现,除了BAIR,Google Deepmind(参见雷锋网(公众号:雷锋网)之前文章《只训练一次数据就能识别出物体,谷歌全新 AI 算法“单次学习”》)、OpenAI也有在进行关于“一次性学习”的研究。“一次性学习”通常被认为是计算机视觉中的对象分类问题,旨在从一个或仅少数几个训练图像中学习关于对象类别的信息,并且已经成功应用到包括计算机视觉和药物研发在内的具有高维数据的领域。今年5月,OpenAI也发布了类似的在虚拟场景下通过一次性学习,完成堆叠方块等任务的论文。

在《人类的由来》中,达尔文这样写道:“人和其他高等动物在精神上的差异虽然很大,但这种差别肯定只是程度上、而非种类上的差别。”而这些在一次性学习和元学习上的研究也证明,当前的人工智能与未来世界的超级人工智能之间的差异,或许也只是程度上的差异,而非种类上的差异。在深度学习发展的过程中,类似的优化看起来只是一小步,但加速化发展的趋势已经很明显:当你在阅读传统期刊上的论文时,在Arxiv上或许已经出现了新的替代版本。或许在不久之后,创造出更聪明、具有适应力的实用机器人并不是难事。



本文作者:岑大师
本文转自雷锋网禁止二次转载,原文链接

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
机器学习(三):线性模型
机器学习(三):线性模型
28 0
机器学习系列(13)_PCA对图像数据集的降维_02(下)
【1】降维:会减少特征,删除数据,可能使得模型受影响 【2】噪音:衡量特征之间的线性相关 【3】PCA(主成分分析)使用样本方差作为信息量衡量的指标
44 0
机器学习系列(13)_PCA对图像数据集的降维_02(上)
【1】降维:会减少特征,删除数据,可能使得模型受影响 【2】噪音:衡量特征之间的线性相关 【3】PCA(主成分分析)使用样本方差作为信息量衡量的指标
42 0
机器学习新宠:对比学习论文实现大合集,60多篇分门别类,从未如此全面(一)
机器学习新宠:对比学习论文实现大合集,60多篇分门别类,从未如此全面(一)
44 0
【机器学习】决策树算法
在前一期介绍搭建结合机器学习的CI/CD管道时,无意中提到了算法分类。在受监督学习的分类中,有一个既适用于回归又适用于分类的算法,即我们今天要介绍的决策树算法(CART, Classification and Regression Tree)。
1747 0
机器器学习算法系列列(1):随机森林
随机森林原理 顾名思义,是用随机的方式建立一个森林,森林里面有很多的决策树组成,随机森林的每一棵决 策树之间是没有关联的。在得到森林之后,当有一个新的输入样本进入的时候,就让森林中的每 一棵决策树分别进行一下判断,看看这个样本应该属于哪一类(对于分类算法),然后看看哪一 类被选择最多,就预测这个样本为那一类。
1046 0
使用Weka快速实践机器学习算法
【译者注】在当下人工智能火爆发展的局面,每时每刻都有新的技术在诞生,但如果你是一个新手,Weka或许能帮助你直观、快速的感受机器学习带来的解决问题的新思路。 Weka使机器学习的应用变得简单、高效并且充满乐趣。
2200 0
+关注
玄学酱
这个时候,玄酱是不是应该说点什么...
20683
文章
438
问答
来源圈子
更多
+ 订阅
文章排行榜
最热
最新
相关电子书
更多
低代码开发师(初级)实战教程
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载
冬季实战营第三期:MySQL数据库进阶实战
立即下载