【CVPR 2018】用狗的数据训练AI,华盛顿大学研发模拟狗行为的AI系统

简介: 一般的机器学习系统都是以人的视角建立,但华盛顿大学和艾伦人工智能研究所的研究人员试图用狗的行为数据训练AI系统。研究人员通过传感器等设备采集了一只爱斯基摩犬的运动数据,并以此来训练AI系统实现三个目标:1、像狗一样行动,预测未来动作;2、像狗一样计划任务;3、从狗行为中学习。

我们已经训练机器学习系统来识别物体,进行导航,或识别面部表情,但尽管可能很难,机器学习甚至没有达到可以模拟的复杂程度,例如,模拟一只狗。那么,这个项目的目的就是做到这一点——当然是用一种非常有限的方式。通过观察一只非常乖巧的狗的行为,这个AI学会了如何像狗一样行动的基础知识。

这是华盛顿大学和艾伦人工智能研究所合作的研究,论文发表在今年6月举办的CVPR。

b86bfd564cff3dd332c2ba0f259a3dc7f3ca0897

摘要

我们研究了如何直接建模一个视觉智能体(visually intelligent agent)。计算机视觉通常专注于解决与视觉智能相关的各种子任务。但我们偏离了这种标准的计算机视觉方法;相反,我们试图直接建模一个视觉智能的agent。我们的模型将视觉信息作为输入,并直接预测agent的行为。为此,我们引入了DECADE数据集,这是一个从狗的视角搜集的狗的行为数据集。利用这些数据,我们可以模拟狗的行为和动作规划方式。在多种度量方法下,对于给定的视觉输入,我们成功地对agent进行了建模。此外,与图像分类任务训练的表示相比,我们的模型学习到的表示能编码不同的信息,也可以推广到其他领域。特别是,通过将这种狗的建模任务作为表示学习,我们在可行走表面预测(walkable surface estimation)和场景分类任务中得到了非常好的结果。

理解视觉数据:模仿狗,学习狗

为什么做这个研究?虽然已经有很多工作在研究模拟感知的子任务,例如识别一个物体并将其捡拾起来,但是“理解视觉数据,达到可以让agent在视觉世界中采取行动并执行任务的程度”,这样的研究很少。换句话说,不是模拟眼睛的行为,而是模拟控制眼睛的主体。

那么为什么选择狗?因为狗是非常复杂的智能体,研究者说:“它们的目标和动机往往是没法预知的。”换句话说,狗狗很聪明,但我们不知道它们在想什么。

作为对这一研究领域的初步尝试,该团队希望通过密切监视狗狗的行为,并将狗狗的运动和行动与所它看到的环境相对应,来观察是否能够建立一个能够准确预测这些行动的系统。

89efae008e71852537fe13b03c0e7fccec10a346

将一套传感器装在一直爱斯基摩犬身上,收集数据

为了达到这一目的,研究者把一套基础传感器装在一只名叫Kelp M. Redmon的爱斯基摩犬身上。他们在Kelp的头部装上一个GoPro相机6个惯性测量单元(分别在腿、尾巴和身体上)用以判断物体的位置,一个麦克风以及一个把这些数据绑在一起的Arduino开发板

他们花了许多小时记录狗狗的活动——在不同的环境中行走,取东西,在狗公园玩耍,吃东西——并把狗的动作与它看到的环境同步。结果是形成了一个在狗的环境中以狗自身为视角的行为数据集(Dataset of Ego-Centric Actions in a Dog Environment),简称为DECADE数据集。研究者用这个数据集来训练一个新的AI智能体。

对这个agent,给定某种感官输入——例如一个房间或街道的景象,或一个飞过的球——以预测狗在这种情况下会做什么。当然,不用说特别细节,哪怕只是弄清楚它的身体如何移动,移向哪里,已经是一项相当重要的任务。

华盛顿大学的Hessam Bagherinezhad是研究人员之一,他解释道:“它学会了如何移动关节以走路,学会了再走路或跑步是如何避开障碍物。”“它学会了追着松鼠跑,跟随者主人走,追逐飞起来的狗玩具(玩飞盘游戏时)。这些都是计算机视觉和机器人技术的一些基本AI任务(例如运动规划、可步行的表面、物体检测、物体跟踪、人物识别),我们一直试图通过为每个任务收集单独的数据来解决。

87949d526e0c326fe99603bab2837e0f7be3f916

研究提出三个问题:(1) 模仿狗的行为:根据狗之前的行为图像,预测狗接下来的行为;(2) 像狗一样规划行动;(3)从狗的行为学习:例如,预测一个可供行走的区域。

这些任务可以产生一些相当复杂的数据:例如,狗模型必须知道,就像真的狗狗一样,当它需要从一个地点移动到另一地点的时候,它可以在哪些地方行走。它不能在树上或汽车上行走,也不能在沙发上行走(取决于房子)。因此,这个模型也学会了这一点,它可以作为一个计算机视觉模型单独部署,用以找出一个宠物(或一个有足机器人)在一张给定图像中可以到达的位置。

c90e13dd779ca027e14d1e3ed44fc167a18a1577


研究人员说,这只是一个初步的实验,虽然取得了成功,但结果有限。后续研究可能会考虑引入更多的感官(例如嗅觉),或者看看一只狗(或许多狗)的模型可以如何推广到其他狗身上。他们的结论是:“我们希望这项工作为我们更好地理解视觉智能和其他生活在我们世界里的智能生物铺平道路。”


原文发布时间为:2018-04-13

本文作者:肖琴

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”。

原文链接:【CVPR 2018】用狗的数据训练AI,华盛顿大学研发模拟狗行为的AI系统

相关实践学习
基于函数计算实现AI推理
本场景基于函数计算建立一个TensorFlow Serverless AI推理平台。
相关文章
|
1月前
|
机器学习/深度学习 人工智能 监控
AI算法分析,智慧城管AI智能识别系统源码
AI视频分析技术应用于智慧城管系统,通过监控摄像头实时识别违法行为,如违规摆摊、垃圾、违章停车等,实现非现场执法和预警。算法平台检测街面秩序(出店、游商、机动车、占道)和市容环境(垃圾、晾晒、垃圾桶、路面不洁、漂浮物、乱堆物料),助力及时处理问题,提升城市管理效率。
AI算法分析,智慧城管AI智能识别系统源码
|
1月前
|
机器学习/深度学习 存储 人工智能
为什么AI处理私有数据,需要使用向量数据库
大语言模型通过概率和向量数据库查询来生成高质量内容,当预测概率低于阈值时,利用相似性从本地数据中获取信息,向量数据库通过向量化、表示、查询、搜索和解码等步骤,帮助模型处理未知数据。
|
3天前
|
数据采集 存储 人工智能
【AI大模型应用开发】【LangChain系列】实战案例4:再战RAG问答,提取在线网页数据,并返回生成答案的来源
【AI大模型应用开发】【LangChain系列】实战案例4:再战RAG问答,提取在线网页数据,并返回生成答案的来源
28 0
|
3天前
|
人工智能 决策智能
【AI Agent系列】【MetaGPT多智能体学习】3. 开发一个简单的多智能体系统,兼看MetaGPT多智能体运行机制
【AI Agent系列】【MetaGPT多智能体学习】3. 开发一个简单的多智能体系统,兼看MetaGPT多智能体运行机制
29 0
|
3天前
|
人工智能 安全 机器人
AI电销机器人系统源码部署:freeswitch安装Windows
在Windows上安装FreeSWITCH:访问官网下载安装程序,运行并按提示安装;选择安装路径和组件;等待安装完成;配置FreeSWITCH,修改设置;启动服务;测试其功能;如遇问题,参考官方文档或进行调试故障排除。记得定期更新维护以保证稳定安全。
|
8天前
|
人工智能 前端开发 Java
Java语言开发的AI智慧导诊系统源码springboot+redis 3D互联网智导诊系统源码
智慧导诊解决盲目就诊问题,减轻分诊工作压力。降低挂错号比例,优化就诊流程,有效提高线上线下医疗机构接诊效率。可通过人体画像选择症状部位,了解对应病症信息和推荐就医科室。
147 10
|
11天前
|
数据采集 人工智能 编解码
二次元专用超分AI模型APISR:在线可用,入选CVPR
【4月更文挑战第15天】APISR是一款由密歇根大学、耶鲁大学和浙江大学联合研发的AI模型,专攻动漫风格的超分辨率问题。在CVPR会议上发表的这项成果,通过理解动漫制作流程,针对性地收集和处理训练数据,提升了动漫图像的清晰度和视觉效果。APISR引入预测导向的压缩模块和平衡的双感知损失函数,有效恢复手绘线条并减少颜色伪影。此外,模型关注图像复杂性,优化训练数据质量和学习效率。尽管面临处理复杂场景和颜色偏差的挑战,APISR为动漫图像处理开辟了新方向。
20 1
二次元专用超分AI模型APISR:在线可用,入选CVPR
|
14天前
|
机器学习/深度学习 数据采集 人工智能
|
16天前
|
人工智能 Cloud Native 算法
数据之势丨AI时代,云原生数据库的最新发展趋势与进展
AI与云数据库的深度结合是数据库发展的必然趋势,基于AI能力的加持,云数据库未来可以实现更快速的查询和决策,帮助企业更好地利用海量数据进行业务创新和决策优化。
数据之势丨AI时代,云原生数据库的最新发展趋势与进展
|
19天前
|
人工智能 安全 数据库
AI日报:这种病毒从生成式AI工具中窃取您的数据
AI日报:这种病毒从生成式AI工具中窃取您的数据
14 0
AI日报:这种病毒从生成式AI工具中窃取您的数据