看不清摸不著还能识别出物体,目标算法让机器人更聪明

简介:

研究人员开发出新算法,使机器人无需多角度取景,就可以迅速识别出三维空间里的物体。

目前机器人识别三维空间里的物体都是通过多个角度观察来收集信息,从而做出判断,故而常出现反应速度慢和对存储和计算资源的需求量大等问题。对此,研究人员开发出一套新的计算机视觉算法,即使在部分物体被遮挡的条件下,它也能够使机器人直接识别出物体,无需多角度收集信息。

看不清摸不著还能识别出物体,目标算法让机器更聪明

类似传统的用于训练机器人的计算机视觉算法,该算法也需要通过四千个分布在十个不同类别的物体数据的训练,以此来了解这个世界。

当我们需要机器人识别物体时,传统的算法只是用来训练如何识别物体的特征和物体叠加的总体特征,而此处新的算法会计算对象的相似度和物体之间不同之处这两项因素。

具体来看,就是当它需要识别锅和罐头的时候,算法不会花时间检测中空部分,而是寻找其他因素;而当算法确定物体是个锅的时候,它会将重点放在锅的深度或手柄的位置,以确定锅的类型。

对此,Ben Burchfiel博士说:“这样可以释放储存和计算资源,让学习变得更容易。”

不过在识别任务中,很多时候物体都是被遮掩的。虽然传统的深度学习算法能够解析复杂的输入数据,并输出一个简单的预测结果,但是当对象模糊时,传统的算法往往无法给出准确的结果,正确率极低。而这里的新算法可以通过关联的形状特征来构建整个对象。

根据训练结果,嵌入该算法的机器人大约只需花一秒来预测结果,正确率目前可达到75%,而且它无需从不同角度获取物体信息,就可以推断出物体不可见的部分。

Burchfiel表示,目前需要做的就是用大量的数据对这一算法进行训练,以达到更高的准确度和实现对算法的优化。


原文发布时间: 2017-07-21 17:23
本文作者: Lynn
本文来自云栖社区合作伙伴镁客网,了解相关信息可以关注镁客网。
相关文章
|
算法 计算机视觉 网络架构
YOLOv7 | 模型结构与正负样本分配解析
YOLOv7 | 模型结构与正负样本分配解析
2100 0
YOLOv7 | 模型结构与正负样本分配解析
|
API 调度 开发者
探索Python中的异步编程:从asyncio到Trio
本文将带你深入Python异步编程的心脏地带,从asyncio的基本概念到Trio的高级特性,我们将一起揭开Python异步编程的神秘面纱,并探讨它们如何改变我们的编程方式。
|
缓存 JavaScript 前端开发
如何设计交互式应用程序?
【10月更文挑战第7天】如何设计交互式应用程序?交互式应用程序
388 5
|
编解码 前端开发 UED
前端:移动端视口配置
移动端视口配置是指针对移动设备浏览器设置视口的宽度、高度和缩放等属性,以确保网页能根据不同的屏幕尺寸和分辨率进行适配,提供更好的用户体验。合理的视口配置是移动优先设计的关键环节。
WK
|
计算机视觉
QLabel
QLabel是Qt框架中的控件类,主要用于显示文本或图像。它可以显示静态文本、支持富文本和多种图像格式,提供丰富的成员函数如setText、setPixmap等,支持对齐方式和样式表设置,具备一定的交互性,广泛应用于图像标注、处理和交互等场景。
WK
630 0
|
数据采集 监控 测试技术
JKI State Machine的特点与详细介绍
JKI State Machine的特点与详细介绍
390 0
JKI State Machine的特点与详细介绍
【计算机组成原理】原码 反码 补码 移码
一、原码、反码、补码、移码的概念 1. 真值 2. 机器数 1. 原码 2. 反码 3. 补码 4. 移码 二、原码、反码、补码、移码的转换 1. 原码转反码 2. 原码转补码 3. 原码转移码 三、总结
1041 0
【计算机组成原理】原码 反码 补码 移码
|
运维 Serverless 开发者
Serverless简介
Serverless简介自制脑图, Serverless中文意思是“无服务器”,是说开发者再也不用过多考虑服务器的问题,可以更专注在产品代码上,计算资源开始作为服务出现,而不是作为服务器的概念出现。
626 0
Serverless简介
|
域名解析 弹性计算 数据可视化