Object SLAM: An Object SLAM Framework for Association, Mapping, and High-Level Tasks 论文解读

简介: Object SLAM: An Object SLAM Framework for Association, Mapping, and High-Level Tasks 论文解读

是一篇来自机器人顶刊T-RO的文章,发表于2023.5。

An Object SLAM Framework for Association, Mapping, and High-Level Tasks

论文:

An Object SLAM Framework for Association, Mapping, and High-Level Tasks | IEEE Journals & Magazine | IEEE Xplore

https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=10128836

572105ef909d4673826ac2c2af09cf9b.png

摘要:

Object SLAM在机器人的高级感知和决策中被认为越来越重要。现有研究在数据关联、对象表示和语义建图方面存在不足,并且经常依赖于额外的假设,限制了它们的性能。

在本文中,我们提出了一个综合的ObjectSLAM框架,专注于基于Object的感知和面向Object的机器人任务。首先,我们提出了一个集成数据关联方法,通过结合参数化和非参数化统计测试来关联复杂条件下的对象。

此外,我们提出了一个鲁棒的离群值鲁棒的质心和尺度估计算法,基于iForest和线对齐来建模对象。然后,通过估计的通用对象模型表示一个轻量级的、面向对象的地图。

考虑到对象的语义不变性,我们将对象地图转换为拓扑地图,以提供语义描述符,实现多地图匹配。

最后,我们提出了一种基于对象驱动的主动探索策略,在抓取场景中实现自主建图。

我们使用一系列公共数据集和真实世界的结果来评估所提出的对象SLAM框架的高效性能,包括建图、增强现实、场景匹配、重定位和机器人操作等方面。

关键词—增强现实、数据关联、机器人技术、语义建图、视觉SLAM。

2c6a192e6c6e472b890b6e30674e52e4.png

主要贡献:

本文的贡献总结如下:

1)我们提出了一种集成数据关联策略,可以有效地聚合对象的不同测量结果,提高关联准确性

2)我们提出了一种基于iForest和线对齐的对象姿态估计框架,该框架对离群值具有鲁棒性,并可以准确估计对象的姿态和大小。

3)我们构建了一个轻量级的面向对象的地图,使用通用模型,并在此基础上开发了一个能够考虑遮挡和碰撞的增强现实应用程序。

4)我们将对象地图扩展为拓扑地图,并设计了一个基于参数化对象信息的语义描述符,实现多场景匹配和基于对象的重定位。

5)我们将object SLAM与机器人抓取任务相结合,提出了一种基于对象驱动的主动探索策略,考虑对象观测的完整性和姿态估计的不确定性,实现精确的对象建图和复杂的机器人抓取。

6)我们提出了一个全面的对象SLAM框架,探索了关键挑战,并在各种场景和任务中展示了其实用性。

20387dbd44944702b45a71bd243a1ca6.png

图3. 对象参数化和iForest的演示。 (a-c) 对象参数化的演示。 (d-e) iForest的演示。

a38b9ccc1b9b491fa573f1bc7b0d36d0.png

图4. 线对齐以初始化对象方向。 (a) 在2D图像中进行对象和线的检测。 (b-d) 在3D空间中进行角度采样。 (e-g) 角度采样过程在2D图像中的投影。

5e200b8e26d94aec82e7f4287d074073.png

图5. 语义拓扑地图和对象描述符。 (a) 实际场景。 (b) 对象级地图。 (c) 语义拓扑地图。 (d) 随机游走描述符。 (e) 单个描述符的3D矩阵可视化。

09976e113d0d427a84e013decdde769f.png

91b36b602555485f91a9bc1a536b7b07.png

图7. 观测完整性测量的示意图。左侧:原始图像。中间:带有点云的对象。右侧:带有表面格点的对象。

95e6a3daad8a405083880817a47f5464.png

 图8. 对象驱动探索的示意图。 (a) 探索中信息增益的不同定义。(b) 在不同相机视角下的信息增益。



目录
相关文章
|
1月前
|
机器学习/深度学习 Web App开发 编解码
论文精度笔记(四):《Sparse R-CNN: End-to-End Object Detection with Learnable Proposals》
Sparse R-CNN是一种端到端的目标检测方法,它通过使用一组可学习的稀疏提议框来避免传统目标检测中的密集候选框设计和多对一标签分配问题,同时省去了NMS后处理步骤,提高了检测效率。
42 0
论文精度笔记(四):《Sparse R-CNN: End-to-End Object Detection with Learnable Proposals》
|
1月前
|
机器学习/深度学习 Web App开发 人工智能
轻量级网络论文精度笔(一):《Micro-YOLO: Exploring Efficient Methods to Compress CNN based Object Detection Model》
《Micro-YOLO: Exploring Efficient Methods to Compress CNN based Object Detection Model》这篇论文提出了一种基于YOLOv3-Tiny的轻量级目标检测模型Micro-YOLO,通过渐进式通道剪枝和轻量级卷积层,显著减少了参数数量和计算成本,同时保持了较高的检测性能。
33 2
轻量级网络论文精度笔(一):《Micro-YOLO: Exploring Efficient Methods to Compress CNN based Object Detection Model》
|
1月前
|
机器学习/深度学习 人工智能 编解码
论文精度笔记(一):《ZERO-SHOT DETECTION WITH TRANSFERABLE OBJECT PROPOSAL MECHANISM》
本论文提出了一种零样本检测方法,通过引入可转移的对象候选机制来关联类别间的共现关系,并使用所有类的置信度分布进行对象置信度预测,以提高对未见类别物体的检测性能。
32 3
论文精度笔记(一):《ZERO-SHOT DETECTION WITH TRANSFERABLE OBJECT PROPOSAL MECHANISM》
|
1月前
|
编解码 人工智能 文件存储
轻量级网络论文精度笔记(二):《YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object ..》
YOLOv7是一种新的实时目标检测器,通过引入可训练的免费技术包和优化的网络架构,显著提高了检测精度,同时减少了参数和计算量。该研究还提出了新的模型重参数化和标签分配策略,有效提升了模型性能。实验结果显示,YOLOv7在速度和准确性上超越了其他目标检测器。
47 0
轻量级网络论文精度笔记(二):《YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object ..》
|
3月前
|
SQL 存储 数据库
|
机器学习/深度学习 算法 数据可视化
深度学习论文阅读目标检测篇(一):R-CNN《Rich feature hierarchies for accurate object detection and semantic...》
 过去几年,在经典数据集PASCAL上,物体检测的效果已经达到 一个稳定水平。效果最好的方法是融合了多种低维图像特征和高维上 下文环境的复杂集成系统。在这篇论文里,我们提出了一种简单并且 可扩展的检测算法,可以在VOC2012最好结果的基础上将mAP值提 高30%以上——达到了53.3%。
163 0
深度学习论文阅读目标检测篇(一):R-CNN《Rich feature hierarchies for accurate object detection and semantic...》
|
数据可视化 数据挖掘 测试技术
【计算机视觉】Open-Vocabulary Object Detection 论文工作总结
Open-Vocabulary Object Detection (OVD)可以翻译为**“面向开放词汇下的目标检测”,**该任务和 zero-shot object detection 非常类似,核心思想都是在可见类(base class)的数据上进行训练,然后完成对不可见类(unseen/ target)数据的识别和检测,除了核心思想类似外,很多论文其实对二者也没有进行很好的区分。
|
缓存 JavaScript 前端开发
NestJS:理解ORM(Object Relational Mapping)
NestJS:理解ORM(Object Relational Mapping)
137 0
|
机器学习/深度学习 编解码 并行计算
深度学习论文阅读目标检测篇(七)中文版:YOLOv4《Optimal Speed and Accuracy of Object Detection》
大多数基于 CNN 的目标检测器基本上都仅适用于推荐系统。例 如:通过城市摄像头寻找免费停车位,它由精确的慢速模型完成,而 汽车碰撞警报需要由快速、低精度模型完成。改善实时目标检测器的 精度,使其能够不仅可以用于提示生成推荐系统,也可以用于独立的 流程管理和减少人力投入。传统 GPU 使得目标检测可以以实惠的价 格运行。最准确的现代神经网络不是实时运行的,需要大量的训练的 GPU 与大的 mini bacth size。我们通过创建一个 CNN 来解决这样的 问题,在传统的 GPU 上进行实时操作,而对于这些训练只需要一个 传统的 GPU。
266 0
|
机器学习/深度学习 编解码 并行计算
深度学习论文阅读目标检测篇(七)中英对照版:YOLOv4《Optimal Speed and Accuracy of Object Detection》
 有大量的技巧可以提高卷积神经网络(CNN)的精度。需要在大 数据集下对这种技巧的组合进行实际测试,并需要对结果进行理论论 证。某些技巧仅在某些模型上使用和专门针对某些问题,或只针对小 规模的数据集;而一些技巧,如批处理归一化、残差连接等,适用于 大多数的模型、任务和数据集。我们假设这种通用的技巧包括加权残 差连接(Weighted-Residual-Connection,WRC)
344 0