谷歌公布13GB 3D扫描数据集:17大类、1030个家用物品

简介: 谷歌公布13GB 3D扫描数据集:17大类、1030个家用物品

谷歌的研究者提出了 Google Scanned Objects (GSO) 数据集,这是一个由超过 1000 个 3D 扫描的家用物品组成的精选集。



近年来,深度学习技术使得计算机视觉和机器人领域的许多进展成为可能,但训练深度模型需要各种各样的输入,以泛化到新的场景。

此前,计算机视觉领域已经利用网页抓取技术收集了数百万个主题的数据集,包括 ImageNet、Open Image、Youtube-8M、COCO 等。然而,给这些数据集贴标签仍是一个劳动密集型工作,标签错误可能会影响到对技术进步的感知,而且这种策略也很难推广至 3D 或真实世界的机器人数据上。与图像不同的是,目前网络上并没有大规模、高质量的 3D 场景,而从真实世界收集这类数据又极具挑战性。此外,人工标注员也很难从图像中提取 3D 几何特性。

一般来说,使用 Gazebo、Bullet、MuJoCo、Unity 等工具对机器人和环境进行仿真可以减轻上述限制。但是,仿真毕竟不完全是真实世界,即使一个场景是直接通过对真实环境的 3D 扫描建立起来的,扫描中的离散对象也会像固定的背景物一样,不会像真实世界的对象那样对输入做出回应。

因此,关键问题在于提供一个高质量的 3D 对象模型库,这些模型可以整合到物理和视觉建模中,为深度学习提供所需的多样性。

为了解决这个问题,谷歌的研究者提出了 Google Scanned Objects (GSO) 数据集,这是一个由超过 1000 个 3D 扫描家用物品组成的精选集,可用于 Ignition Gazebo、Bullet 模拟器和其他可以读取 SDF 模型格式的工具。


在一篇论文中,研究者介绍了该数据集的收集、管理、扩展等内容。


论文链接:https://arxiv.org/pdf/2204.11918.pdf

据不完全统计,GSO 数据集已经在计算机视觉、计算机图形学、机器人操作、机器人导航和 3D 形状处理等 10 个项目的 12 篇论文中得到应用:

该研究贡献主要有几点:

提出 Google Scanned Objects 数据集;

3D 扫描 pipeline 设计;

3D 扫描管理和发布过程;

该数据集在研究领域中的影响。


数据集的创建

GSO 数据集起源于 2011 年谷歌的云机器人计划,目的是让机器人基于普通家用物品的高保真 3D 模型,能够在自己的环境中识别和抓取物体。

然而,除了物体识别和机器人抓取之外,3D 模型还有很多用途,包括用于物理模拟的场景构建和用于终端用户应用的 3D 物体可视化。因此,谷歌研究院发起了一个项目,将 3D 体验大规模引入谷歌,以低于传统商业级产品摄影的成本收集大量家用物品的 3D 扫描图像。

这是一项端到端的工程,包括物体获取、新颖的 3D 扫描硬件、高效的 3D 扫描软件、快速 3D 渲染的质量保障、网络与移动浏览器,以及人机交互研究。

在收集数据之后,研究者构建了一个 pipeline,让这些数据能以各种格式使用。

3D 扫描 pipeline

即使限于家用物品的领域,3D 扫描也会带来独特的挑战,包括高效的物理扫描设置、目标照明、相机可靠性、扫描仪性能、配色、纹理渲染,以及处理光学上不一致的材料,比如近白色、有光泽或透明的表面。

专用的 3D 扫描硬件是劳动密集型的,性价比不高。为了进行大规模扫描,还需要一些更具可用性和可靠性的工具。

因此,研究者设计了自己的专用扫描硬件和软件(图 2),能够在 10 分钟内扫描物体并生成高分辨率模型。控制光线的物理外壳(图 2b)使用两台机器视觉相机和一台投影仪进行结构光扫描,捕捉 3D 几何图形,并使用单独的单反高分辨率相机以产品友好的光线捕捉纹理。

项目第一年结束的时候能够做到每周超过 400 次扫描,过程中,研究团队共获得了 100K 份 360 度照片旋转和 10k 份完全 3D 扫描的独特对象。

图 2。

图 3:作为校准过程的扫描。(a) 校正模式使 2D pipeline 能够精确对齐相机。(b) 计算机控制的投影仪为 3D 扫描物体创造了类似的图案。(c) 合适的模式能够以亚像素精度探测位置。(d) 提取扫描物体的完整 3D 形状。

图 4:扫描的物品需要通过质量检查。(a) 许多物品被捕获为高质量的封闭流形 mesh。(b) 有的物体很少产生无效的 mesh,但有时会出现变形。

仿真模型转换

这些原始的扫描模型使用协议缓冲元数据、非常高分辨率的可视化、不适合模拟的格式。对象的一些物理属性,比如质量,会被捕获,但诸如摩擦之类的表面属性在元数据中则没有表示。

为了让这些扫描的模型能够在仿真系统中使用,每个模型都通过一个 pipeline 进行下列步骤:

过滤无效对象。

分配对象名称。

验证对象 mesh。

计算物理属性。

构造碰撞体积。

减小模型尺寸。

创建 SDF 模型。

创建缩略图。

打包模型。


数据集属性

组成

GSO 数据集包含 1030 个扫描对象和相关的元数据,总计 13GB,根据 CCBY 4.0 License 授权。表 III.1 分解了数据集中的模型类别。

表 III.1

优势

自动化 pipeline 可以快速生成大量模型,而无需手工处理。因为这些模型是扫描的,而不是手工建模的,所以它们是真实的,而不是理想中的,这减少了将学习从模拟转移到真实世界的困难。

扫描仪的玻璃平台可以从各个方面扫描模型,包括底座,不像其他扫描仪有不透明的平台。类似地,从环境中提取的模型通常缺少像底座这样起到衔接作用的遮挡区域。

因为该扫描仪根据投影图案而不是深度照相机数据重建表面形状,所以得到的 mesh 具有高保真度。光滑的表面是平滑的,轮廓边缘是准确的 (图 5)。相比之下,RGB-D 数据得到的 mesh,可能出现斑驳和不规则,特别是在轮廓上。

图5


限制

同时,这个数据集也有一些限制:扫描仪的捕捉区域不能容纳比面包箱 (约 50 厘米) 大的对象,因此该数据集不包括在其他数据集中较大的对象,如椅子、汽车或飞机。同样,扫描分辨率是有限的,所以非常小的对象不能以合理的保真度建模。此外,生成的纹理是漫反射的:高度镜面或透明的对象不能表征出来,生成结果也不够理想。

相关文章
|
存储 Dragonfly 弹性计算
2023年阿里云服务器2核4G配置收费标准与活动价格参考,价格297.98元1年起
2核4G配置的云服务器通常是普通企业用户的首选配置,2023年新用户租用阿里云轻量应用服务器低至108元首年,2核4G配置目前活动价格仅需297.98元1年起,不过阿里云不同实例类型的2核4G云服务器配置,产品价格也各不相同。而在平时购买和活动期间买价格也是不一样的。本文主要为大家介绍目前阿里云服务器2核4G配置收费标准与活动价格,以供参考。
1083 0
2023年阿里云服务器2核4G配置收费标准与活动价格参考,价格297.98元1年起
|
JavaScript 前端开发 API
uniapp的优势与劣势
uniapp的优势与劣势
718 1
|
计算机视觉
教你如何玩转Modelscope (一、图片编辑与描述生成)
本文通过一个有趣的图片处理例子,教你如何利用modelscope强大且多样的模型能力去解锁你专属的图片编辑能力。
3769 1
教你如何玩转Modelscope (一、图片编辑与描述生成)
|
算法 机器人 Linux
开源项目推荐:3D点云处理软件CloudCompare,基于Qt和OpenGL
开源项目推荐:3D点云处理软件CloudCompare,基于Qt和OpenGL
6899 0
开源项目推荐:3D点云处理软件CloudCompare,基于Qt和OpenGL
|
存储 弹性计算 负载均衡
阿里云服务器全方位介绍(产品优势、应用场景、使用须知等)
阿里云服务器全方位介绍(产品优势、应用场景、使用须知等)阿里云服务器是什么?云服务器ECS是一种安全可靠、弹性可伸缩的云计算服务,云服务器可以降低IT成本提升运维效率,免去企业或个人前期采购IT硬件的成本,阿里云服务器让用户像使用水、电、天然气等公共资源一样便捷、高效地使用服务器。阿里云服务器具有安全、稳定、弹性升降配、高性能、易用可扩展等优势
1629 0
|
数据采集 人工智能 数据挖掘
Python 编程基础与实战:从入门到精通
本文介绍Python编程语言,涵盖基础语法、进阶特性及实战项目。从变量、数据类型、运算符、控制结构到函数、列表、字典等基础知识,再到列表推导式、生成器、装饰器和面向对象编程等高级特性,逐步深入。同时,通过简单计算器和Web爬虫两个实战项目,帮助读者掌握Python的应用技巧。最后,提供进一步学习资源,助你在Python编程领域不断进步。
|
文字识别 自然语言处理 数据可视化
Qwen2.5 全链路模型体验、下载、推理、微调、部署实战!
在 Qwen2 发布后的过去三个月里,许多开发者基于 Qwen2 语言模型构建了新的模型,并提供了宝贵的反馈。在这段时间里,通义千问团队专注于创建更智能、更博学的语言模型。今天,Qwen 家族的最新成员:Qwen2.5系列正式开源
Qwen2.5 全链路模型体验、下载、推理、微调、部署实战!
|
Java 程序员 C++
什么是面向对象编程
【7月更文挑战第17天】什么是面向对象编程
458 2
|
存储 安全 开发者
如何删除 Docker 镜像、容器和卷?
【5月更文挑战第11天】
2682 2
如何删除 Docker 镜像、容器和卷?
|
Oracle 关系型数据库 Linux
解决VMmare虚拟机安装过程没有权限问题
解决VMmare虚拟机安装过程没有权限问题
936 0