斯坦福公布3D街景数据集:2500万张图像,8个城市模型 | 下载

简介:
本文来自AI新媒体量子位(QbitAI)

近日,斯坦福大学的研究人员公布了一个数据集,其中包含带有相机姿态的街景数据、8个城市的3D模型和拓展的元数据。这个数据集数据量庞大,街景数据集就包含2500万张图像和1.18亿个匹配的图像对。

数据集可用于学习6DOF相机姿态估计/视觉运动、图像匹配及各种三维估计。比如下面的这个例子:



为了得到这个数据集,斯坦福的研究人员开发了一个系统,整合来自谷歌街景图像和地理元数据的城市间地理信息系统,这其中并不需要人工标注。


城市3D模型

这个数据集涵盖了纽约、芝加哥、华盛顿、拉斯维加斯、佛罗伦萨、阿姆斯特丹、旧金山和巴黎市中心及周边地区。研究人员正逐步放出这些城市的3D模型、街景图片和元数据。模型是通过本身的地理标注和加工生成的生成的,下面是一些3D模型的示例快照。

8个城市中6个城市的覆盖范围如下:

数据集细节

数据集由2500万谷歌街景图像形成的1.18亿数据对组成。研究人员在上述城市的特定区域收集图像,根据城市的3D模型,对外立面密集采样和射线追踪,找到所有街景在无遮挡情况下相同的目标点的全景图。

研究人员掌握了每张图像街景相机的地理位置和目标点的位置。得益于谷歌街景的360度全景图,研究人员计算出镜头方向和俯仰角度,捕捉到一个640x640的全景图像,显示了中心各处的目标点。

如果两张图像显示同一个物理目标点,则配成一对。通常来说,每个目标点通常被2至7个对应的街景图像观察到。一个图像由一个640x640的jpg和命名相同的txt给出,其中包含元数据,例如相机和目标点的地理位置,距离目标的距离或相机角度。因为图像的文件名是街道视图位置和目标点编码的唯一ID,因此能够容易地识别出相应图像。最后,图像被压缩成多个zip文件。

相关论文

这个数据集的相关研究还得追溯到去年。

在2016年欧洲计算机视觉会议(ECCV 2016)上,斯坦福大学的研究人员发表了一篇名为《GENERIC 3D REPRESENTATION VIA POSE ESTIMATION AND MATCHING》论文。

在这篇论文中,研究人员通过解决一组基本的代理3D任务学习通用的3D表示,即以对象为中心的相机姿态估计和宽基线特征匹配。

经过一年多的探索,迄今为止,研究人员已经开发出独立的语义和3D表示,他们在项目网页上表示,研究整合它们的具体技术是一个值得研究的未来方向。

资料下载

GitHub数据集地址:

https://github.com/amir32002/3D_Street_View

斯坦福官方项目介绍:

http://3drepresentation.stanford.edu/

论文地址:

http://cvgl.stanford.edu/papers/zamir_eccv16.pdf

城市3D街景示例:

https://github.com/amir32002/3D_Street_View/tree/master/3D_cities_snapshots

祝你在3D世界玩得开心~

本文作者:安妮 
原文发布时间:2017-10-15
相关文章
|
设计模式 前端开发 数据库
Python Web开发:Django框架下的全栈开发实战
【10月更文挑战第27天】本文介绍了Django框架在Python Web开发中的应用,涵盖了Django与Flask等框架的比较、项目结构、模型、视图、模板和URL配置等内容,并展示了实际代码示例,帮助读者快速掌握Django全栈开发的核心技术。
809 45
|
算法 数据挖掘 索引
Pandas数据排序:单列与多列排序详解
本文介绍了Pandas库中单列和多列排序的方法及常见问题的解决方案。单列排序使用`sort_values()`方法,支持升序和降序排列,并解决了忽略大小写、处理缺失值和索引混乱等问题。多列排序同样使用`sort_values()`,可指定不同列的不同排序方向,解决列名错误和性能优化等问题。掌握这些技巧能提高数据分析效率。
813 9
|
机器学习/深度学习 调度 计算机视觉
深度学习中的学习率调度:循环学习率、SGDR、1cycle 等方法介绍及实践策略研究
本文探讨了多种学习率调度策略在神经网络训练中的应用,强调了选择合适学习率的重要性。文章介绍了阶梯式衰减、余弦退火、循环学习率等策略,并分析了它们在不同实验设置下的表现。研究表明,循环学习率和SGDR等策略在提高模型性能和加快训练速度方面表现出色,而REX调度则在不同预算条件下表现稳定。这些策略为深度学习实践者提供了实用的指导。
740 2
深度学习中的学习率调度:循环学习率、SGDR、1cycle 等方法介绍及实践策略研究
|
机器学习/深度学习 算法 物联网
大模型进阶微调篇(一):以定制化3B模型为例,各种微调方法对比-选LoRA还是PPO,所需显存内存资源为多少?
本文介绍了两种大模型微调方法——LoRA(低秩适应)和PPO(近端策略优化)。LoRA通过引入低秩矩阵微调部分权重,适合资源受限环境,具有资源节省和训练速度快的优势,适用于监督学习和简单交互场景。PPO基于策略优化,适合需要用户交互反馈的场景,能够适应复杂反馈并动态调整策略,适用于强化学习和复杂用户交互。文章还对比了两者的资源消耗和适用数据规模,帮助读者根据具体需求选择最合适的微调策略。
4519 5
|
存储 应用服务中间件 API
高效C++项目实战:秋招简历项目解析(提供源码下载)
高效C++项目实战:秋招简历项目解析(提供源码下载)
|
数据采集 机器学习/深度学习 存储
性能调优指南:针对 DataLoader 的高级配置与优化
【8月更文第29天】在深度学习项目中,数据加载和预处理通常是瓶颈之一,特别是在处理大规模数据集时。PyTorch 的 `DataLoader` 提供了丰富的功能来加速这一过程,但默认设置往往不能满足所有场景下的最优性能。本文将介绍如何对 `DataLoader` 进行高级配置和优化,以提高数据加载速度,从而加快整体训练流程。
2705 0
|
存储 弹性计算 数据处理
阿里云对象存储OSS怎么收费?包年包月和按量付费价格表
阿里云对象存储OSS提供灵活的计费方案,包括存储费、流量费和请求费等。用户可选择按量付费或包年包月模式。标准型存储按量付费为0.09元/GB/月,包年包月则有多种套餐选择,如9元/年40GB和99元/年100GB。OSS流量费仅针对公网出方向,并区分闲忙时段。此外还提供流量包服务。更多详情及特殊需求费用(如数据处理、传输加速等)
|
开发工具 git
git如何不上传指定的文件或文件夹
【7月更文挑战第9天】平时写代码的时候有很多测试文件或者静态文件,没必要上传到git上,不仅占资源更新还麻烦,以下介绍如何忽略不需要上传的文件或文件夹。
1495 8
|
TensorFlow 算法框架/工具 Python
成功解决File "frozen importlib._bootstrap", line 219, in _call_with_frames_removed ImportError: DLL lo
成功解决File "frozen importlib._bootstrap", line 219, in _call_with_frames_removed ImportError: DLL lo
成功解决File "frozen importlib._bootstrap", line 219, in _call_with_frames_removed ImportError: DLL lo
|
开发工具 对象存储
fs.oss.accessKeyId和fs.oss.accessKeySecret。
fs.oss.accessKeyId 和 fs.oss.accessKeySecret 是阿里云 OSS (Object Storage Service) 服务的两个访问密钥,用于访问和操作阿里云 OSS 存储空间中的数据。
2227 1

热门文章

最新文章