MapillaryVistas数据集的简介
MapillaryVistas是世界上最大、最多样化的像素精确,和特定实例标注的街道级图像公开数据集。Mapillary Vistas数据集是一个新建立的,大场景的街景数据集,包括25000张高分辨率的彩色图像,分成66个类,其中有37个类别是特定的附加于实例的标签。对物体的标签注释可以使用多边形进行稠密,精细的描绘。我们的数据集比Cityscapes的精细注释总量大5倍,并包含来自世界各地在各种条件下捕获的图像,包括不同天气,季节和时间的图像。
图像由经验丰富的摄影师利用不同的成像设备(手机,平板电脑,运动相机,专业捕捉装备)进行拍摄捕捉。通过这种方式,我们的数据集涵盖了多样性,丰富的细节以及地理信息。为了使数据集能作为一个基准进行各种任务,我们定义语义图像分割以及实例图像分割,旨在进一步开发用于视觉道路场景理解的先进算法。下图就是本文对图像进行分类的标签,包括大类以及在大类中分的小类。源于International Conference on Computer Vision (ICCV 2017)。
1、数据集特点
MapillaryVistas拥有25k街景图像(18ktrain,2k val,5k test),分辨率广泛。数据集的“研究版”被密集注释(98%像素coverage),包含28个stuff和37个thing类别。
25,000个高分辨率图像(分为18,000个用于训练,2,000个用于验证,5,000个用于测试; 平均分辨率为~9百万像素),带有大于200万个手动绘制多边形的像素标注;
100个目标类别,其中60个特定于实例(即用于枚举目标);
全球地理覆盖范围,覆盖北美和南美,欧洲,非洲,亚洲和大洋洲;
天气条件(太阳,雨,雪,雾,阴霾)和拍照时间(黎明,白天,黄昏,甚至夜晚)的变化;
大范围的相机传感器,不同的焦距,图像宽高比和不同类型的相机噪声;
不同的拍照视点(来自道路,人行道和off-road);
MapillaryVistas数据集的下载
参考论文: The Mapillary Vistas Dataset for Semantic Understanding of Street Scenes
https://research.mapillary.com/publication/iccv17a/
MapillaryVistas数据集的使用方法
推荐文章:mapillary
https://research.mapillary.com/