一、简介
Cityscapes 数据集上专门针对城市街道场景的数据集,整个数据集由 50 个不同 城市的街景组成,数据集包括了 5000 张精准标注的图片和 20000 张粗略标注的图片。
其中精准标注的图片主要用于强监督学习,可分为训练集、验证集和测试集,而粗略标 注的图片主要用于弱监督语义分割算法的训练与测试。在 Cityscapes 数据集中通常使用 19 种常用的类别用于类别分割精度的评估。
官网地址:Cityscapes Dataset – Semantic Understanding of Urban Street Scenes
二、5000张精准标注
示例1:
示例2:
示例3:
详细的示例图片可以去官网看看:Examples – Cityscapes Dataset
三、20000 张粗略标注
示例1:
示例2:
详细的示例图片可以去官网看看:Examples – Cityscapes Dataset
四、类别定义
Group | Classes |
flat | road · sidewalk · parking+ · rail track+ |
human | person* · rider* |
vehicle | car* · truck* · bus* · on rails* · motorcycle* · bicycle* · caravan*+ · trailer*+ |
construction | building · wall · fence · guard rail+ · bridge+ · tunnel+ |
object | pole · pole group+ · traffic sign · traffic light |
nature | vegetation · terrain |
sky | sky |
void | ground+ · dynamic+ · static+ |
五、模型评估服务
官网提供了一个基准套件和一个评估服务器,这样开发者就可以上传模型结果,并获得关于不同任务(像素级、 实例级和全景语义标记以及3d 车辆检测)的排名。
5.1 像素级语义标注
这个是在不考虑更高级别的对象实例或边界信息的情况下,预测图像的每像素语义标签。
截至2021/10/24号,前几位的模型效果排名如下。
5.2 实例级语义标注
这个专注于同时检测对象并对其进行分割。这是对传统对象检测和像素级语义标记(因为每个实例都被视为单独的标签)的扩展。因此,需要算法来提供一组场景中交通参与者的检测,每个检测都与置信度分数和每个实例的分割掩码相关联。
截至2021/10/24号,前几位的模型效果排名如下。
5.3 全景语义标注
它将像素级和实例级语义标记结合在一个称为“全景分割”的任务中。截至2021/10/24号,前几位的模型效果排名如下。
5.4 3D车辆检测
这个重点是车辆的 3D 对象检测,以估计其 3D 参数,如方向和位置。评估类汽车、卡车、公共汽车、火车、摩托车和自行车的对象。每个对象都由一个非模态 2D 边界框以及一个 9 自由度 3D 边界框描述:中心位置、尺寸和方向。
截至2021/10/24号,前几位的模型效果排名如下。
大家可以看看那个排名靠前的模型,是否有公开论文,或是否代码开源,进行参考学习;当然自己搭建的模型也可以上传评估一下,看看效果和排名。
六、下载数据集
官网下载地址:Login – Cityscapes Dataset 注意:这是要注册一个账号,才能下载的;然后来到如下页面:
查找相关的数据集下载就可以了
比如下载gtFine_trainvaltest.zip (241MB)[md5] 训练集和验证集的精细注释(3475 个带注释的图像)和测试集(1525 个图像)的虚拟注释。
官方的处理脚本地址:https://github.com/mcordts/cityscapesScripts
本文直供大家参考和学习,谢谢。