Wilddash2 | 最新自动驾驶全景分割数据集!CVPR2022

简介: 本文提出了三点改进自动驾驶场景下全景分割的方法。首先,本文提出的标签策略统一了四个目前主流的自动驾驶全景分割数据集,并添加了新的车辆标签(皮卡车和货车)来清理混乱的标签。为了将新标签添加至现有设置中,本文提供了Mapillary Vistas、IDD、Cityscapes数据集的完整新标签信息。

原文首发微信公众号【自动驾驶之心】:一个专注自动驾驶与AI的社区(https://mp.weixin.qq.com/s/NK-0tfm_5KxmOfFHpK5mBA



标题:Unifying Panoptic Segmentation for Autonomous Driving

链接:https://openaccess.thecvf.com/content/CVPR2022/papers/Zendel_Unifying_Panoptic_Segmentation_for_Autonomous_Driving_CVPR_2022_paper.pdf

统一主流全景分割数据集!

后台回复【WD2】下载论文!


1摘要



本文提出了三点改进自动驾驶场景下全景分割的方法。首先,本文提出的标签策略统一了四个目前主流的自动驾驶全景分割数据集,并添加了新的车辆标签(皮卡车和货车)来清理混乱的标签。为了将新标签添加至现有设置中,本文提供了Mapillary Vistas、IDD、Cityscapes数据集的完整新标签信息。


其次,本文介绍了新的自动驾驶场景全景分割数据集——Wilddash2 (WD2),该数据集包含来自世界各地的 5000 多个独特的驾驶场景,重点关注具有视觉挑战性的场景,例如不同的天气条件、照明情况和相机特性。本文探索了视觉危险分类器在数据集创建过程中预先过滤具有挑战性帧的作用。


最后,为了表征算法在数据分布外的鲁棒性,本文引入了全景分割危险感知测试和负面测试,并增加了对这两个概念的信心的显著性统计计算。此外,本文提出了一种可视化全景分割错误的新技术。


本文的实验表明视觉危害对全景分割的负面影响,来自 WD2 数据集的额外数据提高了挑战性视觉场景的性能,从而提高了真实场景中的鲁棒性。


2数据集设计



本文结合以下四个最有价值的特征建立Wilddash2数据集。


帧选择


Wilddash2数据集的视频帧选择遵循与Wilddash[1]数据集相同的原则:来自世界各地的具有视觉挑战性的驾驶场景。一般的自动驾驶数据集来源主要由单个区域的场景组成,如Cityscapes、IDD等。而Wilddash2共包含来自全球150多个国家或地区的公共行车记录仪视频,下图显示了WD2数据来源的地理分布。


640.png

标签策略


Wilddash2合并了MVD、Cityscapes和IDD的标签,创建了统一的标注策略,主要包含以下三个统一操作:统一标签以合并各个数据集的重复标签、拆分标签以映射到其他数据集、扩展新标签以减少标签混淆。


640.png

重新贴标签


本文重新标注了MVD、Cityscapes和IDD数据集中的车辆实例,来和Wilddash2数据集的车辆类别对齐(皮卡车和货车),下表展示了车辆类别的分布和来源。

640.png


限制


Wilddash2数据集涵盖了诸多视觉危害,但存在以下几点限制:排除严重失真的视频帧、颗粒物危害类别中的视频帧较少、包含变化风险的视频帧较少。


3全景分割评估



Wilddash2使用COCO[2]全景格式提交结果,全景分割[3]统一了实例分割和语义分割,常用PQ指标进行评估:


640.png

4实验结果



全景分割


本文使用Seamless Scene Segmentation[4]搭建分割基线,结果如下表所示:


640.png


Visual Hazard Classifiers


本文使用[5]搭建视觉危害分类器,结果如下表所示:


640.png


5参考文献



[1] Oliver Zendel, Katrin Honauer, Markus Murschitz, Daniel Steininger, and Gustavo Fernandez Dominguez. Wilddashcreating hazard-aware benchmarks. In European Conference on Computer Vision (ECCV), pages 402–416, 2018. 3, 5

[2] COCO - common objects in context. https : / /cocodataset.org/#format-data. Accessed: 2021-11-01. 5

[3] Alexander Kirillov, Kaiming He, Ross Girshick, Carsten Rother, and Piotr Doll´ar. Panoptic segmentation. In IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pages 9404–9413, 2019. 1, 5

[4] Lorenzo Porzi, Samuel Rota Bul`o, Aleksander Colovic, and Peter Kontschieder. Seamless scene segmentation. In IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2019-06. 7

[5] Jeremy Howard et al. Fastai. https://github.com/fastai/fastai, 2021. Accessed: 2021-10-01. 8

相关文章
|
存储 数据库
Dataset之ADE20k:ADE20k数据集的简介、安装、使用方法之详细攻略
Dataset之ADE20k:ADE20k数据集的简介、安装、使用方法之详细攻略
Dataset之ADE20k:ADE20k数据集的简介、安装、使用方法之详细攻略
|
机器学习/深度学习 人工智能 自然语言处理
视觉 注意力机制——通道注意力、空间注意力、自注意力
本文介绍注意力机制的概念和基本原理,并站在计算机视觉CV角度,进一步介绍通道注意力、空间注意力、混合注意力、自注意力等。
13661 58
|
PyTorch 算法框架/工具
Pytorch中最大池化层Maxpool的作用说明及实例使用(附代码)
Pytorch中最大池化层Maxpool的作用说明及实例使用(附代码)
1501 0
|
10月前
|
机器学习/深度学习 数据处理
大语言模型中的归一化技术:LayerNorm与RMSNorm的深入研究
本文分析了大规模Transformer架构(如LLama)中归一化技术的关键作用,重点探讨了LayerNorm被RMSNorm替代的原因。归一化通过调整数据量纲保持分布形态不变,提升计算稳定性和收敛速度。LayerNorm通过均值和方差归一化确保数值稳定,适用于序列模型;而RMSNorm仅使用均方根归一化,省略均值计算,降低计算成本并缓解梯度消失问题。RMSNorm在深层网络中表现出更高的训练稳定性和效率,为复杂模型性能提升做出重要贡献。
2171 14
大语言模型中的归一化技术:LayerNorm与RMSNorm的深入研究
|
传感器 机器学习/深度学习 编解码
智能驾驶--语义分割 公开数据集 汇总
本文整理了10个质量较好,数据集较大,比较新的,图像语义分割的公开数据集;主要服务于智能驾驶方向(辅助驾驶、自动驾驶等)。
2655 0
|
PyTorch 算法框架/工具
Jetson学习笔记(四):pth(torch模型文件)转trt(tensorrt引擎文件)实操
关于如何使用torch2trt工具将PyTorch模型转换为TensorRT引擎文件的实操指南。
723 1
Jetson学习笔记(四):pth(torch模型文件)转trt(tensorrt引擎文件)实操
|
PyTorch 算法框架/工具
Pytorch学习笔记(三):nn.BatchNorm2d()函数详解
本文介绍了PyTorch中的BatchNorm2d模块,它用于卷积层后的数据归一化处理,以稳定网络性能,并讨论了其参数如num_features、eps和momentum,以及affine参数对权重和偏置的影响。
2071 0
Pytorch学习笔记(三):nn.BatchNorm2d()函数详解
|
机器学习/深度学习 JSON 算法
实例分割笔记(一): 使用YOLOv5-Seg对图像进行分割检测完整版(从自定义数据集到测试验证的完整流程)
本文详细介绍了使用YOLOv5-Seg模型进行图像分割的完整流程,包括图像分割的基础知识、YOLOv5-Seg模型的特点、环境搭建、数据集准备、模型训练、验证、测试以及评价指标。通过实例代码,指导读者从自定义数据集开始,直至模型的测试验证,适合深度学习领域的研究者和开发者参考。
5620 3
实例分割笔记(一): 使用YOLOv5-Seg对图像进行分割检测完整版(从自定义数据集到测试验证的完整流程)
|
机器学习/深度学习 JSON 算法
语义分割笔记(二):DeepLab V3对图像进行分割(自定义数据集从零到一进行训练、验证和测试)
本文介绍了DeepLab V3在语义分割中的应用,包括数据集准备、模型训练、测试和评估,提供了代码和资源链接。
3339 0
语义分割笔记(二):DeepLab V3对图像进行分割(自定义数据集从零到一进行训练、验证和测试)
|
机器学习/深度学习 传感器 自动驾驶
视觉BEV基本原理和方案解析
视觉BEV在高德高精地图地面要素识别、车道线拓扑构建、车端融合定位等业务场景中都扮演了重要角色。