一文全览 | 自动驾驶Cornor-Case检测数据集(一)

简介: 一文全览 | 自动驾驶Cornor-Case检测数据集(一)

深度神经网络(DNN)被用于自动驾驶的感知系统,它需要大量的数据来进行训练,因为它们必须在各种情况下可靠地实现高性能。然而,这些DNN通常被限制在其训练数据中可用的一组封闭的语义类中,因此在面对以前看不到的实例时是不可靠的。因此,创建了多个感知数据集来评估异常检测方法,并将其可分为3组:现实世界中的真实异常、增强到现实世界中的合成异常和完全合成的场景。

本调查提供了一个结构化的、完整的概述和比较感知数据集的异常在自动驾驶异常检测。每一章都提供了有关任务和GT、上下文信息和许可的信息。此外,还讨论了现有数据集的弱点和差距,以强调开发进一步数据的重要性。


1、简介


当考虑到在交通中安全行驶的自动驾驶车辆时,有必要正确地感知环境,以提供安全的驾驶。为了确保这一点,DNN必须接受广泛的训练和数据测试。在这种情况下,已经创建了许多数据集,用于道路交通,其中大多数包括白天和阳光明媚的天气和无害的日常场景。

由于每年都有大量发布的新数据集,包括异常、异常分布(OOD)实例、新奇事物、异常值和Cornor-Case案例是很重要的,这些案例主要描述未知或不寻常的,以改进安全关键驾驶情况的检测和最终处理。为了处理这种情况,异常检测领域是一个高度活跃的研究领域。然而,如果仔细观察,大多数公共数据集遵循一个封闭的世界假设,并没有提供检测异常的空间。

在这项工作中提供了自动驾驶领域中带有标记异常的完整感知数据集集合。如Breitenstein等人所述,这些数据集显示出对物体和场景级异常的强烈关注。

可视化异常的数量和分布,并为未来工作提供见解和研究差距。已经包括了截至2023年2月1日的公共和可用数据集,这些数据集从自我角度提供了传感器数据,因为潜在利用数据集的许可证允许包括像素或点异常标签,至少以小验证集的形式。

我们排除了这些数据集,包括SiMOOD,因为它们只提供了一个框架,但没有原始数据;TOR4D、Rare4D和FS Web,因为它们不是公开的;MUAD、DANGER vKITTI、DANGER-vKITTI2和FDP集合,因为它们尚未发布;因为没有提供异常标记。我们还排除了关注不利条件的作品,如WildDash、ACDC或Rain Augmentation,因为它们对整个场景进行了分类。

除了感知数据集之外,还有包括异常的轨迹数据集或框架,如R-U-MAAD、KING或coung。虽然这些异常是最具挑战性的,但这些方法不能提供感官感知数据,而只能在模拟中执行,而模拟不能提供明确的视觉环境表征。

1.研究差距

虽然每年在自动驾驶领域发布了大量的新数据集,但关注一般数据集分析的工作却很少,而关注异常检测领域的工作则更少。虽然最近有一个关于异常检测方法的概述,但缺乏与包含异常的数据集相关的结构化知识,尽管这类异常或角落情况目前是缩放自动驾驶汽车的核心限制因素。

2.贡献

本文工作旨在帮助异常检测领域的研究人员获得包括异常在内的所有相关数据集的概述。作者提供了明确的选择标准,并为更广泛的范围指出特别排除的数据集。在第二节中提供了16个数据集的详细的结构化信息和可视化。本文的调查是唯一一种提供了目前可用的感知数据集的异常检测。在第三节中就相似性、问题和研究差距进行了广泛的讨论。所有用来重新创建可视化的代码都可以在GitHub上找到。


2、数据集


在自动驾驶中,发现非典型的和危险的情况对所有道路使用者的安全至关重要。为了提高当今模型处理这种关键情况的能力,需要数据集来进行有针对性的训练,更重要的是,对这种关键情况进行测试。因此,近年来出现了各种数据集,将在本节中描述这些数据集。如表一所示根据其基准测试对数据集进行聚类,并根据其异常源对其进行分类:

1.Automated OOD Proposal

这种方法允许使用大型的、未标记的数据集。这里,使用一种自动建议方法来生成第一个异常建议。这可以用任何异常检测方法来实现,例如,不确定性、中间检测、几何先验,或模型矛盾。随后,人类专家负责处理假阳性结果,并改进了这些建议。

2.Misc Classes

基于一个被标记的数据集,所有被标记为空白或混杂的区域都可以被进一步检查。这些术语经常互换使用,大多指不常见的物体或不相关的区域。然后,如果合适的话,人类专家会将这些类别重新标记为异常现象。

3.Class Exclusion.

这种方法是基于一个带有标记的数据集。通过从序列和验证分割中排除具有已知类的帧来创建假设的异常。使用这些方法创建了一个新的测试分割,将选定的类视为异常。

4.Web Sourcing

在这种方法中,人类专家会积极地搜索包含非典型类别的图像。作为已知类的参考列表,通常使用Cityscapes。

5.Recording and Simulation

在这里,通过驾驶真实世界的或合成世界的的数据收集来记录异常情况。通常,异常现象也不包括在Cityscapes类中。

6.Data Augmentation

对于这种技术,任何未标记的数据集都可以用作基线。通过对场景的合成操作,将异常粘贴到原始图像上,并可以进行相应的标记。如前所述,异常现象通常不包括在城市景观类中。

除了区分不同的异常方法外,我们还区分了数据集是提供具有异常的单个帧,还是提供具有时间上下文的场景。在图9中显示了所有数据集的累积异常掩码。这些给出了包含的异常的数量和在图像的区域可以找到它们。在下面的章节中将介绍每个数据集,并提供关于异常情况、可能的任务、一般上下文和许可协议的详细信息。此外,还展示了每个数据集的示例,其中异常实例和空白实例分别用橙色和黑色覆盖,并分别用绿色和红色概述。

2.1 Lost and Found数据集

Lost and Found 数据集是由Pinggera等人于2016年引入的,是第一个专注于小型道路危害检测的数据集,如图1所示。

image.png

1. 任务和基本情况:

为语义分割任务提供的立体掩模允许进行像素级和实例级的评估。他们的实例级方法是基于三维旋转轴表示,这是非常特定于方法的。由于该数据集提供了来自立体照相机的数据,因此可以应用几何方法。这些异常现象包括42种可以在街道环境中实际发现的独立物体类型。这些物体被分为标准物体、随机危险、动物或玩具、随机非危险和人类,包括静态和动态障碍。

2. 内容:

数据收集于德国大斯图加特地区。它包括不规则的路面、较大的物体距离和照明变化。典型环境包括住宅区、停车场或工业区。

3. 许可:

该数据集是“免费提供给学术和非学术实体的非商业目的”的。

2.2 Fishyscapes数据集

Blum等人于2019年引入了Fishyscapes(FS)基准,用于评估语义分割中的异常检测方法。虽然大多数数据被保留用于评估,但作者为不同的数据集FS Lost and Found和FS Static提供了验证集。第三个FS Web数据集被完全保留。第一个数据集是失物招领数据集的子集。其他的基于Cityscapes验证数据,上面覆盖了从通用Pascal VOC数据集中提取或从互联网上抓取的异常对象。FS静态验证帧是从Cityscapes数据集自动生成的。

1. 任务和基本情况:

FS数据集是为语义分割任务而设计的。FS Lost and Found使用细粒度二进制语义掩码进行了丰富。通过将图2与图1进行比较,显示了背景的精确注释。此外,异常目标是自行车或儿童的序列被过滤掉,因为它们可以被分配到Cityscapes类中的一个。

对于FSStatic和FSWeb,新的目标被混合到Cityscapes中已经注释过的场景中,从而产生了完全注释的语义掩码。从Pascal VOC数据集提取的异常属于飞机、鸟、船、瓶子、猫、椅子、牛、狗、马、羊、沙发和tvmonitor类。

2. 内容:

由于所有的图像都来自城市景观或失物招领数据集,它们是在白天晴朗的天气条件下记录的。对于增强的Cityscapes数据,这还需要街景包括来自已知类别的实例,如人类或其他车辆。根据异常类型的不同,异常出现在或上半部分的概率更高。

3. 许可:

FS根据Apache2.0授权许可。

2.3 CAOS数据集

Hendrycks等人于2019年首次引入了Combined Anomalous Object Segmentation(CAOS)基准,包括数据集StreetHazards和BDD异常。

StreetHazards基于CARLA模拟环境。训练集包括来自CARLA的三个城镇。另一个城镇为验证集保留,另外两个城镇为测试集专用。另一方面,BDD异常基于广泛的BDD100K数据集,其中从训练集和验证集中删除了几个类的所有实例,因此在新的测试集中被视为异常。

1. 任务和基本情况:

这两个数据集都是为语义分割任务而设计的,并且被对齐以以相同的分辨率提供RGB图像数据和语义基础真相。StreetHazards数据集提供了多种场景。总共插入了250个不同的异常,这些异常来自数字化模型库和语义ShapeNet。语义掩码用一个额外的异常类完全注释。对于BDD异常,三类摩托车、火车和自行车被视为异常。原始训练和验证集(包括这些类)中的所有帧都被移动到新的测试集,在那里它们变成了异常。图3提供了一个示例。由于BDD100K数据集提供了完全注释的语义掩码,因此它们也可用于BDD异常,这使得异常类可区分。由于StreetHazards和BDD异常的验证集不包括异常,但仅为语义分割的常规任务提供,因此我们将其从表I中排除。

2. 内容:

对于StreetHazards,CARLA城镇略有不同,但遵循相同的主题。包括不同的天气和白天设置。虽然数据集提供了场景,但自我运动似乎是手动执行的,因为它相当不一致。大多数异常情况都不位于与驾驶任务相关的区域。由于BDD通常基于BDD100K,它包括不同的景色、天气条件和一天中的时间。

3. 许可:

CAOS是在MIT许可下提供的。对于BDD100K,“为教育、研究和非营利目的使用、复制、修改和分发本软件及其文档的许可”。

image.png

相关文章
|
7月前
|
机器学习/深度学习 人工智能 算法
基于机器视觉的害虫种类及计数检测研究-人工智能项目-附代码
基于机器视觉的害虫种类及计数检测研究-人工智能项目-附代码
|
6月前
|
算法 图形学 计算机视觉
CVPR 2024:合成视频数据集里只有单人数据?M3Act破解人群行为标注难题
【6月更文挑战第12天】CVPR 2024上的M3Act数据集解决了复杂人群行为标注难题,提供多视角、多群体的合成视频数据,助力计算机视觉研究。利用Unity引擎生成高度真实的人类动作和群体活动,促进以人类为中心任务的学习。实验显示,M3Act能提升目标检测等任务性能,降低数据收集成本,并支持3D群体活动的可控生成。尽管面临数据复杂性、偏差和计算资源限制等问题,M3Act为相关研究提供了宝贵资源。[论文链接](https://arxiv.org/abs/2306.16772)
80 4
|
4月前
|
数据采集 机器学习/深度学习 人工智能
【2021 第五届“达观杯” 基于大规模预训练模型的风险事件标签识别】1 初赛Rank12的总结与分析
关于2021年第五届“达观杯”基于大规模预训练模型的风险事件标签识别竞赛的初赛Rank12团队的总结与分析,详细介绍了赛题分析、传统深度学习方案、预训练方案、提分技巧、加速训练方法以及团队的总结和反思。
47 0
|
6月前
|
自然语言处理 安全 数据安全/隐私保护
不影响输出质量还能追踪溯源,大模型无偏水印入选ICLR 2024 Spotlight
【6月更文挑战第7天】研究人员提出了一种无偏水印技术,能在不降低大型语言模型(LLMs)输出质量的情况下实现追踪和归属。此方法被ICLR 2024选为Spotlight论文,保证水印不影响模型性能,保护知识产权,防止滥用。无偏水印的挑战包括设计无损模型质量的实现、有效检测及安全防范措施。[论文链接: https://openreview.net/pdf?id=uWVC5FVidc]
69 2
|
7月前
|
传感器 机器学习/深度学习 编解码
一文全览 | 2023最新环视自动驾驶3D检测综述!
一文全览 | 2023最新环视自动驾驶3D检测综述!
205 1
|
7月前
|
运维 算法 数据处理
|
传感器 运维 自动驾驶
一文全览 | 自动驾驶Cornor-Case检测数据集(二)
一文全览 | 自动驾驶Cornor-Case检测数据集(二)
482 0
|
机器学习/深度学习 传感器 人工智能
基于无标注网络驾驶视频,自动驾驶策略预训练新方法 | ICLR 2023
基于无标注网络驾驶视频,自动驾驶策略预训练新方法 | ICLR 2023
136 0
|
机器学习/深度学习 人工智能 文字识别
Yolov5+图像分割+百度AI接口——车牌实时检测识别系统
Yolov5+图像分割+百度AI接口——车牌实时检测识别系统
762 0
Yolov5+图像分割+百度AI接口——车牌实时检测识别系统
|
传感器 机器学习/深度学习 人工智能
最新Benchmark | 4Seasons:面向挑战场景的自动驾驶视觉SLAM基准
论文基于大规模4Seasons数据集,提出了一种新的视觉SLAM和长期定位基准,用于在挑战条件下的自动驾驶。4Seasons提供了季节变化和不同的天气和照明条件导致的剧烈外观变化。尽管在类似条件的小规模数据集上推进视觉SLAM方面取得了重大进展,但仍缺乏代表自动驾驶真实场景的统一基准。
最新Benchmark | 4Seasons:面向挑战场景的自动驾驶视觉SLAM基准