传感器失效怎么办?MetaBEV:一种新颖且鲁棒感知网络架构,专治各自传感器疑难杂症

简介: 传感器失效怎么办?MetaBEV:一种新颖且鲁棒感知网络架构,专治各自传感器疑难杂症

adc7858ee784a35cfc922023bf414b74.png


Title: MetaBEV: Solving Sensor Failures for BEV Detection and Map Segmentation


Paper: https://arxiv.org/pdf/2304.09801.pdf


Code: https://github.com/ChongjianGE/MetaBEV



导读


102bea870bafffbc83f910b10bf62af6.png

自动驾驶车辆中的感知系统通常接收来自多模传感器的输入,例如 LiDAR 和相机。然而,在真实应用中,传感器失效和故障会导致感知系统预测能力下降,从而危及自动驾驶的安全性。


本文提出了一种鲁棒性自动驾驶感知系统框架 MetaBEV,其可以处理六种传感器损坏和两种传感器缺失的情况。该框架首先通过模态特定编码器处理多个传感器的信号,然后初始化一组稠密的 BEV 查询 (Query),称为 MetaBEV。然后,这些查询被 BEV Evolving 解码器迭代处理,该解码器从 LiDAR、相机或两种模态中选择性地聚合深度特征。更新后的 BEV 表示还用于多个 3D 预测任务。


此外,本文还引入了一种新的 M 2 o E

oE 结构,用于缓解多任务联合学习中不同任务的性能下降。我们在 nuScenes 数据集上进行了大量实验,包括 3D 目标检测和 BEV 地图分割任务。实验表明,MetaBEV 在完整/单模态上都比先前的方法表现出更好的性能。如图1所示,在传感器失效的情况下,MetaBEV 的预测结果还是非常接近 GT,并且显著优于 BEVFusion。 此外,MetaBEV 在规范感知和多任务学习设置中表现出色,在 nuScenes BEV 地图分割方面实现了 70.4% 的 mIoU,刷新了现有的最新成果。


创作背景


7c37c83bde7db9132ffd2238cff68067.png

自动驾驶系统感知周围环境是实现自主驾驶的基本能力。为了提高感知精度,之前的研究在模块设计、训练范式、多模态输入等方面做出了重大努力。其中,多传感器融合策略展示了在实现更强感知能力方面的显著优势,因此在学术界和工业界都受到广泛探索。虽然大部分工作关注单一任务上理想多模态输入的最优性能,但它们无意中忽略了在实际应用中不可避免的传感器失效问题,进而导致了性能下降。


传感器失效问题可以拆解为以下两个挑战:


1. 特征不对齐

现有的融合方法通常利用卷积神经网络和特征级联进行融合。像素级位置相关性被强制赋予,从而导致多模态特征不对齐,特别是在引入几何相关噪声的情况。这个问题可以归因于 CNN 的固有特性,在建模长距离依赖和对输入特征的自适应关注方面的限制。


2. 过度依赖完整模态

以往的工作生成融合的 BEV 特征使用查询索引或通道级融合方式。查询索引方法通常依赖于 LiDAR 和 2D 相机特征进行相互查询,而通道级融合方法则不可避免地涉及元素级操作进行特征合并。这两种融合策略严重依赖完整的模态输入,并在遇到像 LiDAR 缺失或相机缺失等传感器失效问题时导致感知性能下降,因此在实际应用中受到非常大的限制。


对此,本文提出了 MetaBEV,该方法通过模态任意 (modality-arbitrary) 和任务不可知学习 (task-agnostic learning)来解决特征不匹配和完整模态依赖问题,使用统一的鸟瞰图 (BEV) 表示空间。


此外,我们发现模态相关方法的主要瓶颈在于缺乏设计,使融合模块能够独立地融合不同的模态。因此,本文提出了一个模态任意的 BEV-Evolving 解码器,它利用跨模态注意力将可学习的 MetaBEV 查询与单个相机 BEV 特征、LiDAR-BEV 特征或两者相关联,消除模态缺失而导致的性能瓶颈。


最后,我们应用了一些任务特定的头部 (Head) 结构来支持不同的 3D 感知预测。MetaBEV 在六个传感器失效和两个传感器缺失情况下都表现出更强的鲁棒性。MetaBEV 还将 M 2 o E M

oE 结构与其相结合,以缓解 3D 检测和 BEV 地图分割任务在使用相同训练权重时的任务冲突。MetaBEV 在 nuScenes 数据集上实现了最先进的性能。


方法


b0ac9abd4e1c036b1bee8e58bb4dbb42.png

本文提出了一种新的基准模型,旨在解决 3D 目标检测和 BEV 地图分割任务中的传感器失效问题。与现有的依赖完整传感器输入的感知方法相反,本方法是通过参数化的 meta-BEV 查询 (Query) 连接不同的模态,并执行跨模态注意力来集成相机和 LiDAR 的语义和几何表示。整个 Pipeline 包括一个多模态特征编码器,带有跨模态可变形注意力的 BEV-Evolving 解码器和任务特定的头部,如图3所示。


BEV Feature Encoder Overview

MetaBEV 在 BEV 空间生成融合的特征,因为其能够将具图像特征和 LiDAR 特征统一表示。此外,BEV 特征的规则性有助于有效地集成各种先进的任务头,这可以使许多感知任务受益。


相机/ LiDAR 到 BEV

我们基于最先进的感知方法 BEVFusion 构建了多模态特征编码器,它采用多视图图像和 LiDAR 点云对作为输入,并通过深度预测和几何投影将相机特征转换为 BEV 空间。


BEV-Evolving Decoder


a9dac9bf54ccab02d788ad6116faaf1b.png

BEV-Evolving 解码器主要由三个部分组成:跨模态注意力层、自注意力层和即插即用的 M 2 o E

oE 块。跨模态注意力层和自注意力层用于融合任意模态,而 M 2 o E M块则用于缓解任务冲突。


跨模态注意力层


跨模态注意力层用于实现多模态传感器融合。


该结构首先利用一组密集的 BEV Query,与相应的位置编码 (Position Embedding) 一起构成 meta-BEV,然后将其与相机 BEV 特征和 LiDAR BEV 特征进行相关性计算,从而实现多模态融合。为了提高计算效率,使用了可变形注意力 D A t t n ( ⋅ ) DAttn(·)DAttn(⋅),并引入了模型特定的 MLP 层,以处理任意输入。该融合机制可层层递进地执行,实现捕捉来自相机和 LiDAR 模态的语义和几何信息。


自注意力层


自注意力层用于建模查询之间的内部关系。


首先,我们将模态特定的 MLP “降级" 为统一的 MLP 层。此外,为了充分建模 Query 之间的内部相关性,我们将 meta-BEV 作为 D A t t n ( ⋅ ) DAttn(·)DAttn(⋅) 的输入计算自注意力。为了平衡性能与计算效率,在 BEV-Evolving 解码器中只组合了两个自注意力层。


通过建模模态之间和查询之间的关系,最终输出融合的 BEV 特征用于 3D 预测。实验证明,将内部和外部关系相结合的混合设计,能够全面地对融合 BEV 特征进行建模,从而有利于各种任务的有效实现。


image.png


传感器失效的应对策略


为了模拟传感器损坏和完全缺失的情况,我们定义了一系列传感器故障类型,包括:


受限LiDAR视野 (LF);

物体缺失 (MO);

光束减少 (BR);

视野缺失 (VD);

视野噪声 (VN);

障碍物遮挡 (OO)。

此外,我们还通过 Missing Camera (MC) 和 Missing LiDAR (ML) 这两种极端情况评估了 MetaBEV 模型。


转换模态训练


转换模态训练用于 MetaBEV 模型中的多模态数据处理。


MetaBEV 使用 BEV-Evolving 块中的模态特定模块来灵活地处理相机特征、LiDAR 特征或两者的组合。转换模态训练方案可以在训练过程中随机选择上述任意一种模态进行输入,从而模拟真实世界的条件,提高 MetaBEV 在自动驾驶中的实用性。此外,该方案只需要使用一个预训练权重集合即可进行部署。


实验


1b9b1719da92f0d19c4664a8d0a9c112.png


对于 3D 目标检测任务,MetaBEV 在使用相机模态时取得了出色的性能,并与使用 LiDAR 和多模态的最新方法相当。在 BEV 地图分割任务中,MetaBEV 实现了70.4% 的 mIoU,创造了新的 SOTA。


7b0a8d5ee7f4b12273c1aff5a13483bd.png


MetaBEV 在相机模态下表现优异,在 LiDAR 和多模态下表现与最先进的方法相当。此外,MetaBEV 在 BEV 地图分割上取得了新的最佳表现,超过了以前的最佳模型和第二优方法。当缺少 LiDAR 时,MetaBEV 在 NDS 和 mAP 上提高了35.5%和 17.7%,当缺少相机时,MetaBEV 在 NDS 上超过 BEVFusion 1.7% 和 49.5% 的 mIoU。

c006297e2efb76d052bd580b6d85388f.png



通过引入 MoE 架构的用于多任务学习,性能都得到了不同程度的提升,其中 H-MoE 架构 提升更为显著。


ca0b6b0c4c3c224eb32b3ef4e44bbd73.png


图6展示了 MetaBEV 在各种传感器故障情况下的 3D 预测结果。在相机完全缺失的情况下,BEVFusion 几乎无法生成地图分割,而 MetaBEV 仍能产生令人满意的结果。此外,对于传感器故障,MetaBEV 比 BEVFusion 更加鲁棒。例如,当 View Noise 出现时,BEVFusion 往往会忽略一些目标(例如第一行中的车辆和第四行中的行人),而 MetaBEV 几乎能够覆盖所有在真实场景中的目标。


总结


本文提出了一种自动驾驶感知新框架 MetaBEV,旨在解决鸟瞰图 (BEV) 3D 检测和地图分割中的传感器故障问题。该方法将模态特定层集成到跨模态注意力层中以增强融合过程,不仅在全模态输入上的表现优异,而且 MetaBEV 能够有效缓解传感器信号被损坏或丢失而导致的性能显著下降问题。此外,本文还介绍了使用 M^2oEM 2

oE 来处理任务之间的潜在冲突。


虽然本文采用了可变形注意力来提高效率,但与轻量级解决方案相比,它不可避免地会导致网络参数略微增加。尽管如此,缓解传感器故障的好处非常明显,额外的计算开销可能是可以接受的。


目录
相关文章
|
6月前
|
传感器 数据采集 算法
无线传感器网络(WSN)在物联网中的作用
【6月更文挑战第7天】物联网中的无线传感器网络(WSN)正加速发展,它由微型传感器节点组成,用于环境数据感知和传输。WSN助力实时监测(如农业、工业生产)、资源管理(能源和物流)、智能交通等领域,提供关键数据支持。Python代码示例展示了数据采集和传输过程。尽管面临能量限制和网络挑战,WSN在物联网中的角色不可或缺,将持续推动社会智能化和可持续发展。
277 2
|
7月前
|
传感器 监控 安全
无线传感器网络与物联网的融合:未来智慧生活的关键
在信息技术不断发展的时代,无线传感器网络和物联网技术正成为推动智能化进程的重要支撑。本文将介绍无线传感器网络和物联网的基本概念,并探讨了它们融合应用在各个领域的前景和意义。从智能家居、智慧城市到工业制造,无线传感器网络与物联网的结合正引领着我们走向更智慧、便捷的未来。
622 0
|
7月前
|
传感器 算法 Go
基于EKF扩展卡尔曼滤波的传感器网络目标跟踪matlab仿真
基于EKF扩展卡尔曼滤波的传感器网络目标跟踪matlab仿真
|
7月前
|
机器学习/深度学习 算法 机器人
【论文速递】TMM2023 - FECANet:用特征增强的上下文感知网络增强小样本语义分割
【论文速递】TMM2023 - FECANet:用特征增强的上下文感知网络增强小样本语义分割
|
传感器 机器学习/深度学习 算法
【WSN】无线传感器网络模拟器研究Matlab代码实现
【WSN】无线传感器网络模拟器研究Matlab代码实现
【WSN】无线传感器网络模拟器研究Matlab代码实现
|
3月前
|
传感器 物联网 人机交互
物联网:物联网,作为新一代信息技术的重要组成部分,通过智能感知、识别技术与普适计算等通信感知技术,将各种信息传感设备与互联网结合起来而形成的一个巨大网络,实现了物物相连、人物相连,开启了万物互联的新时代。
在21世纪,物联网(IoT)作为新一代信息技术的核心,正以前所未有的速度重塑生活、工作和社会结构。本文首先介绍了物联网的概念及其在各领域的广泛应用,强调其技术融合性、广泛的应用范围以及数据驱动的特点。接着,详细阐述了物联网行业的现状和发展趋势,包括政策支持、关键技术突破和应用场景深化。此外,还探讨了物联网面临的挑战与机遇,并展望了其未来在技术创新和模式创新方面的潜力。物联网行业正以其独特魅力引领科技发展潮流,有望成为推动全球经济发展的新引擎。
|
3月前
|
机器学习/深度学习 人工智能 算法
首个像人类一样思考的网络!Nature子刊:AI模拟人类感知决策
【9月更文挑战第8天】近日,《自然》子刊发表的一篇关于RTNet神经网络的论文引起广泛关注。RTNet能模拟人类感知决策思维,其表现与人类相近,在反应时间和准确率上表现出色。这项研究证明了神经网络可模拟人类思维方式,为人工智能发展带来新启示。尽管存在争议,如是否真正理解人类思维机制以及潜在的伦理问题,但RTNet为人工智能技术突破及理解人类思维机制提供了新途径。论文详细内容见《自然》官网。
76 3
|
5月前
|
传感器 算法
基于无线传感器网络的MCKP-MMF算法matlab仿真
MCKP-MMF算法是一种启发式流量估计方法,用于寻找无线传感器网络的局部最优解。它从最小配置开始,逐步优化部分解,调整访问点的状态。算法处理访问点的动态影响半径,根据带宽需求调整,以避免拥塞。在MATLAB 2022a中进行了仿真,显示了访问点半径请求变化和代价函数随时间的演变。算法分两阶段:慢启动阶段识别瓶颈并重设半径,随后进入周期性调整阶段,追求最大最小公平性。
基于无线传感器网络的MCKP-MMF算法matlab仿真
|
4月前
|
算法
基于多路径路由的全局感知网络流量分配优化算法matlab仿真
本文提出一种全局感知网络流量分配优化算法,针对现代网络中多路径路由的需求,旨在均衡分配流量、减轻拥塞并提升吞吐量。算法基于网络模型G(N, M),包含N节点与M连接,并考虑K种不同优先级的流量。通过迭代调整每种流量在各路径上的分配比例,依据带宽利用率um=Σ(xm,k * dk) / cm来优化网络性能,确保高优先级流量的有效传输同时最大化利用网络资源。算法设定收敛条件以避免陷入局部最优解。
|
6月前
|
传感器 监控 算法
【计算巢】无线传感器网络(WSN)在智能城市中的应用
【6月更文挑战第3天】智能城市中的无线传感器网络(WSN)在交通监控、环境监测、能源管理和公共安全等领域发挥关键作用。通过模拟代码展示了传感器收集环境数据的过程。尽管面临部署成本、网络安全和数据处理挑战,但WSN为城市发展带来巨大潜力,随着技术进步,将在智能城市中创造更多便利与改善。
104 3
【计算巢】无线传感器网络(WSN)在智能城市中的应用