自动驾驶环视感知中鱼眼相机主流投影模型的分类原理与技术综述-开发者社区-阿里云

一文尽览 | 计算机视觉中的鱼眼相机模型及环视感知任务汇总！（上）

2023-01-17 2084

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 环视鱼眼摄像机通常用于自动驾驶中的近距离感知，车辆四面的四个鱼眼摄像头足以覆盖车辆周围的360°范围，捕捉整个近距离区域。一些应用场景包括自动泊车、交通拥堵辅助等

论文链接：https://arxiv.org/pdf/2205.13281.pdf

论文名称：Surround-view Fisheye Camera Perception for Automated Driving: Overview, Survey & Challenges

论文的一些侧重点

环视鱼眼摄像机通常用于自动驾驶中的近距离感知，车辆四面的四个鱼眼摄像头足以覆盖车辆周围的360°范围，捕捉整个近距离区域。一些应用场景包括自动泊车、交通拥堵辅助等。

由于汽车感知的主要关注点是远距离感知，因此近距离数据集有限，相关感知任务的研究很少。与远距离感知相比，10厘米的高精度目标检测要求和目标的局部可见性，给环视感知带来了额外的挑战。而且由于鱼眼像机的大径向畸变，标准算法无法轻松扩展到环绕视图用例。

本论文致力于为研究人员和工程算法人员提供汽车鱼眼相机感知的一些参考，包括鱼眼相机模型，以及各种感知任务，最后，讨论了常见的一些挑战和未来研究方向。

领域应用背景

环视系统使用四个传感器形成具有重叠区域的网络，足以覆盖车辆周围的近距离区域。下图显示了典型环视系统的四个视图，以及典型停车用例的表示：

超过180度的广角相机用于近距离感知，任何感知算法都必须考虑此类摄像机系统固有的显著鱼眼失真。这是一个重大挑战，因为计算机视觉领域的大多数工作都集中在具有轻微径向畸变的窄视场摄像机上。本文主要概述全景摄像头（例如，图像形成、配置和标定），调查现有技术，并深入了解该领域当前面临的挑战。

鱼眼相机有几个比较大的挑战：

表现出强烈的径向失真，视野减小和周围特征失真；
目标形变更大，特别是对于近处对象；
使用bounding box进行目标检测的算法变得更加复杂，因为box很难为鱼眼扭曲目标提供最佳拟合，如下图所示（虽然[14]中探讨了更复杂的表示方法，不依赖矩形框，例如利用鱼眼相机已知径向畸变的曲线边界框）：

对于没有明显畸变的相机，一般通过针孔模型进行建模，然而鱼眼相机由于缺乏统一的几何结构而变得复杂，许多模型使用不同的特性来建模鱼眼相机（论文将会展开详细介绍）。

鱼眼相机模型

本节将介绍几种比较流行的鱼眼相机模型，尽可能cover住领域常用方案，对于开发人员来说，可以指导特定型号的模型选择。

1.针孔相机模型

针孔相机模型是计算机视觉和机器人技术领域中使用的标准投影函数，此时研究仅限于考虑标准视场摄像机，针孔模型建模为：

2.经典几何模型

本节中讨论的模型称为经典模型，它们已经被研究了至少六十年[4]。还包括equisolid-angle模型，可以参考[27]、[28]，这里不做过多阐述。

等距投影

在等距鱼眼模型中，投影半径Q_e(θ)通过等距参数f的简单缩放与视场角θ相关：

反投影函数：

Stereographic Projection

与等距模型一样，在Stereographic 投影中，X到投影球的投影中心是C（下图5b）。考虑图像平面具有沿Z轴（光轴）的切点，在Stereographic 中，存在到像平面的第二个中心投影，切点的对极点形成投影中心，这基本上是焦距为2F的针孔投影。

反投影函数：

正交投影

与前面的投影模型类似，正交投影从投影到球体开始（下图5c），然后是到平面的正交投影。因此，正交投影由下式描述：

反投影函数：

扩展正交模型

如上图5d所示，扩展正交模型[29]扩展了经典正交模型，将投影平面从与投影球体相切的位置释放出来，允许偏移λ。在图像从鱼眼图像转换为平面图像的情况下，这个扩展用于控制失真图像和未失真图像之间的尺寸比。畸变投影保持与正交投影式子相同，然而，畸变和未畸变径向距离及其逆之间的关系由下式给出：

这是对[29]中给出的表示的略微简化，并假设f和（λ+f）为正。

扩展等距模型

扩展正交模型只是从投影到图像地map的转换，许多模型可以与扩展正交模型相同的方式转换为图像上的mapping，这里只给出一个等距模型的例子：

3.Algebraic models

简要讨论了鱼眼相机的代数模型，特别是多项式模型和Division模型。关于多项式模型的讨论，论文提供了完整性介绍，尽管在本文的其它部分大多集中于几何模型。

多项式模型

非鱼眼相机的经典Brown-Conrady失真模型[31]、[32]使用一个奇数多项式来描述图像上的径向失真，其中Pn表示一些任意的N阶多项式。为了考虑鱼眼失真，[18]中提出了一种称为多项式鱼眼变换（PFET)的图像多项式模型。PFET和Brown-Conrady模型之间的差异在于，PFET允许奇数和偶数指数来解释鱼眼相机中遇到的附加失真。

MATLAB计算机视觉工具箱[36]和NVidias DriveWorks SDK[37]包括了[38]中提供的基于多项式的鱼眼模型的实现。在这种情况下，多项式用于对投影和非投影进行建模，无需使用数值方法反转投影（这是基于多项式的模型的主要计算问题）。