一文了解PnP算法,python opencv中的cv2.solvePnP()的使用,以及使用cv2.sovlePnP()方法标定相机和2D激光雷达

简介: 一文了解PnP算法,python opencv中的cv2.solvePnP()的使用,以及使用cv2.sovlePnP()方法标定相机和2D激光雷达

1 pnp算法概念和原理介绍

1.1 pnp算法的概念

下面几种说法都是对pnp算法要做的事情的描述,大家自己体会一下

1、PnPPerspective-n-Point)是求解 3D 到 2D 点对运动的方法。它描述了当我们知道n 个 3D 空间点以及它们的投影位置时,如何估计相机所在的位姿。——《视觉SLAM十四讲》(参考

2、通俗的讲,PnP问题就是在已知世界坐标系N个空间点的真实坐标以及这些空间点图像上的投影,如何计算相机所在的位姿。罗嗦一句:已知量是空间点的真实坐标和图像坐标,未知量(求解量)是相机的位姿。

3、PnP是用来求解3D-2D点对运动的方法参考

4、PnP问题就是指通过世界中的N个特征点图像成像中的N个像点,计算出其投影关系,从而获得相机或物体位姿的问题(参考

1.2 pnp算法的概念总结

下面我在来简单总结一下我个人的理解(参考):
image.png

使用Perspective-n-Point (PnP)算法需要知道的已知量和需要求解的未知量

1.2.1 PnP需要知道的已知量

1、需要知道n个世界坐标系下参考点的3D坐标系:$\left{c_1, c_2, c_3, ..., c_n\right}$

2、同时知道这个n个3D坐标对应相机图像坐标系上的2D投影点:$\left{u_1, u_2, u_3, ..., u_n\right}$

注意:

  • 世界坐标系下的3D点和相机坐标系下投影的2D点是一一对应的
  • 相机图像坐标系,并不是相机坐标系相机像素坐标系,注意区分

下图是四大坐标系:

image.png

3、已知相机摄像头的内参(需要自己提前标注好),相机的摄像头内参包括两部分;

  • 相机的内参矩阵
  • 相机畸变系数

内参矩阵:

$$ \text { camera matrix }=\left[\begin{array}{ccc} f_{x} & 0 & c_{x} \\ 0 & f_{y} & c_{y} \\ 0 & 0 & 1 \end{array}\right] $$

焦距$(f_x, f_y)$和光学中心$(c_x, c_y)$

畸变系数:

  • $k_1、k_2、k_3$:是径向畸变
  • $p_1、p_2$:是切向畸变

1.2.2 PnP需要求的未知量

世界坐标系摄像机坐标系之间的位姿变换 :$\left{R|t\right}$

  • R:是旋转矩阵,可以理解为绕x、y、z三个坐标轴方向的旋转
  • t:是平移,可以理解为沿x、y、z三个方向上的平移

所以从一个坐标系变换到另外一个坐标系位姿变换的自由度就是6,三个方向上的旋转和三个方向上的平移。(参考

1.3 PnP算法的用处

从上面可以知道PnP就是计算出两个坐标系之间的位姿变换的:$\left{R|t\right}$

因此PnP用途也很多:

  • 相机位姿跟踪
  • 物体位姿跟踪
  • AR/VR、
  • 机器人操作
  • SLAM中位姿初值求解
  • 相机标定,相机和激光雷达联合标定等

2 PnP的常见解法

PnP的常用解法也有很多:DLT,P3P,EPnP,UPnP

2.1 PnP解法之DLT

2.2 PnP解法之P3P

上面的文章中还介绍了很多其他的解法

2.3 PnP解法之EPnP

PnP问题是研究如何从3D-2D匹配对中求解摄像头位姿,EPnP算法是一种非迭代的PnP算法

3 opencv中solvePn()函数的介绍与使用

3.1 opencv中solvePnP函数的定义

1、在opencv中的slovePnP函数的定义
image.png

3.2 solvePnP()中参数含义:

3.2.1 solvePnP()中的参数

1、下面是solvePnP()函数参数含义解释(参考):

image.png

  • objectPoints:特征点的世界坐标,坐标值需为float型,不能为double型,可以为mat类型,也可以直接输入vector

  • imagePoints:特征点在图像中的像素坐标,可以输入mat类型,也可以直接输入vector,注意输入点的顺序要与前面的特征点的世界坐标一一对应

  • cameraMatrix相机内参矩阵

  • distCoeffs:相机的畸变参数【Mat_(5, 1)】

  • rvec:输出的旋转向量

  • tvec:输出的平移向量

  • useExtrinsicGuess: 用于SOLVEPNP迭代的参数。如果为true(1),函数使用提供的rvectvec值分别作为旋转平移向量的初始近似,并进一步优化它们。默认值为False

  • flags:PnP的计算方法

3.2.2 sovlePnP()中flags参数对应的PnP计算方法

flags取值对应的是PnP的计算方法,flags的参数选择(参考):

enum {
   
    SOLVEPNP_ITERATIVE = 0,
       SOLVEPNP_EPNP      = 1, //!< EPnP: Efficient Perspective-n-Point Camera Pose Estimation @cite lepetit2009epnp
       SOLVEPNP_P3P       = 2, //!< Complete Solution Classification for the Perspective-Three-Point Problem 
       SOLVEPNP_DLS       = 3, //!< A Direct Least-Squares (DLS) Method for PnP  @cite hesch2011direct
       SOLVEPNP_UPNP      = 4, //!< Exhaustive Linearization for Robust Camera Pose and Focal Length Estimation 
       SOLVEPNP_AP3P      = 5, //!< An Efficient Algebraic Solution to the Perspective-Three-Point Problem 
       SOLVEPNP_MAX_COUNT      //!< Used for count
};

1、cv2.SOLVEPNP_ITERATIVE=0

SOLVEPNP_ITERATIVE迭代方法是基于Levenberg-Marquardt优化。 在这种情况下,函数会找到一个使重新投影误差最小的位姿(pose),该位姿是观察到的投影imagePoints与使用projectPoints将objectPoints投影的点之间的平方距离的总和(参考)。

Levenberg-Marquardt法(LM法)是一种非线性优化方法。LM算法用于解决非线性最小二乘问题,多用于曲线拟合等场合

2、cv2.SOLVEPNP_EPNP=1

3、cv2.SOLVEPNP_P3P=2

4、cv2.SOLVEPNP_DLS=3

5、cv2.SOLVEPNP_UPNP=4

6、cv2.SOLVEPNP_AP3P=5

3.3 如何获取世界坐标和图像坐标

3.4 如何标定相机的内参(内参矩阵和畸变系数)

3.5 solvePnP()的实际使用实例

参考https://blog.csdn.net/lyhbkz/article/details/90246356
参考https://blog.csdn.net/shenxiaolu1984/article/details/50165635

3.5.1 使用solvePnP()标定相机和2D lidar激光雷达

camera_2d_lidar_calibration

cv2.solvePnP(objp, imgp, K, D, flags=cv2.SOLVEPNP_ITERATIVE)使用LM优化迭代算法介绍

  • flags=cv2.SOLVEPNP_ITERATIVE

3、epnp相关源码:


image.png

重投影误差公式:

$$reprojection\_error =\frac {1}{n} \sum_{i}^{n} \sqrt{(u-ue)^2+(v-ve)^2}$$

其中:
$$n = number\_of\_correspondences$$

目录
相关文章
|
28天前
|
存储 算法 Java
解析HashSet的工作原理,揭示Set如何利用哈希算法和equals()方法确保元素唯一性,并通过示例代码展示了其“无重复”特性的具体应用
在Java中,Set接口以其独特的“无重复”特性脱颖而出。本文通过解析HashSet的工作原理,揭示Set如何利用哈希算法和equals()方法确保元素唯一性,并通过示例代码展示了其“无重复”特性的具体应用。
41 3
|
1月前
|
测试技术 API Python
【10月更文挑战第1天】python知识点100篇系列(13)-几种方法让你的电脑一直在工作
【10月更文挑战第1天】 本文介绍了如何通过Python自动操作鼠标或键盘使电脑保持活跃状态,避免自动息屏。提供了三种方法:1) 使用PyAutoGUI,通过安装pip工具并执行`pip install pyautogui`安装,利用`moveRel()`方法定时移动鼠标;2) 使用Pymouse,通过`pip install pyuserinput`安装,采用`move()`方法移动鼠标绝对位置;3) 使用PyKeyboard,同样需安装pyuserinput,模拟键盘操作。文中推荐使用PyAutoGUI,因其功能丰富且文档详尽。
WK
|
19天前
|
Python
Python中format_map()方法
在Python中,`format_map()`方法用于使用字典格式化字符串。它接受一个字典作为参数,用字典中的键值对替换字符串中的占位符。此方法适用于从字典动态获取值的场景,尤其在处理大量替换值时更为清晰和方便。
WK
67 36
|
30天前
|
机器学习/深度学习 数据采集 数据挖掘
11种经典时间序列预测方法:理论、Python实现与应用
本文将总结11种经典的时间序列预测方法,并提供它们在Python中的实现示例。
63 2
11种经典时间序列预测方法:理论、Python实现与应用
|
26天前
|
开发者 Python
Python中的魔法方法与运算符重载
在Python的奇妙世界里,魔法方法(Magic Methods)和运算符重载(Operator Overloading)是两个强大的特性,它们允许开发者以更自然、更直观的方式操作对象。本文将深入探讨这些概念,并通过实例展示如何利用它们来增强代码的可读性和表达力。
|
1月前
|
算法 索引
HashMap扩容时的rehash方法中(e.hash & oldCap) == 0算法推导
HashMap在扩容时,会创建一个新数组,并将旧数组中的数据迁移过去。通过(e.hash & oldCap)是否等于0,数据被巧妙地分为两类:一类保持原有索引位置,另一类索引位置增加旧数组长度。此过程确保了数据均匀分布,提高了查询效率。
37 2
|
1月前
|
算法 计算机视觉 Python
圆形检测算法-基于颜色和形状(opencv)
该代码实现了一个圆检测算法,用于识别视频中的红色、白色和蓝色圆形。通过将图像从RGB转换为HSV颜色空间,并设置对应颜色的阈值范围,提取出目标颜色的区域。接着对这些区域进行轮廓提取和面积筛选,使用霍夫圆变换检测圆形,并在原图上绘制检测结果。
64 0
|
1月前
|
Linux Python
Python获得本机本地ip地址的方法
【10月更文挑战第8天】 socket模块包含了丰富的函数和方法,可以获取主机的ip地址,例如gethostbyname方法可以根据主机名获取ip地址,gethostbyname_ex方法可以获得本机所有ip地址列表,也可以使用netifaces模块获取网卡信息。
36 0
|
1月前
|
SQL 安全 数据库
Python防止SQL注入攻击的方法
Python防止SQL注入攻击的方法
47 0
|
3天前
|
机器学习/深度学习 人工智能 TensorFlow
人工智能浪潮下的自我修养:从Python编程入门到深度学习实践
【10月更文挑战第39天】本文旨在为初学者提供一条清晰的道路,从Python基础语法的掌握到深度学习领域的探索。我们将通过简明扼要的语言和实际代码示例,引导读者逐步构建起对人工智能技术的理解和应用能力。文章不仅涵盖Python编程的基础,还将深入探讨深度学习的核心概念、工具和实战技巧,帮助读者在AI的浪潮中找到自己的位置。