【OpenCV】—图像金子塔与图片尺寸缩放

简介: 【OpenCV】—图像金子塔与图片尺寸缩放

序言: 继续,继续,开干!!!

本节学习OpenCV中的函数pyrUp和pyrDown对图像进行向上和向下采样,以及了解专门用于缩放图像尺寸的resize函数的用法

1、引言

如果想要将某种尺寸的图像转换为其他尺寸的图像:如放大或者缩小

  • resize函数,最直接
  • pyrUp()、pyrDown()函数。即图像金字塔相关的两个函数,对图像进行向上采样和向下采样的操作

2、关于图像金字塔

图像金字塔是图像中多尺寸表达的一种,最主要用于图像的分割,是一种以多分辨率来解释图像的有效但概念简单的结构。

图像金字塔最初用于机器视觉和图像压缩,一幅图像的金字塔是一系列以金字塔形状排列的,分辨率逐步降低且来源于同一张原始图的图像集合。其通过梯次向下采样获得,直到达到某个终止条件才停止采样。

如下:层级越高,则图像越小,分辨率越低。

一般情况下有两种类型的图像金字塔常常出现在文献和以及实际运用中,它们分别是:

高斯金字塔(Gaussianpyramid)——用来向下采样,主要的图像金字塔

拉普拉斯金字塔(Laplacianpyramid)——用来从金字塔底层图像重建上层未采样图像,在数字图像处理中也即是预测残差,可以对图像进行最大程度的还原,配合高斯金字塔一起使用。

区别:高斯金字塔用来向下降采样图像,而拉普拉斯金字塔则用来从金字塔底层图像向上采样,重建一个图像。

内容:要从金字塔第i层生成第i+1层(第i+1层表示G i+1),我们先要用高斯核对Gi进行卷积,然后删除除所有偶数行和偶数列,新得到图像面积会变为源图像的四分之一。按照上述过程对输入图像G0执行操作就可以参数整个金字塔。当图像向金字塔的上层移动的时,尺寸和分辨率会降低。从金字塔中上一级图像生成下一级图像的可以用PryDown,而通过PryUp将现有的图像在每个维度都放大两遍

总之:上述讲述的向下与向上采样,是针对图像的尺寸而言的(与金字塔的方向相反),向上就是图像的尺寸加倍,向下就是图像的尺寸减半。

(1)对图像向上采样——pyrUp函数:不是降采样逆操作。图像首先在每个维度上扩大为原来的两倍,新增的行(偶数行)以0填充。然后给指定的滤波器进行卷积(实际是一个在每个维度都扩大为原来两倍的过滤器)去估计“丢失”像素的近视值。

(2)对图像向下采样——pyrDown函数:是一个不会丢失信息的函数。为了恢复原来更高的分辨率图像,获得由降采样操作丢失的信息。

3、高斯金字塔

说明: 高斯金字塔是通过高斯平滑和亚采样获得一系列采样图像,也就是说第K层高斯金字塔通过平滑、亚采样就可以获得K+1层高斯图像。高斯金字塔包含了一系列低通滤波器,其截至频率从上一层到下一层以因子2逐渐增加,所以高斯金字塔可以跨越很大的频率范围。

补充:亚采样:就是下采样。对于序列来说,就是按固定间隔地抽取原序列,获得新序列。新序列是原序列的子序列。对于图像来说,也类似。比如256256的图像,进行一次间隔为2的下采样,就变成了128128的子图像,再来一次,就变成了64*64,依此类推。。说白了,采样也好,采样也好,都是只取原序列或者原图像的一部分数据,至于取的方法就很多了。。

3.1 对图像的向下采样(pyrDown()函数)

为获取层级为Gi+1的金字塔图像,采用如下方法:

(1)对图像Gi进行高斯内核卷积

(2)将所有偶数行和列去除

得到的图像即为Gi+1的图像,显而易见,结果图像只有原图的四分之一。通过对输入图像Gi(原始图像)不停迭代以上步骤就会得到整个金字塔。

void pyrDown(InputArray src,OutputArray dst,const Size &dstszie=Size(),int borderType=BORDER_DEFAULT);

第一个参数:输入图像,即源图像,填Mat类的对象即可

第二个参数:输出图像,和源图像有一样的尺寸和类型

第三个参数:输出图像的大小;有默认值Size(),即默认情况下,又Size Size((src.cols+1)/2,(src.rows+1)/2)来进行计算,且一直需要满足下列条件:

  • 第四个参数:边界模式
#include<opencv2/opencv.hpp>
#include<opencv2/imgproc/imgproc.hpp>
using namespace cv;
int main()
{
  //载入原始图
  Mat srcIamge = imread("E:\\Pec\\雷神.jpg");
  Mat tmpImage, dstImage;//临时变量和目标图定义
  tmpImage = srcIamge;//将原始图赋给临时变量
  //显示原图像
  imshow("【原始图】", srcIamge);
  //进行向下采样操作
  pyrDown(tmpImage, dstImage, Size(tmpImage.cols / 2, tmpImage.rows / 2));
  //显示效果图
  imshow("【效果图】", dstImage);
  waitKey(0);
}

3.2 对图像的向上取样(pyrUp()函数)

说明:如果想放大图像,则需通过向上取样操作得到

(1)将图像在每个方向扩大为原来的两倍,新增的行和列以0填充

(2)使用先前同样的内核(乘以4)与放大后的图像卷积,获得“新增像素”的近视值

为得到图像即为放大后的图像,但与原来的图像相比会发觉比较模糊,因为在放缩的过程中已经丢失了一些信息。

void pyrUp(InputArray src,OutputArray dst,const Size &dstsize=Size(),int borderType=BORDER_DEFAULT);
  • 第一个参数:输入图像,即源图像,填Mat类的对象即可
  • 第二个参数:输出图像,和源图像有一样的尺寸和类型
  • 第三个参数:输出图像的大小,有默认值Size(),即默认情况下,由Size(src.cols* 2,src.rows *2)来进行计算,且需要满足以下条件:

  • 第四个参数:边界模式

示例:

#include<opencv2/opencv.hpp>
#include<opencv2/imgproc/imgproc.hpp>
#include<iostream>
using namespace std;
using namespace cv;
int main()
{
  //载入原始图
  Mat srcIamge = imread("E:\\Pec\\雷神.jpg");
  Mat tmpImage, dstImage,dstImage1;//临时变量和目标图定义
  tmpImage = srcIamge;//将原始图赋给临时变量
  //显示原图像
  imshow("【原始图】", srcIamge);
  //进行向下采样操作
  pyrUp(tmpImage, dstImage, Size(tmpImage.cols*2, tmpImage.rows*2));
  cout << tmpImage.cols << endl;
  //显示效果图
  imshow("【效果图】", dstImage);
  
  waitKey(0);
}

确实有点模糊:

4、拉普拉斯金字塔

拉普拉斯金字塔第i层的数学定义:

公式说明:Gi表示第 i 层的图像,而UP()操作是将源图像中位置为(x,y)的像素映射到目标图像的(2 *x+1,2 * y+1)位置,即在进行向上取样。符号x表示卷积,g 5x5为5x5的高斯内核。

原理:拉普拉斯金字塔是通过源图像减去缩小后再放大的图像的一系列图像构成的

5、尺寸调整:resize()函数

说明:此函数将源图像精确地转换为指定尺寸的目标图像。如果源图像中设置了ROI,那么resize()函数会对源图像的ROI区域进行调整图像尺寸的操作,来输出到目标图像中。

void resize(InputArray src,OutputArray dst,Size dsize,double fx=0,double fy=0,
int interpolation=INTER_LINEAR);

第一个参数:输入图像,即源图像,填Mat类的对象即可

第二个参数:输出图像,当其非零时,有着dsize的尺寸,或者由src.size()计算出来

第三个参数:输出图像的大小。如果它等于零,由下士计算:

d s i z e = S i z e ( r o u n d ( f x ∗ s r c . c o l s ) , r o u n d ( f y ∗ s r c . r o w s ) ) dsize=Size(round(fx*src.cols),round(fy*src.rows))

dsize=Size(round(fx∗src.cols),round(fy∗src.rows))

其中,disize、fx、fy都不能为0

第四个参数:沿水平轴的缩放系数,有默认值0,且当其等于0时,由下式计算

( d o u b l e ) d s i z e . w i d t h / s r c . c o l s (double)dsize.width/src.cols

(double)dsize.width/src.cols

第五个参数:沿垂直轴的缩放系数,有默认值0,且当其等于0时,由下式计算

( d o u b l e ) d s i z e . h e i g h t / s r c . r o w s (double)dsize.height/src.rows

(double)dsize.height/src.rows

第六个参数:用于指定插值方式,默认值为INTER_LINEAR(线性插值)

可选的插值方式如下:

(1)INTER_NEAREST——最近邻插值

(2)INTER_LINEAR——线性插值(默认值)

(3)INTER_AREA——区域插值(利用像素区域关系的重采样插值)【缩小图像选择】

(4)INTER_CUBIC——三次样条插值(超过4x4像素邻域内的双三次插值)【放大图像】【效率慢】

(5)INTER_LANCZOS4—Lanczos插值(超过8x8像素邻域的Lanczos插值)【放大图像】【效率高】

示例程序:

#include<opencv2/opencv.hpp>
#include<opencv2/imgproc/imgproc.hpp>
#include<iostream>
using namespace std;
using namespace cv;
int main()
{
  //载入原始图
  Mat srcIamge = imread("E:\\Pec\\雷神.jpg");
  Mat tmpImage, dstImage,dstImage1;//临时变量和目标图定义
  tmpImage = srcIamge;//将原始图赋给临时变量
  //显示原图像
  imshow("【原始图】", srcIamge);
  //进行尺寸调整操作
  resize(tmpImage, dstImage, Size(tmpImage.cols / 2, tmpImage.rows / 2), 0, 0, 3);
  resize(tmpImage, dstImage1, Size(tmpImage.cols *2, tmpImage.rows * 2), 0, 0, 3);
  //显示效果图
  imshow("【效果图】之一", dstImage);
  imshow("【效果图】之二", dstImage1);
  
  waitKey(0);
}

相关文章
|
3月前
|
计算机视觉
Opencv学习笔记(三):图像二值化函数cv2.threshold函数详解
这篇文章详细介绍了OpenCV库中的图像二值化函数`cv2.threshold`,包括二值化的概念、常见的阈值类型、函数的参数说明以及通过代码实例展示了如何应用该函数进行图像二值化处理,并展示了运行结果。
620 0
Opencv学习笔记(三):图像二值化函数cv2.threshold函数详解
|
4月前
|
算法 计算机视觉
opencv图像形态学
图像形态学是一种基于数学形态学的图像处理技术,它主要用于分析和修改图像的形状和结构。
58 4
|
4月前
|
存储 计算机视觉
Opencv的基本操作(一)图像的读取显示存储及几何图形的绘制
本文介绍了使用OpenCV进行图像读取、显示和存储的基本操作,以及如何绘制直线、圆形、矩形和文本等几何图形的方法。
Opencv的基本操作(一)图像的读取显示存储及几何图形的绘制
|
5月前
|
算法 计算机视觉 Python
python利用opencv进行相机标定获取参数,并根据畸变参数修正图像附有全部代码(流畅无痛版)
该文章详细介绍了使用Python和OpenCV进行相机标定以获取畸变参数,并提供了修正图像畸变的全部代码,包括生成棋盘图、拍摄标定图像、标定过程和畸变矫正等步骤。
python利用opencv进行相机标定获取参数,并根据畸变参数修正图像附有全部代码(流畅无痛版)
WK
|
5月前
|
编解码 计算机视觉 Python
如何在OpenCV中进行图像转换
在OpenCV中,图像转换涉及颜色空间变换、大小调整及类型转换等操作。常用函数如`cvtColor`可实现BGR到RGB、灰度图或HSV的转换;`resize`则用于调整图像分辨率。此外,通过`astype`或`convertScaleAbs`可改变图像数据类型。对于复杂的几何变换,如仿射或透视变换,则可利用`warpAffine`和`warpPerspective`函数实现。这些技术为图像处理提供了强大的工具。
WK
141 1
|
7月前
|
算法 计算机视觉
【Qt&OpenCV 图像的感兴趣区域ROI】
【Qt&OpenCV 图像的感兴趣区域ROI】
227 1
|
7月前
|
运维 算法 计算机视觉
【Qt&OpenCV 图像的模板匹配 matchTemplate/minMaxLoc】
【Qt&OpenCV 图像的模板匹配 matchTemplate/minMaxLoc】
93 1
|
7月前
|
存储 编解码 算法
【Qt&OpenCV 检测图像中的线/圆/轮廓 HoughLinesP/HoughCircles/findContours&drawContours】
【Qt&OpenCV 检测图像中的线/圆/轮廓 HoughLinesP/HoughCircles/findContours&drawContours】
119 0
|
6月前
|
机器学习/深度学习 XML 计算机视觉
OpenCV(Open Source Computer Vision Library)是一个开源的计算机视觉和机器学习库,它提供了大量的函数和工具,用于处理图像和视频数据。
OpenCV(Open Source Computer Vision Library)是一个开源的计算机视觉和机器学习库,它提供了大量的函数和工具,用于处理图像和视频数据。
|
7月前
|
计算机视觉
OpenCV中图像算术操作与逻辑操作
OpenCV中图像算术操作与逻辑操作
76 1