图像金字塔---OpenCV-Python开发指南(23)

简介: 图像金字塔---OpenCV-Python开发指南(23)

什么是图像金字塔


图像金字塔是由一副图像的多个不同分辨率的子图所构成的图像集合。该组图像是由单个图像通过不断地降低采样所产生的,最小的图像可能仅仅只有一个像素点。如下图所示,分辨率从低到高,逐渐降低的图像集合。

通常level0是原图,每往上一层图像的宽高降低为原来的一半,以此类推。比如假如level0的原图宽高为N,那么level1的宽高就为N/2,得到的就是(N/2)*(N/2)大小的图像。最简单的金字塔是通过删除图像的偶数行或偶数列得到。


当然,也可以先对原始图像进行滤波,得到原始图像的近似图像,然后将近似图像的偶数行与偶数列删除以获取向下采样的结果。


至于滤波一般有以下两种选择:


(1)高斯滤波器:采用高斯滤波器对原图像滤波,得到高斯金字塔。


(2)领域滤波器:采用领域平均技术求原始图像的近似图像,得到平均金字塔。


高斯金字塔


OpenCV中,它给我们提供函数cv2.pyrDown()实现高斯金字塔中的向下采样。其完整定义如下:

def pyrDown(src, dst=None, dstsize=None, borderType=None): 

src:原始图像


dstsize:目标图像大小


borderType:边界类型,只支持BORDER_DEFAULT。


经过原理的介绍,我们知道输入图像的默认值为Size((src.cols+1)/2,(src.rows+1)/2),而高斯滤波器的矩阵如下所示:


当然,有高斯金字塔中的向下采样,自然也有高斯金字塔中的向上采样,在OpenCV中,该函数为cv2.pyrUp(),其完整定义如下:

def pyrUp(src, dst=None, dstsize=None, borderType=None):

至于参数是一样的,这里不在赘述,当然dstsize默认是Size(src.cols2,src.rows2)。


需要特别注意的是,虽然图像向下采样,在进行向上采样,会恢复到原来的图像大小。但是其都是不可逆的。也就说,在经历两次采样之后,得到的图像虽然大小一致,但二者像素并不一致,因为丢失的行列不可能无缘无故的生成。


拉普拉斯金字塔


虽然说,在使用高斯滤波器进行向下采样之后,在进行向上采样不能恢复原来的图像。但我们可以通过拉普拉斯金字塔来恢复原来的图像。因为这些丢失的信息,构成的就是拉普拉斯金字塔。


拉普拉斯金字塔的数学定义如下:


其中,Li表示拉普拉斯金字塔的第i层,Gi表示高斯金字塔中的第i层。


实战


既然我们了解了高斯金字塔与拉普拉斯金字塔的原理。下面,我们来通过高斯滤波器向下采样之后,在通过拉普拉斯金字塔恢复原图像。


具体代码如下所示:

import cv2
img = cv2.imread("23.jpg")
print(img.shape)
# 获取高斯金字塔
G1 = cv2.pyrDown(img)
# 获取拉普拉斯金字塔
L0 = img - cv2.pyrUp(G1)
# 恢复原图像
result1 = L0 + cv2.pyrUp(G1)
cv2.imshow("img", img)
cv2.imshow("G1", G1)
cv2.imshow("L1", L0)
cv2.imshow("result1", result1)
cv2.waitKey()
cv2.destroyAllWindows()


运行之后,效果如下所示:

相关文章
|
11天前
|
计算机视觉
Opencv学习笔记(三):图像二值化函数cv2.threshold函数详解
这篇文章详细介绍了OpenCV库中的图像二值化函数`cv2.threshold`,包括二值化的概念、常见的阈值类型、函数的参数说明以及通过代码实例展示了如何应用该函数进行图像二值化处理,并展示了运行结果。
107 0
Opencv学习笔记(三):图像二值化函数cv2.threshold函数详解
|
1月前
|
机器学习/深度学习 算法 TensorFlow
动物识别系统Python+卷积神经网络算法+TensorFlow+人工智能+图像识别+计算机毕业设计项目
动物识别系统。本项目以Python作为主要编程语言,并基于TensorFlow搭建ResNet50卷积神经网络算法模型,通过收集4种常见的动物图像数据集(猫、狗、鸡、马)然后进行模型训练,得到一个识别精度较高的模型文件,然后保存为本地格式的H5格式文件。再基于Django开发Web网页端操作界面,实现用户上传一张动物图片,识别其名称。
73 1
动物识别系统Python+卷积神经网络算法+TensorFlow+人工智能+图像识别+计算机毕业设计项目
|
1月前
|
算法 计算机视觉
opencv图像形态学
图像形态学是一种基于数学形态学的图像处理技术,它主要用于分析和修改图像的形状和结构。
39 4
|
18天前
|
存储 JSON API
Python| 如何使用 DALL·E 和 OpenAI API 生成图像(1)
Python| 如何使用 DALL·E 和 OpenAI API 生成图像(1)
24 7
Python| 如何使用 DALL·E 和 OpenAI API 生成图像(1)
|
1月前
|
机器学习/深度学习 人工智能 算法
植物病害识别系统Python+卷积神经网络算法+图像识别+人工智能项目+深度学习项目+计算机课设项目+Django网页界面
植物病害识别系统。本系统使用Python作为主要编程语言,通过收集水稻常见的四种叶片病害图片('细菌性叶枯病', '稻瘟病', '褐斑病', '稻瘟条纹病毒病')作为后面模型训练用到的数据集。然后使用TensorFlow搭建卷积神经网络算法模型,并进行多轮迭代训练,最后得到一个识别精度较高的算法模型,然后将其保存为h5格式的本地模型文件。再使用Django搭建Web网页平台操作界面,实现用户上传一张测试图片识别其名称。
96 22
植物病害识别系统Python+卷积神经网络算法+图像识别+人工智能项目+深度学习项目+计算机课设项目+Django网页界面
|
1月前
|
机器学习/深度学习 人工智能 算法
鸟类识别系统Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+ResNet50算法模型+图像识别
鸟类识别系统。本系统采用Python作为主要开发语言,通过使用加利福利亚大学开源的200种鸟类图像作为数据集。使用TensorFlow搭建ResNet50卷积神经网络算法模型,然后进行模型的迭代训练,得到一个识别精度较高的模型,然后在保存为本地的H5格式文件。在使用Django开发Web网页端操作界面,实现用户上传一张鸟类图像,识别其名称。
86 12
鸟类识别系统Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+ResNet50算法模型+图像识别
|
29天前
|
存储 计算机视觉
Opencv的基本操作(一)图像的读取显示存储及几何图形的绘制
本文介绍了使用OpenCV进行图像读取、显示和存储的基本操作,以及如何绘制直线、圆形、矩形和文本等几何图形的方法。
Opencv的基本操作(一)图像的读取显示存储及几何图形的绘制
|
13天前
|
JSON API 数据格式
Python| 如何使用 DALL·E 和 OpenAI API 生成图像(2)
Python| 如何使用 DALL·E 和 OpenAI API 生成图像(2)
34 0
Python| 如何使用 DALL·E 和 OpenAI API 生成图像(2)
|
2月前
|
机器学习/深度学习 人工智能 TensorFlow
利用Python和TensorFlow实现简单图像识别
【8月更文挑战第31天】在这篇文章中,我们将一起踏上一段探索人工智能世界的奇妙之旅。正如甘地所言:“你必须成为你希望在世界上看到的改变。” 通过实践,我们不仅将学习如何使用Python和TensorFlow构建一个简单的图像识别模型,而且还将探索如何通过这个模型理解世界。文章以通俗易懂的方式,逐步引导读者从基础到高级,体验从编码到识别的整个过程,让每个人都能在AI的世界中看到自己的倒影。
WK
|
2月前
|
编解码 计算机视觉 Python
如何在OpenCV中进行图像转换
在OpenCV中,图像转换涉及颜色空间变换、大小调整及类型转换等操作。常用函数如`cvtColor`可实现BGR到RGB、灰度图或HSV的转换;`resize`则用于调整图像分辨率。此外,通过`astype`或`convertScaleAbs`可改变图像数据类型。对于复杂的几何变换,如仿射或透视变换,则可利用`warpAffine`和`warpPerspective`函数实现。这些技术为图像处理提供了强大的工具。
WK
86 1