使用OpenCV在Python中进行图像处理

简介: 使用OpenCV在Python中进行图像处理

介绍

在本教程中,我们将学习如何使用Python语言执行图像处理。我们不会局限于单个库或框架;但是,我们将最常使用的是Open CV库。我们将先讨论一些图像处理,然后再继续介绍可以方便使用图像处理的不同应用程序/场景。


什么是图像处理?

重要的是要了解图像处理的确切含义,以及在深入了解图像处理的作用之前,图像处理在大图中的作用是什么。图像处理最常被称为“数字图像处理”,而经常使用的领域是“计算机视觉”。请勿混淆。图像处理算法和计算机视觉(CV)算法都将图像作为输入。但是,在图像处理中,输出也是图像,而在计算机视觉中,输出可能是有关图像的某些特征/信息


我们为什么需要它?

我们收集或生成的数据大部分是原始数据,即由于多种可能的原因,不适合直接在应用程序中使用。因此,我们需要先对其进行分析,执行必要的预处理,然后再使用它。

例如,假设我们正在尝试构建cat分类器。我们的程序将图像作为输入,然后告诉我们图像是否包含猫。建立该分类器的第一步是收集数百张猫图片。一个普遍的问题是,我们抓取的所有图片都不会具有相同的尺寸/尺寸,因此在将它们输入模型进行训练之前,我们需要将所有尺寸调整/预处理为标准尺寸。

这只是图像处理对于任何计算机视觉应用必不可少的众多原因之一。


先决条件

在继续进行之前,让我们讨论一下需要了解的内容,以便轻松地学习本教程。首先,您应该掌握任何语言的基本编程知识。其次,您应该知道什么是机器学习以及它如何工作的基础,因为本文中我们将使用一些机器学习算法进行图像处理。另外,如果您在继续学习本教程之前对Open CV有任何了解或基础知识,这将对您有所帮助。但这不是必需的。

为了遵循本教程,您一定要知道的一件事是图像在内存中的准确表示方式。每个图像由一组像素表示,即像素值矩阵。对于灰度图像,像素值的范围是0到255,它们代表该像素的强度。例如,如果您具有20 x 20尺寸的图像,则将以20x20的矩阵(总共400个像素值)表示。

如果要处理彩色图像,则应该知道它将具有三个通道-红色,绿色和蓝色(RGB)。因此,单个图像将有三个这样的矩阵。


安装

注意:由于我们将通过Python使用OpenCV,因此隐含的要求是您的工作站上已经安装了Python(版本3)。

windows

$ pip install opencv-python

苹果系统

$ brew install opencv3 --with-contrib --with-python3

Linux


$ sudo apt-get install libopencv-dev python-opencv

要检查安装是否成功,请在Python Shell或命令提示符中运行以下命令:


import cv2

您应该知道的一些基本知识

在我们继续在应用程序中使用图像处理之前,重要的是要了解哪种操作属于此类,以及如何进行这些操作。这些操作以及其他操作将在以后的应用程序中使用。

对于本文,我们将使用以下图像:

注意:为了在本文中显示图像,已对图像进行了缩放,但是我们使用的原始大小约为1180x786。

您可能已经注意到图像当前是彩色的,这意味着它由三个颜色通道表示,即红色,绿色和蓝色。我们将图像转换为灰度图像,并使用下面的代码将图像分为单独的通道。


查找图像细节

在使用imread()函数加载图像后,我们可以检索有关图像的一些简单属性,例如像素数和尺寸:

print("Image Properties")
print("- Number of Pixels: " + str(img.size))
print("- Shape/Dimensions: " + str(img.shape))

输出:

Image Properties
- Number of Pixels: 2782440
- Shape/Dimensions: (1180, 786, 3)

将图像分成单独的通道

现在,我们将使用OpenCV将图像分为红色,绿色和蓝色分量,显示它们:

cv2_imshow(red) # 显示红色通道
cv2_imshow(blue) #显示蓝色通道
cv2_imshow(green) #显示绿色通道
cv2_imshow(img_gs) # 显示灰色版本

为简便起见,我们只显示灰度图像。

灰度图像:


图像阈值

阈值的概念非常简单。如上面在图像表示中所讨论的,像素值可以是0到255之间的任何值。假设我们希望将图像转换为二进制图像,即为像素分配0或1的值。为此,我们可以执行阈值化。例如,如果阈值(T)值为125,则所有值大于125的像素将被分配值为1,所有值小于或等于该值的像素将被分配值为0。通过代码获得更好的理解。

用于阈值的图像:

import cv2

cv2_imshow(threshold)

如您所见,在生成的图像中,已经建立了两个区域,即黑色区域(像素值0)和白色区域(像素值1)。事实证明,我们设置的阈值正好在图像的中间,这就是为什么在此处划分黑白值的原因。


应用领域

#1:去除图像中的噪点

既然您已经基本了解了什么是图像处理及其用途,那么让我们继续学习它的一些特定应用程序。

在大多数情况下,我们收集的原始数据中有噪点,即使图像难以感知的不良特征。尽管这些图像可以直接用于特征提取,但是算法的准确性会受到很大影响。这就是为什么在将图像处理传递给算法之前对其进行图像处理以获得更好的准确性的原因。

噪声有很多不同的类型,例如高斯噪声,胡椒噪声等。我们可以通过应用滤镜来去除图像中的噪声,或者将噪声降到最低,或者至少将其影响降到最低。滤波器也有很多选择,每个都有不同的强度,因此对于特定类型的噪声来说是最佳选择。

为了正确理解这一点,我们将在上面考虑过的玫瑰图像的灰度版本中添加“盐和胡椒”噪声,然后尝试使用不同的滤镜从嘈杂的图像中去除该噪声,然后看看哪个是最好的-适合那种类型。

import numpy as np

cv2.imwrite('sp_05.jpg', sp_05)

好吧,我们在玫瑰图像中添加了噪点,现在看起来是这样:

嘈杂的图像:

现在让我们在其上应用不同的滤波器,并记下我们的观察结果,即每个滤波器降低噪声的程度。


带有锐化内核的算术滤波器

# 对噪音图像进行滤波
sharpened_img = cv2.filter2D(sp_05, -1, kernel_sharpening)
cv2_imshow(sharpened_img)

通过对带有噪声的图像应用算术滤波器,生成的图像如下所示。与原始灰度图像进行比较后,我们可以看到它使图像亮度过高,也无法突出玫瑰上的亮点。因此,可以得出结论,算术滤波器无法去除噪声。

算术滤波器输出:


中点滤波器


print("\n\n---Effects on S&P Noise Image with Probability 0.5---\n\n")
midpoint(sp_05)

将中点滤镜应用到噪声的图像上的结果图像如下所示。与原始灰度图像进行比较后,我们可以看到,就像上面的核方法一样,图像亮度过高。但是,它可以突出玫瑰上的亮点。因此,可以说它是比算术滤波器更好的选择,但仍然不能完全恢复原始图像。

 

谐谐波均值滤波器

注意:可以在网上轻松找到这些过滤器的实现,并且它们的工作原理超出了本教程的范围。我们将从抽象/更高的层次来研究应用程序。

print("\n\n--- Effects on S&P Noise Image with Probability 0.5 ---\n\n")
cv2_imshow(contraharmonic_mean(sp_05, (3,3), 0.5))

下面显示了在噪声下对图像应用Contraharmonic Mean Filter 所得到的图像。与原始灰度图像进行比较后,我们可以看到它已复制了几乎与原始图像完全相同的图像。其强度/亮度级别相同,并且也突出了玫瑰上的亮点。因此,我们可以得出结论,对谐波均值滤波器在处理盐和胡椒噪声方面非常有效。

既然我们已经找到了从嘈杂的图像中恢复原始图像的最佳过滤器,那么我们可以继续下一个应用程序了。


2:使用Canny Edge Detector进行边缘检测

到目前为止,我们一直在使用的玫瑰图像具有恒定的背景,即黑色,因此,对于该应用程序,我们将使用不同的图像以更好地显示算法的功能。原因是如果背景恒定,则边缘检测任务将变得非常简单,我们不希望这样做。

我们在本教程的前面讨论了cat分类器,让我们向前看这个示例,看看图像处理如何在其中发挥不可或缺的作用。

在分类算法中,首先会扫描图像中的“对象”,即,当您输入图像时,算法会在该图像中找到所有对象,然后将它们与您要查找的对象的特征进行比较。如果是猫分类器,它将对图像中找到的所有对象与猫图像的特征进行比较,如果找到匹配项,它将告诉我们输入图像包含猫。

由于我们以cat分类器为例,因此公平地使用cat图像是公平的。下面是我们将使用的图像:

用于边缘检测的图像:

import cv2
import numpy as np
from matplotlib import pyplot as plt

#显示两个图片
plt.show()

边缘检测输出:


如您所见,图像中包含对象的部分(在这种情况下是猫)已通过边缘检测点到/分开了。现在您必须要知道,什么是Canny Edge Detector,它是如何实现的?现在让我们讨论一下。

要理解上述内容,需要讨论三个关键步骤。首先,它以与我们之前讨论的相似方式对图像执行降噪。其次,它在每个像素处使用一阶导数来查找边缘。其背后的逻辑是存在边缘的点处,强度会突然变化,这会导致一阶导数的值出现尖峰,从而使该像素成为“边缘像素”。

最后,它执行磁滞门限;上面我们说过,边上的一阶导数的值有一个峰值,但是我们没有说明峰值需要多高才能将其分类为边缘-这称为阈值!

在本教程的前面,我们讨论了简单的阈值化。磁滞阈值是对此的改进,它使用两个阈值而不是一个。其背后的原因是,如果阈值太高,我们可能会错过一些实际边缘(真负值),而如果阈值太低,我们会得到很多归类为实际上不是边缘的边缘(假正值)的点。)。将一个阈值设置为高,将一个阈值设置为低。所有高于“高阈值”的点都被标识为边缘,然后评估所有高于低阈值但低于高阈值的点;被标识为边的点附近或与之相邻的点也被标识为边,其余部分被丢弃。

这些是Canny Edge Detector算法用于识别图像边缘的基本概念/方法。


结论

在本文中,我们学习了如何在Windows,MacOS和Linux等不同平台上安装OpenCV(用于Python图像处理的最流行的库),以及如何验证安装是否成功。

我们继续讨论了什么是图像处理及其在机器学习的计算机视觉领域中的用途。我们讨论了一些常见的噪声类型,以及如何在应用程序中使用图像之前使用不同的滤镜将其从图像中去除。

此外,我们了解了图像处理如何在诸如“对象检测”或“分类”之类的高端应用中发挥不可或缺的作用。请注意,本文只是冰山一角,不可能在单个教程中介绍。

相关文章
|
5月前
|
算法 计算机视觉
基于qt的opencv实时图像处理框架FastCvLearn实战
本文介绍了一个基于Qt的OpenCV实时图像处理框架FastCvLearn,通过手撕代码的方式详细讲解了如何实现实时人脸马赛克等功能,并提供了结果展示和基础知识回顾。
213 7
|
1月前
|
机器学习/深度学习 存储 数据挖掘
Python图像处理实用指南:PIL库的多样化应用
本文介绍Python中PIL库在图像处理中的多样化应用,涵盖裁剪、调整大小、旋转、模糊、锐化、亮度和对比度调整、翻转、压缩及添加滤镜等操作。通过具体代码示例,展示如何轻松实现这些功能,帮助读者掌握高效图像处理技术,适用于图片美化、数据分析及机器学习等领域。
73 20
|
1天前
|
监控 Java 计算机视觉
Python图像处理中的内存泄漏问题:原因、检测与解决方案
在Python图像处理中,内存泄漏是常见问题,尤其在处理大图像时。本文探讨了内存泄漏的原因(如大图像数据、循环引用、外部库使用等),并介绍了检测工具(如memory_profiler、objgraph、tracemalloc)和解决方法(如显式释放资源、避免循环引用、选择良好内存管理的库)。通过具体代码示例,帮助开发者有效应对内存泄漏挑战。
11 1
|
28天前
|
XML 机器学习/深度学习 人工智能
使用 OpenCV 和 Python 轻松实现人脸检测
本文介绍如何使用OpenCV和Python实现人脸检测。首先,确保安装了OpenCV库并加载预训练的Haar特征模型。接着,通过读取图像或视频帧,将其转换为灰度图并使用`detectMultiScale`方法进行人脸检测。检测到的人脸用矩形框标出并显示。优化方法包括调整参数、多尺度检测及使用更先进模型。人脸检测是计算机视觉的基础技术,具有广泛应用前景。
61 10
|
1月前
|
机器学习/深度学习 算法 数据可视化
Python的计算机视觉与图像处理
本文介绍了Python在计算机视觉和图像处理领域的应用,涵盖核心概念、算法原理、最佳实践及应用场景。重点讲解了OpenCV、NumPy、Pillow和Matplotlib等工具的使用,并通过代码实例展示了图像读写、处理和可视化的方法。实际应用包括自动驾驶、人脸识别、物体检测等。未来趋势涉及深度学习、边缘计算和量子计算,同时也讨论了数据不足、模型解释性和计算资源等挑战。
|
3月前
|
计算机视觉 开发者 Python
利用Python进行简单的图像处理
【10月更文挑战第36天】本文将引导读者理解如何使用Python编程语言和其强大的库,如PIL和OpenCV,进行图像处理。我们将从基本的图像操作开始,然后逐步深入到更复杂的技术,如滤波器和边缘检测。无论你是编程新手还是有经验的开发者,这篇文章都将为你提供新的视角和技能,让你能够更好地理解和操作图像数据。
|
4月前
|
计算机视觉 Python
python利用pyqt5和opencv打开电脑摄像头并进行拍照
本项目使用Python的PyQt5和OpenCV库实现了一个简单的摄像头应用。用户可以通过界面按钮打开或关闭摄像头,并实时预览视频流。点击“拍照”按钮可以捕捉当前画面并保存为图片文件。该应用适用于简单的图像采集和处理任务。
285 0
python利用pyqt5和opencv打开电脑摄像头并进行拍照
|
4月前
|
机器学习/深度学习 算法 计算机视觉
【Python篇】Python + OpenCV 全面实战:解锁图像处理与视觉智能的核心技能
【Python篇】Python + OpenCV 全面实战:解锁图像处理与视觉智能的核心技能
167 7
|
5月前
|
机器学习/深度学习 计算机视觉 Python
opencv环境搭建-python
本文介绍了如何在Python环境中安装OpenCV库及其相关扩展库,包括numpy和matplotlib,并提供了基础的图像读取和显示代码示例,同时强调了使用Python虚拟环境的重要性和基本操作。
|
4月前
|
算法 数据可视化 计算机视觉
Python中医学图像处理常用的库
在Python中,医学图像处理常用的库包括:ITK(及其简化版SimpleITK)、3D Slicer、Pydicom、Nibabel、MedPy、OpenCV、Pillow和Scikit-Image。这些库分别擅长图像分割、配准、处理DICOM和NIfTI格式文件、图像增强及基础图像处理等任务。选择合适的库需根据具体需求和项目要求。
144 0

热门文章

最新文章

推荐镜像

更多