opencv 图像梯度(python)

简介: opencv 图像梯度(python)


图像梯度

图像梯度计算的是图像变化的速度。

对于图像的边缘部分,其灰度值变化较大,梯度值也较大;相反,对于图像中比较平滑的部分,其灰度值变化较小,相应的梯度值也较小。

图像梯度计算需要求导数,但是图像梯度一般通过计算像素值的差来得到梯度的近似值(近似导数值)。(差分,离散)

Sobel算子、Scharr算子和Laplacian算子的使用。

Sobel理论基础

Sobel算子是一种离散的微分算子,该算子结合了高斯平滑和微分求导运算。

该算子利用局部差分寻找边缘,计算所得的是一个梯度的近似值。

滤波器通常是指由一幅图像根据像素点(x, y)临近的区域计算得到另外一幅新图像的算法。

滤波器是由邻域及预定义的操作构成的

滤波器规定了滤波时所采用的形状以及该区域内像素值的组成规律。滤波器也被称为“掩模”、“核”、“模板”、“窗口”、“算子”等。

一般信号领域将其称为“滤波器”,数学领域将其称为“核”。

线性滤波器: 滤波的目标像素点的值等于原始像素值及其周围像素值的加权和。这种基于线性核的滤波,就是所熟悉的卷积。

计算水平方向偏导数的近似值

将Sobel算子与原始图像src进行卷积计算,可以计算水平方向上的像素值变化情况。

例如,当Sobel算子的大小为3×3时,水平方向偏导数Gx的计算方式为:

计算垂直方向偏导数的近似值

当Sobel算子的大小为3×3时,垂直方向偏导数Gy的计算方式为:

Sobel算子及函数使用

使用函数cv2.Sobel()实现Sobel算子运算,其语法形式为:

dst = cv2.Sobel( src, ddepth, dx, dy[, ksize[, scale[, delta[, borderType]]]] )
  • dst代表目标图像
  • src代表原始图像
  • ddepth代表输出图像的深度

  • dx代表x方向上的求导阶数。
  • dy代表y方向上的求导阶数。
  • ksize代表Sobel核的大小。该值为-1时,则会使用Scharr算子进行运算。
  • scale代表计算导数值时所采用的缩放因子,默认情况下该值是1,是没有缩放的。
  • delta代表加在目标图像dst上的值,该值是可选的,默认为0。
  • borderType代表边界样式。

注意点:参数ddepth

在函数cv2.Sobel()的语法中规定,可以将函数cv2.Sobel()内ddepth参数的值设置为-1,让处理结果与原始图像保持一致。但是,如果直接将参数ddepth的值设置为-1,在计算时得到的结果可能是错误的。

在实际操作中,计算梯度值可能会出现负数。如果处理的图像是8位图类型,则在ddepth的参数值为-1时,意味着指定运算结果也是8位图类型,那么所有负数会自动截断为0,发生信息丢失。为了避免信息丢失,在计算时要先使用更高的数据类型cv2.CV_64F,再通过取绝对值将其映射为cv2.CV_8U(8位图)类型。

通常要将函数cv2.Sobel()内参数ddepth的值设置为“cv2.CV_64F”。

要将偏导数取绝对值,以保证偏导数总能正确地显示出来。

在OpenCV中,使用函数cv2.convertScaleAbs()对参数取绝对值,该函数的语法格式为:

dst = cv2.convertScaleAbs( src [, alpha[, beta]] )
  • dst代表处理结果。
  • src代表原始图像。
  • alpha代表调节系数,该值是可选值,默认为1。
  • beta代表调节亮度值,该值是默认值,默认为0。

该函数的作用是将原始图像src转换为256色位图,其可以表示为:

dst=saturate(src*alpha+beta)

式中,saturate()表示计算结果的最大值是饱和值,例如: 当“src*alpha+beta”的值超过255时,其取值为255。

**例子:**使用函数cv2.convertScaleAbs()对一个随机数组取绝对值。

import cv2 
import numpy as np 
img=np.random.randint(-256,256, size=[4,5], dtype=np.int16) 
rst=cv2.convertScaleAbs(img) 
print("img=\n", img) 
print("rst=\n", rst)
方向

在函数cv2.Sobel()中,参数dx表示x轴方向的求导阶数,参数dy表示y轴方向的求导阶数。参数dx和dy通常的值为0或者1,最大值为2。

如果是0,表示在该方向上没有求导。当然,参数dx和参数dy的值不能同时为0。

参数dx和参数dy可以有多种形式的组合,主要包含:

  • 计算x方向边缘(梯度):dx=0, dy=1。
  • 计算y方向边缘(梯度):dx=1, dy=0。
  • 参数dx与参数dy的值均为1:dx=1, dy=1。
  • 计算x方向和y方向的边缘叠加:通过组合方式实现。

例子

“dx=1, dy=0”。当然,也可以设置为“dx=2, dy=0”。此时,会仅仅获取垂直方向的边缘信息,此时的语法格式为:

dst = cv2.Sobel( src , ddepth , 1 , 0 )

“dx=0, dy=1”。当然,也可以设置为“dx=0, dy=2”。此时,会仅仅获取水平方向的边缘信息,此时的语法格式为:

dst = cv2.Sobel( src , ddepth , 0 , 1 )

“dx=1, dy=1”,也可以设置为“dx=2, dy=2”,或者两个参数都不为零的其他情况。此时,会获取两个方向的边缘信息,此时的语法格式为:

dst = cv2.Sobel( src , ddepth , 1 , 1 )
计算x方向和y方向的边缘叠加

如果想获取x方向和y方向的边缘叠加,需要分别获取水平方向、垂直方向两个方向的边缘图,然后将二者相加。

dx= cv2.Sobel( src , ddepth , 1 , 0 ) 
dy= cv2.Sobel( src , ddepth , 0 , 1 ) 
dst=cv2.addWeighted( src1 , alpha , src2 , beta , gamma )

例子

使用函数cv2.Sobel()获取图像水平方向的完整边缘信息

将参数ddepth的值设置为cv2.CV_64F,并使用函数cv2.convertScaleAbs()对cv2.Sobel()的计算结果取绝对值。

import cv2 
o = cv2.imread('Sobel4.bmp', cv2.IMREAD_GRAYSCALE) 
Sobelx = cv2.Sobel(o, cv2.CV_64F,0,1) 
Sobelx = cv2.convertScaleAbs(Sobelx) 
cv2.imshow("original", o) 
cv2.imshow("x", Sobelx) 
cv2.waitKey() 
cv2.destroyAllWindows()

计算函数cv2.Sobel()在水平、垂直两个方向叠加的边缘信息。

import cv2 
o = cv2.imread('Sobel4.bmp', cv2.IMREAD_GRAYSCALE) 
Sobelx = cv2.Sobel(o, cv2.CV_64F,1,0) 
Sobely = cv2.Sobel(o, cv2.CV_64F,0,1) 
Sobelx = cv2.convertScaleAbs(Sobelx) 
Sobely = cv2.convertScaleAbs(Sobely) 
Sobelxy =  cv2.addWeighted(Sobelx,0.5, Sobely,0.5,0) 
cv2.imshow("original", o) 
cv2.imshow("xy", Sobelxy) 
cv2.waitKey() 
cv2.destroyAllWindows()
Scharr算子及函数使用

在离散的空间上,有很多方法可以用来计算近似导数,在使用3×3的Sobel算子时,可能计算结果并不太精准。

OpenCV提供了Scharr算子,该算子具有和Sobel算子同样的速度,且精度更高。

可以将Scharr算子看作对Sobel算子的改进,其核通常为:

OpenCV提供了函数cv2.Scharr()来计算Scharr算子,其语法格式如下:

dst = cv2.Scharr( src, ddepth, dx, dy[, scale[, delta[, borderType]]] )
  • dst代表输出图像。
  • src代表原始图像。
  • ddepth代表输出图像深度。该值与函数cv2.Sobel()中的参数ddepth的含义相同
  • dx代表x方向上的导数阶数。
  • dy代表y方向上的导数阶数。
  • scale代表计算导数值时的缩放因子,该项是可选项,默认值是1,表示没有缩放。
  • delta代表加到目标图像上的亮度值,该项是可选项,默认值为0。
  • borderType代表边界样式。

在函数cv2.Sobel()中,如果ksize=-1,则会使用Scharr滤波器。

如下语句:

dst=cv2.Scharr(src, ddepth, dx, dy)

dst=cv2.Sobel(src, ddepth, dx, dy, -1)

是等价的。

函数cv2.Scharr()和函数cv2.Sobel()的使用方式基本一致。

参数ddepth的值应该设置为“cv2.CV_64F”,并对函数cv2.Scharr()的计算结果取绝对值,才能保证得到正确的处理结果。

具体语句为:

dst=Scharr(src, cv2.CV_64F, dx, dy) 
dst= cv2.convertScaleAbs(dst)

在函数cv2.Scharr()中,要求参数dx和dy满足条件:

  • dx >= 0 && dy >= 0 && dx+dy == 1
    和Sobel 不同, Scharr 的dx+dy 必须为1

参数dx和参数dy的组合形式有:

  • 计算x方向边缘(梯度):dx=0, dy=1。
  • 计算y方向边缘(梯度): dx=1, dy=0。
  • 计算x方向与y方向的边缘叠加:通过组合方式实现。

例子

  1. 计算x方向边缘(梯度):dx=1, dy=0
dst=Scharr(src, ddpeth, dx=1, dy=0)
  1. 计算y方向边缘(梯度):dx=0, dy=1
dst=Scharr(src, ddpeth, dx=0, dy=1)
  1. 计算x方向与y方向的边缘叠加
    将两个方向的边缘相加
dx=Scharr(src, ddpeth, dx=1, dy=0) 
dy=Scharr(src, ddpeth, dx=0, dy=1) 
Scharrxy=cv2.addWeighted(dx,0.5, dy,0.5,0)

参数dx和dy的值不能都为1

Sobel算子和Scharr算子的比较

Sobel算子的缺点是,当其核结构较小时,精确度不高,而Scharr算子具有更高的精度。

Sobel算子和Scharr算子的核结构:

Laplacian算子及函数使用

Laplacian(拉普拉斯)算子是一种二阶导数算子,其具有旋转不变性,可以满足不同方向的图像边缘锐化(边缘检测)的要求。

通常情况下,其算子的系数之和需要为零。

一个3×3大小的Laplacian算子

Laplacian算子类似二阶Sobel导数,需要计算两个方向的梯度值。

计算结果的值可能为正数,也可能为负数。所以,需要对计算结果取绝对值,以保证后续运算和显示都是正确的。

在OpenCV内使用函数cv2.Laplacian()实现Laplacian算子的计算,该函数的语法格式为:

dst = cv2.Laplacian( src, ddepth[, ksize[, scale[, delta[, borderType]]]] )
  • dst代表目标图像。
  • src代表原始图像。
  • ddepth代表目标图像的深度。
  • ksize代表用于计算二阶导数的核尺寸大小。该值必须是正的奇数。
  • scale代表计算Laplacian值的缩放比例因子,该参数是可选的。默认情况下,该值为1,表示不进行缩放。
  • delta代表加到目标图像上的可选值,默认为0。
  • borderType代表边界样式。

该函数分别对x、y方向进行二次求导,具体为:

上式是当ksize的值大于1时的情况。当ksize的值为1时,Laplacian算子计算时采用的3×3的核如下:

通过从图像内减去它的Laplacian图像,可以增强图像的对比度,此时其算子为:

例子: 使用函数cv2.Laplacian()计算图像的边缘信息。

import cv2 
o = cv2.imread('Laplacian.bmp', cv2.IMREAD_GRAYSCALE) 
Laplacian = cv2.Laplacian(o, cv2.CV_64F) 
Laplacian = cv2.convertScaleAbs(Laplacian) 
cv2.imshow("original", o) 
cv2.imshow("Laplacian", Laplacian) 
cv2.waitKey() 
cv2.destroyAllWindows()
算子总结

Sobel算子、Scharr算子、Laplacian算子都可以用作边缘检测

Sobel算子和Scharr算子计算的都是一阶近似导数的值。通常情况下,可以将它们表示为:

  • Sobel算子= |左-右| 或 |下-上|
  • Scharr算子=|左-右| 或 |下-上|

Laplacian算子计算的是二阶近似导数值,可以将它表示为:

  • Laplacian算子=|中-左| + |中-右| + |中-下| + |中-上|
相关文章
|
2月前
|
计算机视觉
Opencv学习笔记(三):图像二值化函数cv2.threshold函数详解
这篇文章详细介绍了OpenCV库中的图像二值化函数`cv2.threshold`,包括二值化的概念、常见的阈值类型、函数的参数说明以及通过代码实例展示了如何应用该函数进行图像二值化处理,并展示了运行结果。
525 0
Opencv学习笔记(三):图像二值化函数cv2.threshold函数详解
|
16天前
|
机器学习/深度学习 人工智能 算法
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
宠物识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了37种常见的猫狗宠物种类数据集【'阿比西尼亚猫(Abyssinian)', '孟加拉猫(Bengal)', '暹罗猫(Birman)', '孟买猫(Bombay)', '英国短毛猫(British Shorthair)', '埃及猫(Egyptian Mau)', '缅因猫(Maine Coon)', '波斯猫(Persian)', '布偶猫(Ragdoll)', '俄罗斯蓝猫(Russian Blue)', '暹罗猫(Siamese)', '斯芬克斯猫(Sphynx)', '美国斗牛犬
98 29
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
|
1月前
|
机器学习/深度学习 TensorFlow 算法框架/工具
利用Python和TensorFlow构建简单神经网络进行图像分类
利用Python和TensorFlow构建简单神经网络进行图像分类
58 3
|
2月前
|
存储 JSON API
Python| 如何使用 DALL·E 和 OpenAI API 生成图像(1)
Python| 如何使用 DALL·E 和 OpenAI API 生成图像(1)
68 7
Python| 如何使用 DALL·E 和 OpenAI API 生成图像(1)
|
3月前
|
机器学习/深度学习 人工智能 算法
植物病害识别系统Python+卷积神经网络算法+图像识别+人工智能项目+深度学习项目+计算机课设项目+Django网页界面
植物病害识别系统。本系统使用Python作为主要编程语言,通过收集水稻常见的四种叶片病害图片('细菌性叶枯病', '稻瘟病', '褐斑病', '稻瘟条纹病毒病')作为后面模型训练用到的数据集。然后使用TensorFlow搭建卷积神经网络算法模型,并进行多轮迭代训练,最后得到一个识别精度较高的算法模型,然后将其保存为h5格式的本地模型文件。再使用Django搭建Web网页平台操作界面,实现用户上传一张测试图片识别其名称。
142 22
植物病害识别系统Python+卷积神经网络算法+图像识别+人工智能项目+深度学习项目+计算机课设项目+Django网页界面
|
3月前
|
机器学习/深度学习 人工智能 算法
鸟类识别系统Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+ResNet50算法模型+图像识别
鸟类识别系统。本系统采用Python作为主要开发语言,通过使用加利福利亚大学开源的200种鸟类图像作为数据集。使用TensorFlow搭建ResNet50卷积神经网络算法模型,然后进行模型的迭代训练,得到一个识别精度较高的模型,然后在保存为本地的H5格式文件。在使用Django开发Web网页端操作界面,实现用户上传一张鸟类图像,识别其名称。
119 12
鸟类识别系统Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+ResNet50算法模型+图像识别
|
3月前
|
存储 计算机视觉
Opencv的基本操作(一)图像的读取显示存储及几何图形的绘制
本文介绍了使用OpenCV进行图像读取、显示和存储的基本操作,以及如何绘制直线、圆形、矩形和文本等几何图形的方法。
Opencv的基本操作(一)图像的读取显示存储及几何图形的绘制
|
2月前
|
计算机视觉 Python
python利用pyqt5和opencv打开电脑摄像头并进行拍照
本项目使用Python的PyQt5和OpenCV库实现了一个简单的摄像头应用。用户可以通过界面按钮打开或关闭摄像头,并实时预览视频流。点击“拍照”按钮可以捕捉当前画面并保存为图片文件。该应用适用于简单的图像采集和处理任务。
154 0
python利用pyqt5和opencv打开电脑摄像头并进行拍照
|
2月前
|
JSON API 数据格式
Python| 如何使用 DALL·E 和 OpenAI API 生成图像(2)
Python| 如何使用 DALL·E 和 OpenAI API 生成图像(2)
58 0
Python| 如何使用 DALL·E 和 OpenAI API 生成图像(2)
|
2月前
|
机器学习/深度学习 算法 计算机视觉
【Python篇】Python + OpenCV 全面实战:解锁图像处理与视觉智能的核心技能
【Python篇】Python + OpenCV 全面实战:解锁图像处理与视觉智能的核心技能
104 2
下一篇
DataWorks