一文讲解图像梯度

简介: 图像梯度计算的是图像变化的幅度。对于图像的边缘部分,其灰度值变化较大,梯度值变化也较大;相反,对于图像中比较平滑的部分,其灰度值变化较小,相应的梯度值变化也较小。一般情况下,图像梯度计算的是图像的边缘信息。它在图像处理和计算机视觉中具有重要的应用,常用于边缘检测、特征提取和图像增强等任务。

简介:

      图像梯度计算的是图像变化的幅度。对于图像的边缘部分,其灰度值变化较大,梯度值变化也较大;相反,对于图像中比较平滑的部分,其灰度值变化较小,相应的梯度值变化也较小。一般情况下,图像梯度计算的是图像的边缘信息。它在图像处理和计算机视觉中具有重要的应用,常用于边缘检测、特征提取和图像增强等任务。


图像梯度概念:

图像梯度就是对图像的X轴,Y轴求其变化率,是一个二维的向量,分别表示X轴的变化和Y轴的变化:


其中:


  • X轴的变化是指当前像素右侧(X加1)的像素值减去当前像素左侧(X减1)的像素值。
  • Y轴的变化是当前像素下方(Y加1)的像素值减去当前像素上方(Y减1)的像素值。

将计算出来的两个分量合并在一起,形成一个二维向量就得到了图像梯度。


推导:

首先我们先来看一下数学知识微积分的求导的过程:


eq.png



这里是对图像的一阶微分,但是图像时一个二维的向量,假设我们设该函数为f(x,y),我们看一下微积分中对两个未知数的微分,这里就是求偏导的内容


对x方向的求导:


eq.png


对y方向的求导:


eq.png


这里求导,高数的知识说这个值应该趋近于0,这样才能求的偏导,也就是无限小,但是对于图像来说取不到很小的值,图像中的像素离散的,最小的距离应为1。因此这里我们令等于1。那么上面的公式就变为:


eq.png


eq.png


这样我们就得到了图像的梯度公式,仔细观察我们可以看到图像梯度可以近似为相邻像素的差值。


上述两个公式对所有  和  的有关值可用下图的一维模板对  的滤波得到。


b8a41641fda14853b0da30e82a6070ec.png


用于计算梯度偏导数的滤波器模板,通常称之为梯度算子边缘算子边缘检测子等。


对于不同的滤波器模板得到的梯度是不同的,这也就衍生出很多算子,如Roberts、Prewitt、Sobel和Laplacian算子等。下面将详细介绍不同的算子。


梯度算子

梯度简单来说就是求导。OpenCV 提供了三种不同的梯度滤波器,或者说高通滤波器:Sobel Scharr 和Laplacian 。什么叫高通呢?其实就是和图像模糊相反。图像模糊是让低频通过,阻挡高频,这样就可以去除噪点,让锐利的边缘变平滑。高通滤波器就是让高频通过,阻挡低频,可以让边缘更加明显,增强图像。


Roberts 算子:

Roberts算子即交叉微分算子,是基于交叉差分的梯度算子。此算法通过局部差分来计算检测图像的边缘线条,对噪声敏感。


Roberts交叉微分算子分别为主对角线和副对角线方向的算子,有两个2*2的滤波算子组成:


6c83e6c431644866970e03983e63057c.png


44e9e94ea35d4488b4fb1c066a42b69b.png


Prewitt 算子

Prewitt算子是一种图像边缘检测的微分算子,其原理是利用特定区域内像素灰度值产生的差分实现边缘检测。由于Prewitt算子采用 33 模板对区域内的像素值进行计算,而Robert算子的模板为 22,故Prewitt算子的边缘检测结果在水平方向和垂直方向均比Robert算子更加明显。Prewitt算子适合用来识别噪声较多、灰度渐变的图像,其计算公式如下所示:


f30791045c94404b8808edaa7ea894da.png

例如,下面给出Prewitt算子的模板,在像素点P5处  x和 y 方向上的梯度大小分别计算为:


713a8fd2b1404f1abb401fa0e4c181c7.png


c574b91d3a79445ba1b7dd936d7e541d.png


Prewitt算子的边缘检测结果在水平方向和垂直方向均比Robert算子更加明显。


Sobel算子:

Sobel算子,主要用作边缘检测,是离散差分算子,用来运算图像梯度函数的灰度近似值。Sobel算子具有一定的平滑作用,对噪声不敏感。在图像的任何一点使用此算子,将会产生对应的梯度矢量或者法矢量。其中Sobel算子x轴y轴卷积核如下:



50ef9685929043658ea58c5f361c2e35.png

149488af4e3443e1a643e4400fc2c1e8.png

967f2aaea3db45d3bcb62ac2634e2898.png




如上图我们可以看到对P5这个点求x轴,y轴的梯度。以Gx为例,P5的x轴梯度公式是:


P5  = (P3-P1)+2(P6-P4)+(P9-P7)


这里我们可以看到,由于P6和P4距离P5较近,对P5的影响较大,所以给予了一个较大的权重2,从差值中我们可以看到,P5右边的值减去P5左边的值,假设两边差值较大说明P5这个点位于边界,两边差值较小,说明P5在图像变化较为平缓区域。


下面我们使用python代码对其实现:


# coding:utf-8
import cv2
import numpy as np
# Scharr算子实现梯度计算
def Scharr_demo(image):
    # x 方向梯度
    image_grad_x = cv2.Sobel(image, cv2.CV_32F, 1, 0)
    # y 方向梯度
    image_grad_y = cv2.Sobel(image, cv2.CV_32F, 0, 1)
    # 分别求绝对值并转化为8位的图像上,这样做方便显示
    image_gradx = cv2.convertScaleAbs(image_grad_x)
    image_grady = cv2.convertScaleAbs(image_grad_y)
    # 显示两个方向图像
    cv2.imshow("image_gradient-x", image_gradx)
    cv2.imshow("image_gradient-y", image_grady)
    # 两个方向梯度的叠加,权重各自一半
    image_gradxy = cv2.addWeighted(image_gradx, 0.5, image_grady, 0.5, 0)
    cv2.imshow("image_gradient", image_gradxy)
if __name__ == '__main__':
    image = cv2.imread("a.jpg")
    cv2.imshow("src_image", image)
    Scharr_demo(image)
    cv2.waitKey(0)
    cv2.destroyAllWindows()


这里我们使用第一张图进行求图像梯度结果图如下:


image.png


Scharr算子:

在离散的空间上,有很多方法可以用来计算近似导数,在使用3×3的Sobel算子时,可能计算结果并不太精准。下面我们介绍Scharr算子,该算子具有和Sobel算子同样的速度,且精度更高。可以将Scharr算子看作对Sobel算子的改进,其核通常为:

2b4920f7072e4bf2a642041d45974e0e.png



梯度的计算方法与Sobel算子一样,下面我们使用Python对其进行实现:


#coding:utf-8
import cv2 
import numpy as np
# Scharr算子实现梯度计算
def Scharr_demo(image):
    # x 方向梯度
    image_grad_x = cv2.Scharr(image, cv2.CV_32F, 1, 0)
    # y 方向梯度
    image_grad_y = cv2.Scharr(image, cv2.CV_32F, 0, 1)
    # 分别求绝对值并转化为8位的图像上,这样做方便显示
    image_gradx = cv2.convertScaleAbs(image_grad_x) 
    image_grady = cv2.convertScaleAbs(image_grad_y)
    # 显示两个方向图像
    cv2.imshow("image_gradient-x", image_gradx)
    cv2.imshow("image_gradient-y", image_grady)
    #两个方向梯度的叠加,权重各自一半
    image_gradxy = cv2.addWeighted(image_gradx, 0.5, image_grady, 0.5, 0)
    cv2.imshow("image_gradient", image_gradxy)
if __name__ == '__main__':
    image = cv2.imread("./test01.jpg")
    cv2.imshow("src_image", image)
    Scharr_demo(image)
    cv2.waitKey(0)
    cv2.destroyAllWindows()


这里我们依旧使用第一张图进行求图像梯度结果图如下:

image.png



Sobel算子与Scharr算子比较:

Sobel算子的缺点是,当其核结构较小时,精确度不高,而Scharr算子具有更高的精度。


下面我们对两个算子对图像处理的结果进行展示:

image.png



这里第一张为原始图像,第二张是通过Sobel求图像梯度,第三张是通过Scharr算子求图像梯度。


Laplacian 算子:  

Laplacian(拉普拉斯)算子是一种二阶导数算子,其具有旋转不变性,可以满足不同方向的图像边缘锐化(边缘检测)的要求。通常情况下,其算子的系数之和需要为零。例如,一个

3×3 大小的 Laplacian 算子如图 所示。

3b1f5ecee7284807a43502af7a8bc2c0.png


Laplacian 算子类似二阶 Sobel 导数,需要计算两个方向的梯度值。


为了更适合于数字图像处理,将该方程表示为离散形式:


2b5dda3c2d00413aaf664dfb354dc47c.png


另外,拉普拉斯算子还可以表示成模板的形式,以便更好编程需要。如下图所示。


6fcf63fbd5ab40c58e612afc4ff45e03.png


图(a)表示离散拉普拉斯算子的模板,图(b)表示其扩展模板,图(c)则分别表示其他两种拉普拉斯的实现模板。从模板形式容易看出,如果在图像中一个较暗的区域中出现了一个亮点,那么用拉普拉斯运算就会使这个亮点变得更亮。因为图像中的边缘就是那些灰度发生跳变的区域,所以拉普拉斯锐化模板在边缘检测中很有用。一般增强技术对于陡峭的边缘和缓慢变化的边缘很难确定其边缘线的位置。但此算子却可用二次微分正峰和负峰之间的过零点来确定,对孤立点或端点更为敏感,因此特别适用于以突出图像中的孤立点、孤立线或线端点为目的的场合。同梯度算子一样,拉普拉斯算子也会增强图像中的噪声,有时用拉普拉斯算子进行边缘检测时,可将图像先进行平滑处理。


图像锐化处理的作用是使灰度反差增强,从而使模糊图像变得更加清晰。图像模糊的实质就是图像受到平均运算或积分运算,因此可以对图像进行逆运算,如微分运算能够突出图像细节,使图像变得更为清晰。由于拉普拉斯是一种微分算子,它的应用可增强图像中灰度突变的区域,减弱灰度的缓慢变化区域。因此,锐化处理可选择拉普拉斯算子对原图像进行处理,产生描述灰度突变的图像,再将拉普拉斯图像与原始图像叠加而产生锐化图像。拉普拉斯锐化的基本方法可以由下式表示:


43912fb1121445b49eb5e38c8bad9b1d.png


这种简单的锐化方法既可以产生拉普拉斯锐化处理的效果,同时又能保留背景信息,将原始图像叠加到拉普拉斯变换的处理结果中去,可以使图像中的各灰度值得到保留,使灰度突变处的对比度得到增强,最终结果是在保留图像背景的前提下,突现出图像中小的细节信息。但其缺点是对图像中的某些边缘产生双重响应。


各类算子的优缺点:

(1)Roberts 算子


Roberts算子利用局部差分算子寻找边缘,边缘定位精度较高,但容易丢失一部分边缘,不具备抑制噪声的能力。该算子对具有陡峭边缘且含噪声少的图像效果较好,尤其是边缘正负45度较多的图像,但定位准确率较差;


(2) Prewitt 算子


Prewitt算子对灰度渐变的图像边缘提取效果较好,而没有考虑相邻点的距离远近对当前像素点的影响,与Sobel 算子类似,不同的是在平滑部分的权重大小有些差异;


(3)Sobel 算子


Sobel算子考虑了综合因素,对噪声较多的图像处理效果更好,Sobel 算子边缘定位效果不错,但检测出的边缘容易出现多像素宽度。


(4)Scharr算子


Scharr算子,该算子具有和Sobel算子同样的速度,且精度更高。可以将Scharr算子看作对Sobel算子的改进。


(5)Laplacian 算子


Laplacian 算子不依赖于边缘方向的二阶微分算子,对图像中的阶跃型边缘点定位准确,该算子对噪声非常敏感,它使噪声成分得到加强,这两个特性使得该算子容易丢失一部分边缘的方向信息,造成一些不连续的检测边缘,同时抗噪声能力比较差,由于其算法可能会出现双像素边界,常用来判断边缘像素位于图像的明区或暗区,很少用于边缘检测。



相关文章
|
2月前
|
Web App开发 编解码 安全
视频会议技术 入门探究:WebRTC、Qt与FFmpeg在视频编解码中的应用
视频会议技术 入门探究:WebRTC、Qt与FFmpeg在视频编解码中的应用
180 4
|
2月前
|
传感器 监控 BI
基于STM32的智能垃圾分类系统设计与实现
基于STM32的智能垃圾分类系统设计与实现
100 0
|
3月前
|
人工智能 Go Python
Python 实现 五子棋小游戏【附源码】
Python 实现 五子棋小游戏【附源码】
77 0
|
7月前
|
机器学习/深度学习 运维 计算机视觉
TimesNet:时间序列预测的最新模型
2023年4月发表了一个新的模型,它在时间序列分析的多个任务中实现了最先进的结果,如预测、imputation、分类和异常检测:TimesNet。
446 0
|
10月前
|
自然语言处理 算法 计算机视觉
【计算机视觉】DETR 系列的最新综述!
DEtection TRansformer (DETR)将检测视为集合预测问题,而不需要生成候选区和后处理步骤,从而将TRansformer引入到目标检测任务中
|
8月前
|
存储 算法 计算机视觉
维特比解码(Viterbi Decoding
维特比解码(Viterbi Decoding)是一种用于解码卷积编码(Convolutional Coding)的算法,由 Andrew Viterbi 在 1968 年提出。卷积编码是一种前向纠错编码技术,用于提高数据传输的可靠性。在卷积编码中,数据被组织成一定大小的块,并用一个纠错码附加到数据块中。在接收端,维特比解码算法根据接收到的编码数据,通过比较不同可能的解码路径的权重,来找到最有可能的解码路径,从而实现对数据的解码。
378 4
|
11月前
|
架构师
【IPD流程学习 四】常见问题答疑
【IPD流程学习 四】常见问题答疑
154 0
|
运维 开发工具 C#
总结两种使用OpenCv连接海康相机播放视频画面方法
总结两种使用OpenCv连接海康相机播放视频画面方法
1650 0
|
12月前
|
数据采集 机器学习/深度学习 人工智能
【项目实践】多粒度网络MGN-ReID之跨境追踪实践(一)
【项目实践】多粒度网络MGN-ReID之跨境追踪实践(一)
776 0
|
XML Java 测试技术
testNG框架从入门到精通
testNG框架从入门到精通
testNG框架从入门到精通