人工智能图像识别四大算子(二)

本文涉及的产品
视觉智能开放平台,分割抠图1万点
视觉智能开放平台,图像资源包5000点
视觉智能开放平台,视频资源包5000点
简介: 人工智能图像识别四大算子(二)

Laplace算子


Label算子是一个二阶微分算子,它实际上是一个x方向的二阶导数和y方向的二阶导数之和的近似微分。该算子比较适合应用于只关心边缘位置而不考虑其周围像素灰度差值的图像边缘检测场景。Laplace算子对孤立像素的响应比对边缘像素的响应要更强烈些,因此适用于无噪声的图像处理。存在噪声的情况下,使用Laplace算子检测边缘前需要先对图像进行低通滤波。所以,通常的分割算法都是把Laplace算子和平滑算子结合起来生成一个新的模板。

为了更适合数字图像处理,可将Laplace算子表示为如下离散形式:

▽²f=(f(x+1,y)+f(x-1,y)+f(x,y+1)+f(x,y-1))

常用的离散Laplace算子:db43d7d1e1cef9656d82bb65e9321988_22ae948579a947b983502e41664667d6.png

其拓展算子为:65bedc55f158fa1086e32d5aeaac2795_b19747beb6544b69ac3b97a32c28642d.png

Laplace算子一般不以其原始形式用于边缘检测,因其作为一个二阶导数,Laplace算子对噪声有无法接受的敏感性,一般使用的是高斯型Laplace算子(Laplace of Gaussian,LoG)。再LoG公式中使用高斯函数的目的是对图像进行平滑处理,使用Laplace算子的目的就是提供一幅用零交叉确定边缘位置的图像。图像的平滑处理减少了噪声的影响,且他的主要作用是抵消由Laplace算子的二阶导数引起的逐渐增加的噪声影响。

利用Laplace算子进行图像边缘检测的代码如下:



#Laplace算子
import numpy as np
from PIL import Image
import matplotlib.cm as cm
import matplotlib.pyplot as plt
import scipy.signal as signal
#定义Laplace算子
Operator1=np.array([[0,1,0],[1,-4,1],[0,1,0]])
#定义Laplace拓展算子
Operator2=np.array([[1,1,1],[1,-8,1],[1,1,1]])
image=Image.open('D:\Image\one.jpg').convert('L')
image_array=np.array(image)
#卷积计算
image_oper1=signal.convolve2d(image,Operator1,mode='same')
image_oper2=signal.convolve2d(image,Operator2,mode='same')
#由于卷积后的元素的值不一定为0~255,所以需要归一化为0~255
image_oper1=image_oper1*(255/float(image_oper1.max()))
image_oper2=image_oper2*(255/float(image_oper2.max()))
#将大于灰度平均值的灰度值变成255(白色),方便观察
image_oper1[image_oper1>image_oper1.mean()]=255
image_oper2[image_oper2>image_oper2.mean()]=255
#显示边缘检测结果
plt.subplot(2,1,1)
plt.imshow(image_array,cmap=cm.gray)
plt.axis('off')
plt.subplot(2,2,3)
plt.imshow(image_oper1,cmap=cm.gray)
plt.axis('off')
plt.subplot(2,2,4)
plt.imshow(image_oper2,cmap=cm.gray)
plt.axis('off')
plt.show()



为了更好的边缘检测效果,可先对图像进行模糊平滑处理,除去图像中的高频噪声,高频噪声一般可采用高斯算法来进行处理,该算法示例代码如下:


def func(x,y,sigma=1):
    return 100*(1/(2*np.pi*sigma))*np.exp(-((x-2)**2)/(2.0*sigma**2))


使用高斯算法降噪后的代码:


#Laplace算子
import numpy as np
from PIL import Image
import matplotlib.cm as cm
import matplotlib.pyplot as plt
import scipy.signal as signal
#高斯算法示例代码
def func(x,y,sigma=1):
    return 100*(1/(2*np.pi*sigma))*np.exp(-((x-2)**2)/(2.0*sigma**2))
Operator1=np.fromfunction(func,(5,5),sigma=5)
#定义Laplace算子
Operator2=np.array([[0,1,0],[1,-4,1],[0,1,0]])
image=Image.open('D:\Image\one.jpg').convert('L')
image_array=np.array(image)
#卷积计算
#通过生成的高斯算子与原图像进行卷积计算来对图像进行平滑处理
image_blur=signal.convolve2d(image_array,Operator1,mode='same')
image_oper1=signal.convolve(image_blur,Operator2,mode='same')
#由于卷积后的元素的值不一定为0~255,所以需要归一化为0~255
image_oper1=image_oper1*(255/float(image_oper1.max()))
#将大于灰度平均值的灰度值变成255(白色),方便观察
image_oper1[image_oper1>image_oper1.mean()]=255
#显示边缘检测结果
plt.subplot(1,2,1)
plt.imshow(image_array,cmap=cm.gray)
plt.axis('off')
plt.subplot(1,2,2)
plt.imshow(image_oper1,cmap=cm.gray)
plt.axis('off')
plt.show()


Conny算子


Conny算子是一种基于图像梯度计算的图像边缘检测算法,与上文提及的基于Laplace算法的图像边缘检测方法类似,亦属于先平滑后求导的方法。利用Conny算子实现图像边缘检测的过程分为以下几个步骤:

`①.图像灰度化```

②.对图像进行高斯平滑滤波

首先生成二维高斯分布矩阵:

p (x,y) = p (x)p (y) = frac {1} {2pi} exp (-frac {x^2+y^2} {2}) tag {5} 为了向量化公式,用向量 textbf {v}= [x y]^T

然后,将其与灰度图像进行卷积实现图像滤波:

fs(x,y)=f(x,y)*p(x,y)

③.计算梯度幅值和方向。

求变化率时,对于一元函数,即为求导,对于二元函数即为求偏导。在数字图像处理中,用一阶有限差分近似方法求得灰度值的梯度幅值(变化率)。

④.对梯度幅值进行非极大值抑制(Non-Maximum Suppression,NMS)。

寻找像素点局部最大值,沿着梯度方向,比较它前面和后面的梯度幅值。在沿其梯度方向上领域的梯度幅值最大则保留,反之则抑制。这一步主要是排除非边缘像素,仅保留部分细线条(候选边缘)。

⑤.用双阈值法检测和连接边缘。

——>选取梯度幅值为高阈值TH和低阈值TL,TH:TL为2:1或3:1.

——>如果某一像素位置的梯度幅值超过TH,则该像素被保留为边缘像素。

——>如果某一像素位置的梯度幅值小于TL,则该像素排除。

——>如果某一像素位置的梯度幅值在TH和TL之间,则该像素仅仅在连接到一个高于原像素时被保留。

利用Canny算子进行图像边缘检测示例代码:



#Canny算子
import matplotlib.pyplot as plt
import matplotlib.cm as cm
import numpy as np
import math
#载入原图
img=plt.imread('D:\Image\one.jpg')
sigma1=sigma2=1 #设定高斯滤波器标准差,缺省值为1
sum=0
gaussian=np.zeros([5,5])#初始化5*5高斯算子矩阵
for i in range(5):
    for j in range(5):
        #生成二维高斯分布矩阵
        gaussian[i,j]=math.exp(-1/2*(np.square(i-3)/np.square(sigma1)+(np.square(j-3)/np.square(sigma2))))/(2*math.pi*sigma1*sigma2)
        sum=sum+gaussian[i,j]
gaussian=gaussian/sum
def rgb2gray(rgb):  #rgb图像转换为灰度图像
    return np.dot(rgb[...,:3],[0.299,0.587,0.114])
#高斯滤波
gray=rgb2gray(img)
W,H=gray.shape
new_gray=np.zeros([W-5,H-5])
for i in range(W-5):
    for j in range(H-5):
        #与高斯矩阵卷积实现滤波
        new_gray[i,j]=np.sum(gray[i:i+5,j:j+5]*gaussian)
#通过求梯幅值使图像增强
W1,H1=new_gray.shape
dx=np.zeros([W1-1,H1-1])
dy=np.zeros([W1-1,H1-1])
d=np.zeros([W1-1,H1-1])
for i in range(W1-1):
    for j in range(H1-1):
        dx[i,j]=new_gray[i,j+1]-new_gray[i,j]
        dy[i,j]=new_gray[i+1,j]-new_gray[i,j]
        #图像梯度幅值作为图像强度值
        d[i,j]=np.sqrt(np.square(dx[i,j])+np.square(dy[i,j]))
#非极大值抑制NMS
W2,H2=d.shape
NMS=np.copy(d)
NMS[0,:]=NMS[W2-1,:]=NMS[:,0]=NMS[:,H2-1]=0
for i in range(1,W2-1):
    for j in range(1,H2-1):
        if d[i,j]==0:
            NMS[i,j]=0
        else:
            gradX=dx[i,j]
            gradY=dx[i,j]
            gradTemp=d[i,j]
            #如果Y方向梯度幅值较大
            if np.abs(gradY)>np.abs(gradX):
                weight=np.abs(gradX)/np.abs(gradY)
                grad2=d[i-1,j]
                grad4=d[i+1,j]
                #如果x,y方向梯度幅值的符号相同
                if gradX*gradY>0:
                    grad1=d[i-1,j-1]
                    grad3=d[i+1,j+1]
                #如果x,y方向梯度幅值的符号相反
                else:
                    grad1=d[i-1,j+1]
                    grad3=d[i+1,j-1]
            else:
                weight=np.abs(gradY)/np.abs(gradX)
                grad2=d[i,j-1]
                grad4=d[i,j+1]
                if gradX*gradY>0:
                    grad1=d[i+1,j-1]
                    grad3=d[i+1,j+1]
                else:
                    grad1=d[i-1,j-1]
                    grad3=d[i+1,j+1]
            gradTemp1=weight*grad1+(1-weight)*grad2
            gradTemp2=weight*grad3+(1-weight)*grad4
            if gradTemp>=gradTemp1 and gradTemp>=gradTemp2:
                NMS[i,j]=gradTemp
            else:
                NMS[i,j]=0
W3,H3=NMS.shape
DT=np.zeros([W3,H3])
#定义高低阈值TH,TL
TL=0.2*np.max(NMS)
TH=0.3*np.max(NMS)
for i in range(1,W3-1):
    for j in range(1,H3-1):
        if (NMS[i,j]<TL):
            DT[i,j]=0
        elif (NMS[i,j]>TH):
            DT[i,j]=1
        elif ((NMS[i-1,j-1:j+1]<TH).any() or (NMS[i+1,j-1:j+1]).any() or (NMS[i,[j-1,j+1]]<TH).any()):
            DT[i,j]=1
plt.subplot(2,2,1)
plt.imshow(new_gray,cmap=cm.gray) #原始图像
plt.axis('off')
plt.subplot(2,2,2)
plt.imshow(d,cmap=cm.gray)  #高斯滤波图像
plt.axis('off')
plt.subplot(2,2,3)
plt.imshow(NMS,cmap=cm.gray) #非极大值抑制图像
plt.axis('off')
plt.subplot(2,2,4)
plt.imshow(DT,cmap=cm.gray)  #双阈值检测边缘图像
plt.axis('off')
plt.show()



OpenCV中也封装了Canny图形边缘检测函数,其函数原型:

cv2.Canny(image,threshold1,threshold2[,edges[,apertureSize[,L2gradient]]])

参数说明如下:

(1).image:需要处理的原图,该图像必须为单通道的灰度图像。

(2).threshold1:阈值1。

(3).threshold2:阈值2。(较大的阈值,用于检测明显的边缘,但是会出现断断续续的,所以需要使用threshold2进行连接)。

(4).edges:函数返回一幅二值图像(黑白),其中包含检测出来的边缘。

(5).apertureSize:Sobel算子。

(6).L2gradient:一个布尔值,如果为True,则使用更精确的L2范数进行计算(即两个方向导数的平方和再开方);如果为False,则使用L1范数进行计算(直接将两个方向导数的绝对值)。

基于opencv的Canny函数的图像边缘检测示例代码:


#OPenCV的canny算子
import cv2
import numpy as np
#Canny只能处理灰度图像
img=cv2.imread('D:\Image\\two.jpg',0)
#通过高斯平滑处理对原图像进行降噪
img=cv2.GaussianBlur(img,(3,3),0)
canny=cv2.Canny(img,50,150) #apertureSize默认为3
cv2.imshow('Canny边缘检测',canny)
cv2.waitKey(0)
cv2.destroyAllWindows()


相关文章
|
3月前
|
机器学习/深度学习 算法 TensorFlow
动物识别系统Python+卷积神经网络算法+TensorFlow+人工智能+图像识别+计算机毕业设计项目
动物识别系统。本项目以Python作为主要编程语言,并基于TensorFlow搭建ResNet50卷积神经网络算法模型,通过收集4种常见的动物图像数据集(猫、狗、鸡、马)然后进行模型训练,得到一个识别精度较高的模型文件,然后保存为本地格式的H5格式文件。再基于Django开发Web网页端操作界面,实现用户上传一张动物图片,识别其名称。
117 1
动物识别系统Python+卷积神经网络算法+TensorFlow+人工智能+图像识别+计算机毕业设计项目
|
22天前
|
机器学习/深度学习 人工智能 算法
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
宠物识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了37种常见的猫狗宠物种类数据集【'阿比西尼亚猫(Abyssinian)', '孟加拉猫(Bengal)', '暹罗猫(Birman)', '孟买猫(Bombay)', '英国短毛猫(British Shorthair)', '埃及猫(Egyptian Mau)', '缅因猫(Maine Coon)', '波斯猫(Persian)', '布偶猫(Ragdoll)', '俄罗斯蓝猫(Russian Blue)', '暹罗猫(Siamese)', '斯芬克斯猫(Sphynx)', '美国斗牛犬
122 29
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
|
6月前
|
机器学习/深度学习 人工智能 算法
海洋生物识别系统+图像识别+Python+人工智能课设+深度学习+卷积神经网络算法+TensorFlow
海洋生物识别系统。以Python作为主要编程语言,通过TensorFlow搭建ResNet50卷积神经网络算法,通过对22种常见的海洋生物('蛤蜊', '珊瑚', '螃蟹', '海豚', '鳗鱼', '水母', '龙虾', '海蛞蝓', '章鱼', '水獭', '企鹅', '河豚', '魔鬼鱼', '海胆', '海马', '海豹', '鲨鱼', '虾', '鱿鱼', '海星', '海龟', '鲸鱼')数据集进行训练,得到一个识别精度较高的模型文件,然后使用Django开发一个Web网页平台操作界面,实现用户上传一张海洋生物图片识别其名称。
217 7
海洋生物识别系统+图像识别+Python+人工智能课设+深度学习+卷积神经网络算法+TensorFlow
|
6月前
|
机器学习/深度学习 人工智能 算法
【乐器识别系统】图像识别+人工智能+深度学习+Python+TensorFlow+卷积神经网络+模型训练
乐器识别系统。使用Python为主要编程语言,基于人工智能框架库TensorFlow搭建ResNet50卷积神经网络算法,通过对30种乐器('迪吉里杜管', '铃鼓', '木琴', '手风琴', '阿尔卑斯号角', '风笛', '班卓琴', '邦戈鼓', '卡萨巴', '响板', '单簧管', '古钢琴', '手风琴(六角形)', '鼓', '扬琴', '长笛', '刮瓜', '吉他', '口琴', '竖琴', '沙槌', '陶笛', '钢琴', '萨克斯管', '锡塔尔琴', '钢鼓', '长号', '小号', '大号', '小提琴')的图像数据集进行训练,得到一个训练精度较高的模型,并将其
92 0
【乐器识别系统】图像识别+人工智能+深度学习+Python+TensorFlow+卷积神经网络+模型训练
|
3月前
|
机器学习/深度学习 人工智能 算法
植物病害识别系统Python+卷积神经网络算法+图像识别+人工智能项目+深度学习项目+计算机课设项目+Django网页界面
植物病害识别系统。本系统使用Python作为主要编程语言,通过收集水稻常见的四种叶片病害图片('细菌性叶枯病', '稻瘟病', '褐斑病', '稻瘟条纹病毒病')作为后面模型训练用到的数据集。然后使用TensorFlow搭建卷积神经网络算法模型,并进行多轮迭代训练,最后得到一个识别精度较高的算法模型,然后将其保存为h5格式的本地模型文件。再使用Django搭建Web网页平台操作界面,实现用户上传一张测试图片识别其名称。
145 22
植物病害识别系统Python+卷积神经网络算法+图像识别+人工智能项目+深度学习项目+计算机课设项目+Django网页界面
|
3月前
|
机器学习/深度学习 人工智能 算法
鸟类识别系统Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+ResNet50算法模型+图像识别
鸟类识别系统。本系统采用Python作为主要开发语言,通过使用加利福利亚大学开源的200种鸟类图像作为数据集。使用TensorFlow搭建ResNet50卷积神经网络算法模型,然后进行模型的迭代训练,得到一个识别精度较高的模型,然后在保存为本地的H5格式文件。在使用Django开发Web网页端操作界面,实现用户上传一张鸟类图像,识别其名称。
124 12
鸟类识别系统Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+ResNet50算法模型+图像识别
|
4月前
|
机器学习/深度学习 人工智能 算法
【眼疾病识别】图像识别+深度学习技术+人工智能+卷积神经网络算法+计算机课设+Python+TensorFlow
眼疾识别系统,使用Python作为主要编程语言进行开发,基于深度学习等技术使用TensorFlow搭建ResNet50卷积神经网络算法,通过对眼疾图片4种数据集进行训练('白内障', '糖尿病性视网膜病变', '青光眼', '正常'),最终得到一个识别精确度较高的模型。然后使用Django框架开发Web网页端可视化操作界面,实现用户上传一张眼疾图片识别其名称。
102 9
【眼疾病识别】图像识别+深度学习技术+人工智能+卷积神经网络算法+计算机课设+Python+TensorFlow
|
3月前
|
机器学习/深度学习 移动开发 TensorFlow
随着人工智能技术的迅速发展,图像识别在各个领域的应用越来越广泛
我们开发了一款基于Python和TensorFlow的果蔬识别系统,利用CNN模型高效识别12种常见果蔬,提升饮食健康与食材管理。该系统通过图像预处理与增强提高模型鲁棒性,并借助Django搭建Web平台,提供便捷的图片上传识别功能。项目不仅展示了深度学习在图像识别中的潜力,还为相关研究奠定了基础。更多详情及演示视频请访问:[项目链接](https://www.yuque.com/ziwu/yygu3z/pnrng41h0sg5f5tf)。
86 0
|
4月前
|
机器学习/深度学习 人工智能 自动驾驶
【人工智能】图像识别:计算机视觉领域的识别与处理资源概览
在快速发展的科技时代,计算机视觉(Computer Vision, CV)作为人工智能的一个重要分支,正深刻改变着我们的生活与工作方式。图像识别作为计算机视觉的核心任务之一,旨在让机器能够理解和解释数字图像或视频中的内容,进而执行诸如目标检测、图像分类、场景理解等复杂任务。本文将深入探讨图像识别领域的关键技术、常用数据集、开源框架及工具资源,为从事或关注该领域的专业人士提供一份全面的指南。
120 2
|
5月前
|
机器学习/深度学习 人工智能 算法
【服装识别系统】图像识别+Python+人工智能+深度学习+算法模型+TensorFlow
服装识别系统,本系统作为图像识别方面的一个典型应用,使用Python作为主要编程语言,并通过TensorFlow搭建ResNet50卷积神经算法网络模型,通过对18种不同的服装('黑色连衣裙', '黑色衬衫', '黑色鞋子', '黑色短裤', '蓝色连衣裙', '蓝色衬衫', '蓝色鞋子', '蓝色短裤', '棕色鞋子', '棕色短裤', '绿色衬衫', '绿色鞋子', '绿色短裤', '红色连衣裙', '红色鞋子', '白色连衣裙', '白色鞋子', '白色短裤')数据集进行训练,最后得到一个识别精度较高的H5格式模型文件,然后基于Django搭建Web网页端可视化操作界面,实现用户在界面中
144 1
【服装识别系统】图像识别+Python+人工智能+深度学习+算法模型+TensorFlow