《人脸识别原理及算法——动态人脸识别系统研究》—第3章3.4节利用数学算子进行探测

简介:

本节书摘来自异步社区《人脸识别原理及算法——动态人脸识别系统研究》一书中的第3章3.4节利用数学算子进行探测,作者 沈理 , 刘翼光 , 熊志勇,更多章节内容可以访问云栖社区“异步社区”公众号查看。

3.4 利用数学算子进行探测
人脸识别原理及算法——动态人脸识别系统研究
上述两种特征探测方法,或多或少地都利用了特征的语义信息,所要探测的特征的物理意义都很明确,如眼睛、鼻子、嘴等,而California大学Santa Barbara分校的Manjunath、Shekhar和Von der Malsburg等人提出的方法是针对图像本身固有的结构特征,如纹理结构、边缘、对称结构等,利用图像的小波变换来进行特征提取[93]。

3.4.1 特征探测模型
Manjunath、Shekhar和von der Malsburg等人[55, 93]认为,视觉皮层的细胞可以分成3类:简单的、复杂的以及超复杂的。其中超复杂视觉细胞具有端抑制特性,亦即细胞的接受域能够响应较短的线段以及线段的末端,并且当线段的长度增加时,响应程度减小。由此,可以根据视觉细胞所具有的端抑制特性,利用相应的小波变换函数来提取图像的局部结构特征。Manjunath等人使用Gabor函数来提取图像的结构特征。所用公式如下:
screenshot
(3-14)

式中,λ为空间域的纵横比,为了简单起见,λ的大小通常设为1;θ为响应方向,其取值范围为left[ {0,pi } right],并将其分成N等份。又Gabor函数是一尺度函数,设其尺度参数为α,实际所取的尺度离散化为alpha ^j ,j in Z。由此得到的Gabor函数族为
screenshot

(3-15)

所用的Gabor函数变换为
screenshot
(3-16)

为了模拟视觉细胞的端抑制特性,令Q_{i,j} (x,y,theta )表示Gabor变换在尺度为i,j时所探测到的图像特征区域的交互作用部分,定义为
screenshot
(3-17)
由(3-17)可得到图像的局部特征,所用公式为
screenshot
(3-18)

式中,Q_{i,j} (x',y') = mathop {max }limits_theta Q_{i,j} (x',y',theta );N_{xy} 表示点(x,y)的邻近点集。

图3-4中所示为探测到的特征区域点。
screenshot

3.4.2 方法的优缺点
一直以来,利用数学变换将要研究的信号从一个空间映射到另一个空间往往更能揭示信号所反映的本质。如常用的傅里叶变换,拉普拉斯变换,Gabor变换以及小波变换等。使用这些变换,相应的可以得到人脸图像的数学特征,对于识别而言,具有如下优点。

通用性较强,受光照、尺度、形变等影响小。因为最终模型的比较是基于图像变换后的特征参数,而小波变换本身具有提取局部特征的能力,而且小波变换的多尺度、多级别特性,可以很好地规避图像本身的尺度不一、旋转形变以及光照带来的影响,最大限度地消除这些干扰因素。
不需要先验知识。不需要事先建立模型,直接对整个图像进行处理,在很大程度上消除了由于建模者缺乏经验所造成的影响。
当然,使用数学变换需要对整个图像进行处理,对于尺度大的图像其计算量是相当大的;而且,有时为了得到精确匹配,还需要提供几组变换参数来进行特征提取,这些都带来计算量方面的压力,因此,该方法缺点如下:计算量较大。由于要对整个图像进行数学变换,而且不同的变换参数需要进行不同的变换,因此计算量是相当大的。不过随着当前计算机性能的提高、计算成本大幅度的减小以及更好计算方法的提出,该方法正越来越受到研究人员的青睐。

本文仅用于学习和交流目的,不代表异步社区观点。非商业转载请注明作译者、出处,并保留本文的原始链接。

相关文章
|
1月前
|
存储 安全 算法
|
2天前
|
搜索推荐 算法 前端开发
计算机Java项目|基于协同过滤算法的体育商品推荐系统
计算机Java项目|基于协同过滤算法的体育商品推荐系统
|
3天前
|
机器学习/深度学习 传感器 算法
基于Mediapipe深度学习算法的手势识别系统【含python源码+PyqtUI界面+原理详解】-python手势识别 深度学习实战项目
基于Mediapipe深度学习算法的手势识别系统【含python源码+PyqtUI界面+原理详解】-python手势识别 深度学习实战项目
|
5天前
|
算法
使用k-近邻算法构建手写识别系统(kNN)
使用k-近邻算法构建手写识别系统(kNN)
18 9
|
7天前
|
算法 数据挖掘 定位技术
算法必备数学基础:图论方法由浅入深实践与应用
算法必备数学基础:图论方法由浅入深实践与应用
|
13天前
|
机器学习/深度学习 算法 TensorFlow
【图像识别】谷物识别系统Python+人工智能深度学习+TensorFlow+卷积算法网络模型+图像识别
谷物识别系统,本系统使用Python作为主要编程语言,通过TensorFlow搭建ResNet50卷积神经算法网络模型,通过对11种谷物图片数据集('大米', '小米', '燕麦', '玉米渣', '红豆', '绿豆', '花生仁', '荞麦', '黄豆', '黑米', '黑豆')进行训练,得到一个进度较高的H5格式的模型文件。然后使用Django框架搭建了一个Web网页端可视化操作界面。实现用户上传一张图片识别其名称。
46 0
【图像识别】谷物识别系统Python+人工智能深度学习+TensorFlow+卷积算法网络模型+图像识别
|
17天前
|
机器学习/深度学习 人工智能 算法
中草药识别系统Python+深度学习人工智能+TensorFlow+卷积神经网络算法模型
中草药识别系统Python+深度学习人工智能+TensorFlow+卷积神经网络算法模型
55 0
|
27天前
|
机器学习/深度学习 人工智能 算法
食物识别系统Python+深度学习人工智能+TensorFlow+卷积神经网络算法模型
食物识别系统采用TensorFlow的ResNet50模型,训练了包含11类食物的数据集,生成高精度H5模型。系统整合Django框架,提供网页平台,用户可上传图片进行食物识别。效果图片展示成功识别各类食物。[查看演示视频、代码及安装指南](https://www.yuque.com/ziwu/yygu3z/yhd6a7vai4o9iuys?singleDoc#)。项目利用深度学习的卷积神经网络(CNN),其局部感受野和权重共享机制适于图像识别,广泛应用于医疗图像分析等领域。示例代码展示了一个使用TensorFlow训练的简单CNN模型,用于MNIST手写数字识别。
54 3
|
1月前
|
算法
【数据结构与算法 11,高并发系统基础篇
【数据结构与算法 11,高并发系统基础篇
|
1月前
|
算法 网络协议 数据建模
【计算机网络】—— IP协议及动态路由算法(下)
【计算机网络】—— IP协议及动态路由算法(下)
23 0