《人脸识别原理及算法——动态人脸识别系统研究》—第3章3.4节利用数学算子进行探测-阿里云开发者社区

开发者社区> 人工智能> 正文

《人脸识别原理及算法——动态人脸识别系统研究》—第3章3.4节利用数学算子进行探测

简介:

本节书摘来自异步社区《人脸识别原理及算法——动态人脸识别系统研究》一书中的第3章3.4节利用数学算子进行探测,作者 沈理 , 刘翼光 , 熊志勇,更多章节内容可以访问云栖社区“异步社区”公众号查看。

3.4 利用数学算子进行探测
人脸识别原理及算法——动态人脸识别系统研究
上述两种特征探测方法,或多或少地都利用了特征的语义信息,所要探测的特征的物理意义都很明确,如眼睛、鼻子、嘴等,而California大学Santa Barbara分校的Manjunath、Shekhar和Von der Malsburg等人提出的方法是针对图像本身固有的结构特征,如纹理结构、边缘、对称结构等,利用图像的小波变换来进行特征提取[93]。

3.4.1 特征探测模型
Manjunath、Shekhar和von der Malsburg等人[55, 93]认为,视觉皮层的细胞可以分成3类:简单的、复杂的以及超复杂的。其中超复杂视觉细胞具有端抑制特性,亦即细胞的接受域能够响应较短的线段以及线段的末端,并且当线段的长度增加时,响应程度减小。由此,可以根据视觉细胞所具有的端抑制特性,利用相应的小波变换函数来提取图像的局部结构特征。Manjunath等人使用Gabor函数来提取图像的结构特征。所用公式如下:
screenshot
(3-14)

式中,λ为空间域的纵横比,为了简单起见,λ的大小通常设为1;θ为响应方向,其取值范围为left[ {0,pi } right],并将其分成N等份。又Gabor函数是一尺度函数,设其尺度参数为α,实际所取的尺度离散化为alpha ^j ,j in Z。由此得到的Gabor函数族为
screenshot

(3-15)

所用的Gabor函数变换为
screenshot
(3-16)

为了模拟视觉细胞的端抑制特性,令Q_{i,j} (x,y,theta )表示Gabor变换在尺度为i,j时所探测到的图像特征区域的交互作用部分,定义为
screenshot
(3-17)
由(3-17)可得到图像的局部特征,所用公式为
screenshot
(3-18)

式中,Q_{i,j} (x',y') = mathop {max }limits_theta Q_{i,j} (x',y',theta );N_{xy} 表示点(x,y)的邻近点集。

图3-4中所示为探测到的特征区域点。
screenshot

3.4.2 方法的优缺点
一直以来,利用数学变换将要研究的信号从一个空间映射到另一个空间往往更能揭示信号所反映的本质。如常用的傅里叶变换,拉普拉斯变换,Gabor变换以及小波变换等。使用这些变换,相应的可以得到人脸图像的数学特征,对于识别而言,具有如下优点。

通用性较强,受光照、尺度、形变等影响小。因为最终模型的比较是基于图像变换后的特征参数,而小波变换本身具有提取局部特征的能力,而且小波变换的多尺度、多级别特性,可以很好地规避图像本身的尺度不一、旋转形变以及光照带来的影响,最大限度地消除这些干扰因素。
不需要先验知识。不需要事先建立模型,直接对整个图像进行处理,在很大程度上消除了由于建模者缺乏经验所造成的影响。
当然,使用数学变换需要对整个图像进行处理,对于尺度大的图像其计算量是相当大的;而且,有时为了得到精确匹配,还需要提供几组变换参数来进行特征提取,这些都带来计算量方面的压力,因此,该方法缺点如下:计算量较大。由于要对整个图像进行数学变换,而且不同的变换参数需要进行不同的变换,因此计算量是相当大的。不过随着当前计算机性能的提高、计算成本大幅度的减小以及更好计算方法的提出,该方法正越来越受到研究人员的青睐。

本文仅用于学习和交流目的,不代表异步社区观点。非商业转载请注明作译者、出处,并保留本文的原始链接。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
人工智能
使用钉钉扫一扫加入圈子
+ 订阅

了解行业+人工智能最先进的技术和实践,参与行业+人工智能实践项目

其他文章