《人脸识别原理及算法——动态人脸识别系统研究》—1章1.4节人脸图像识别主要研究的问题

本文涉及的产品
图像搜索,7款服务类型 1个月
简介:

本节书摘来自异步社区《人脸识别原理及算法——动态人脸识别系统研究》一书中的1章1.4节人脸图像识别主要研究的问题,作者 沈理 , 刘翼光 , 熊志勇,更多章节内容可以访问云栖社区“异步社区”公众号查看。

1.4 人脸图像识别主要研究的问题
人脸识别原理及算法——动态人脸识别系统研究
从人脸图像识别的过程来看,建立人脸模型是一个比较重要的环节,而在这个环节中提取合适的特征采样值又是比较关键的。不同的识别方法所提取的特征值是不一样的,提取方法也是不一样的。但模型特征的最终表现形式都是类似的,以向量的形式表示。

人脸图像识别的难度从其图像样本的易受干扰程度也可体现出来,不同的光照、是否有背景以及图像是否倾斜、是否有旋转等都会对图像的样本产生干扰,从而对图像识别结果造成影响。

1.4.1 数据采样
因为人脸是三维目标物体,很难用简单的模型来加以描述,所以一般将其投影到二维空间,得到二维的人脸图像,并用于识别。而对于同一个物体,从不同角度得到的投影图像各不相同,有的甚至相差较大,因此识别时,可能将来源于同一个目标物体的不同投影图像识别为不相同。

定义1.1: 设训练样本集合为R,取任一目标S_i ,对S_i进行某些操作Gamma ,由此得到的模式集合为L_i = left{ {o_{i1} ,o_{i2} , cdots ,o_{in} } right} ,则对应R,可得到样本库为K = left{ {o_{11} , cdots ,o_{1n} ,o_{21} , cdots ,o_{2n} , cdots ,o_{i1} , cdots ,o_{in} , cdots ,} right};对于某一待识目标M,若M与K中任一元素o_{ij} 相等或最近似,则认为M = L_i,也即M = S_i;否则,拒识。

在上述定义中,如果L_i 为单元素集合(n=1),即每个训练样本在库中有一个数据,则称之为单样本数据识别;否则,称为多样本数据识别。

对于某个待识别目标,其在库中对应的样本个数越多,则被识别出的可能性越大;反之,则越小。因此,在识别精确度要求高的场合,应该采用多样本数据,并设计相应的识别算法进行识别;但样本数据增加了,对存储空间的要求也就相应增加。另外在某些场合,有时对于每个训练目标只能提供一个样本数据,则这时应该考虑在单样本数据的情况下,如何设计一个较通用的识别算法。

一般进行人脸图像识别的过程是这样的:首先要建立一个训练样本库,对于每个训练样本在库中都有一幅或多幅人脸图像数据,识别时,得到待识目标的相应数据,与库中各样本数据进行比较,如能够得到合适的匹配,则认为识别出;否则,拒识,并将待识目标的相应数据加入样本库中。为了得到一个通用的人脸图像识别系统,一般都基于单样本数据情况。

1.4.2 干扰因素
除了样本数据不足会给识别带来一定的困难外,一些外在的干扰也会影响识别的精度。

(1)图像质量

对于拍摄清晰的人脸图像,可从中准确地分辨出人脸各部分的结构信息及纹理信息,有利于人脸图像特征的提取以及提高识别率;反之,如图像质量较差,将会给识别带来一定的困难,有时需要先进行图像的增强处理以及平滑处理。

(2)背景

人类能够在各种环境下识别某些特定的目标,可以认为人类具有将目标从背景中提取出来进行识别的能力,而不是只能在某一特定环境下识别目标。但背景却会对机器识别产生不利影响,因为要从一幅图像中分辨出背景与目标本身也是一个识别任务。如果背景较简单,则目标提取相对容易些;否则,很可能提取不出目标,使得后续的识别很难进行。对于一幅人脸图像而言,背景的存在是必然的,因此必须考虑背景的影响。

(3)光照

光照对于视觉的影响是很大的,即使对于人类,也会由于光线太暗而出现误识。反映到人脸图像的识别上,光照可以影响目标图像的结构,使得目标的轮廓、纹理都会出现偏差;对于同一个人,在不同光照下得到的人脸图像也会不同。因此,对于一个通用性较强的人脸图像识别系统,光照是一个要考虑的因素。

(4)目标的旋转

在进行拍摄时,人的头部会不自主地做些转动,一般可归结为两类旋转,一类为深度旋转,另一类为平面旋转(也可称为平面倾斜)。这两类旋转,尤其是前者,给人脸图像的识别带来很大难度。

(5)尺度

对于人类而言,当一个目标在远处出现时,因其较小,可能识别不出,随着目标的靠近,目标逐渐放大,变得清晰,人类能够准确地将其识别出来;另一方面,如果眼睛距离目标太近,目标过于放大,也可能识别不出。同样,对于人脸图像的识别而言,图像中目标的尺度也必须在一定的范围内,目标太小或太大都将给识别带来困难。

(6)人脸的表情

指纹成像时不会因为带有表情而给识别带来困难,而人脸是具有表情的,并且每次成像时,表情都不会完全一样,反映到人脸图像上,对于同一个人,其表情不同,得到的人脸图像也就不同。

(7)其他

其他因素如头饰、眼镜、胡须、化妆等都会给识别带来困难。

本文仅用于学习和交流目的,不代表异步社区观点。非商业转载请注明作译者、出处,并保留本文的原始链接。

相关文章
|
3天前
|
机器学习/深度学习 人工智能 算法
基于Python深度学习的眼疾识别系统实现~人工智能+卷积网络算法
眼疾识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了4种常见的眼疾图像数据集(白内障、糖尿病性视网膜病变、青光眼和正常眼睛) 再使用通过搭建的算法模型对数据集进行训练得到一个识别精度较高的模型,然后保存为为本地h5格式文件。最后使用Django框架搭建了一个Web网页平台可视化操作界面,实现用户上传一张眼疾图片识别其名称。
20 4
基于Python深度学习的眼疾识别系统实现~人工智能+卷积网络算法
|
25天前
|
机器学习/深度学习 人工智能 算法
猫狗宠物识别系统Python+TensorFlow+人工智能+深度学习+卷积网络算法
宠物识别系统使用Python和TensorFlow搭建卷积神经网络,基于37种常见猫狗数据集训练高精度模型,并保存为h5格式。通过Django框架搭建Web平台,用户上传宠物图片即可识别其名称,提供便捷的宠物识别服务。
245 55
|
13天前
|
存储 缓存 监控
局域网屏幕监控系统中的Python数据结构与算法实现
局域网屏幕监控系统用于实时捕获和监控局域网内多台设备的屏幕内容。本文介绍了一种基于Python双端队列(Deque)实现的滑动窗口数据缓存机制,以处理连续的屏幕帧数据流。通过固定长度的窗口,高效增删数据,确保低延迟显示和存储。该算法适用于数据压缩、异常检测等场景,保证系统在高负载下稳定运行。 本文转载自:https://www.vipshare.com
106 66
|
1月前
|
机器学习/深度学习 人工智能 算法
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
宠物识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了37种常见的猫狗宠物种类数据集【'阿比西尼亚猫(Abyssinian)', '孟加拉猫(Bengal)', '暹罗猫(Birman)', '孟买猫(Bombay)', '英国短毛猫(British Shorthair)', '埃及猫(Egyptian Mau)', '缅因猫(Maine Coon)', '波斯猫(Persian)', '布偶猫(Ragdoll)', '俄罗斯蓝猫(Russian Blue)', '暹罗猫(Siamese)', '斯芬克斯猫(Sphynx)', '美国斗牛犬
171 29
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
|
6天前
|
算法
基于爬山法MPPT最大功率跟踪算法的光伏发电系统simulink建模与仿真
本课题基于爬山法MPPT算法,对光伏发电系统进行Simulink建模与仿真。使用MATLAB2022a版本,通过调整光伏电池的工作状态以实现最大功率输出。爬山法通过逐步优化工作点,确保光伏系统在不同条件下均能接近最大功率点。仿真结果显示该方法的有效性,验证了模型的正确性和可行性。
|
9天前
|
监控 算法 JavaScript
基于 Node.js Socket 算法搭建局域网屏幕监控系统
在数字化办公环境中,局域网屏幕监控系统至关重要。基于Node.js的Socket算法实现高效、稳定的实时屏幕数据传输,助力企业保障信息安全、监督工作状态和远程技术支持。通过Socket建立监控端与被监控端的数据桥梁,确保实时画面呈现。实际部署需合理分配带宽并加密传输,确保信息安全。企业在使用时应权衡利弊,遵循法规,保障员工权益。
23 7
|
1月前
|
机器学习/深度学习 缓存 人工智能
【AI系统】QNNPack 算法
QNNPACK是Marat Dukhan开发的量化神经网络计算加速库,专为移动端优化,性能卓越。本文介绍QNNPACK的实现,包括间接卷积算法、内存重排和间接缓冲区等关键技术,有效解决了传统Im2Col+GEMM方法存在的空间消耗大、缓存效率低等问题,显著提升了量化神经网络的计算效率。
40 6
【AI系统】QNNPack 算法
|
1月前
|
存储 人工智能 缓存
【AI系统】Im2Col 算法
Caffe 作为早期的 AI 框架,采用 Im2Col 方法优化卷积计算。Im2Col 将卷积操作转换为矩阵乘法,通过将输入数据重排为连续内存中的矩阵,减少内存访问次数,提高计算效率。该方法首先将输入图像转换为矩阵,然后利用 GEMM 库加速计算,最后将结果转换回原格式。这种方式显著提升了卷积计算的速度,尤其适用于通道数较多的卷积层。
54 5
【AI系统】Im2Col 算法
|
1月前
|
存储 机器学习/深度学习 人工智能
【AI系统】Winograd 算法
本文详细介绍Winograd优化算法,该算法通过增加加法操作来减少乘法操作,从而加速卷积计算。文章首先回顾Im2Col技术和空间组合优化,然后深入讲解Winograd算法原理及其在一维和二维卷积中的应用,最后讨论算法的局限性和实现步骤。Winograd算法在特定卷积参数下表现优异,但其应用范围受限。
38 2
【AI系统】Winograd 算法
|
15天前
|
存储 算法 Python
文件管理系统中基于 Python 语言的二叉树查找算法探秘
在数字化时代,文件管理系统至关重要。本文探讨了二叉树查找算法在文件管理中的应用,并通过Python代码展示了其实现过程。二叉树是一种非线性数据结构,每个节点最多有两个子节点。通过文件名的字典序构建和查找二叉树,能高效地管理和检索文件。相较于顺序查找,二叉树查找每次比较可排除一半子树,极大提升了查找效率,尤其适用于海量文件管理。Python代码示例包括定义节点类、插入和查找函数,展示了如何快速定位目标文件。二叉树查找算法为文件管理系统的优化提供了有效途径。
47 5
下一篇
开通oss服务