前言
前篇博文我们讲解了人脸检测的基本操作。但人脸检测只是人脸识别领域的一个非常小的分支。一般情况下,使用人脸识别,都是比对对应的人脸的判断是否是本人,或者是否是某个人。所以,我们需要进一步学习人脸识别的相关知识。
在OpenCV中,它提供了3种人脸识别的方法,分别为:LBPH方法,EigenFishfaces方法,Fisherfaces方法。本篇,将讲解LBPH方法进行人脸识别操作。
LBPH方法的基本原理
LBPH(Local Binary Patterns Histogram,局部二值模式直方图)所使用的模型基于LBP(局部二值模式)算法。LBP最早是被作为一种有效的纹理描述算子提出的,由于在表述图像局部纹理特征上效果明显,而得到广泛应用。
LBP算法的基本原理是,将像素点A的值与其最邻近的8个像素点的值逐一比较:
如果A的像素值大于其临近点的像素值,则得到0
如果A的像素值小于其临近点的像素值,则得到1
最后,将像素点A与其周围8个像素点比较所得到的0、1值连接起来,得到一个8位的二进制序列,将该二进制序列转换为十进制数作为点A的LBP值。
LBPH实现步骤
在OpenCV中,它提供函数cv2.face.LBPHFaceRecognizer_create()生成LBPH识别器实例模型,然后应用cv2.face_FaceRecognizer.train()函数完成训练,最后用cv2.face_FaceRecognizer.predict()函数完成人脸识别。
是不是与前文数字识别博文的处理步骤差不多?下面,我们来了解这3个函数的定义:
def LBPHFaceRecognizer_create(radius=None, neighbors=None, grid_x=None, grid_y=None, threshold=None):
radius:半径值,默认1
neighbors:领域点的个数,默认采用8领域,根据需要可以计算更多的领域点
grid_x:将LBP特征图像划分为一个个单元格时,每个单元格在水平方向上的像素个数。默认值8,即将LBP特征图像在行方向上以8个像素为单位分组
grid_y:将LBP特征图像划分为一个个单元格时,每个单元格在垂直方向上的像素个数。默认值8,即将LBP特征图像在列方向上以8个像素为单位分组
threshold:预测时所使用的阈值。如果大于该阈值,就认为没有识别到任何目标对象
cv2.face_FaceRecognizer.train(self, src, labels)
src:训练图像,相当于前面识别图像的训练集,用来学习的人脸图像
labels:标签,人脸图像所对应的标签
cv2.face_FaceRecognizer.predict(self, src)
src:需要识别的人脸图像
返回值有两个,一个返回前面训练集匹配的人脸识别的标签label,另一个是用来衡量识别结果与原有模型之间的距离。通常情况下,小于50的值是可以接受的,如果该值大于80则认为差别较大。
实现简单人脸识别
首先,我们需要导入训练的人脸图像,这里我们选取行尸走肉的瑞克与尼根的头像。如下图所示:
待识别的人脸图像为瑞克:
具体的代码如下所示:
import cv2 import numpy as np images = [] images.append(cv2.imread("42_1.jpg", cv2.IMREAD_GRAYSCALE)) images.append(cv2.imread("42_2.jpg", cv2.IMREAD_GRAYSCALE)) labels = [0, 1] recognizer = cv2.face.LBPHFaceRecognizer_create() recognizer.train(images,np.array(labels)) predict_image=cv2.imread('42_3.jpg', cv2.IMREAD_GRAYSCALE) label,confidence=recognizer.predict(predict_image) if label==0: print("匹配的人脸为尼根") elif label==1: print("匹配的人脸为瑞克") print("confidence=",confidence)
运行之后,控制台输出结果如下:
从输出结果来看,标签值为“1”,置信区间为66,这说明3图被识别为瑞克对应的人脸图像。不过,数据量越大越准确,比如你可以在训练集放置两个瑞克,两个尼根,同步的标签labels也要一一对应。