用Python在25行以下代码实现人脸识别

简介: 用Python在25行以下代码实现人脸识别

阅读本文需要4.5分钟


在本文中,我们将看到一种使用Python和开放源码库开始人脸识别的非常简单的方法。


OpenCV


OpenCV是最流行的计算机视觉库。最初是用C/C++编写的,现在它提供了Python的API。

OpenCV使用机器学习算法来搜索图片中的面孔。因为脸是如此复杂,没有一个简单的测试可以告诉你它是否找到了一张脸。相反,有成千上万的小模式和特征必须匹配。这些算法将识别人脸的任务分解为数千个较小的、适合大小的任务,每个任务都很容易解决。这些任务也称为分类器.

对于脸这样的东西,可能有6000个或更多的分类器,所有这些都必须匹配才能检测到人脸(当然,在错误限制范围内)。但问题就在这里:对于人脸检测,算法从图片的左上角开始,向下移动到小块数据中,查看每个块,不断地问:“这是一张脸吗?…这是张脸吗?…这是张脸吗?“由于每个块有6000或更多的测试,您可能需要进行数百万的计算,这将使您的计算机陷入瘫痪。

为了避免这种情况,OpenCV使用级联。

就像一系列瀑布一样,OpenCV级联将人脸检测问题分解为多个阶段。对于每个块,它做了一个非常粗糙和快速的测试。如果通过,它会进行稍微详细的测试,依此类推。该算法可能有30到50个这样的阶段或级联,只有当所有阶段都通过时,它才能检测到一张脸。

它的优点是,大多数图片在最初的几个阶段会返回一个负值,这意味着算法不会浪费时间来测试它上的所有6000个特性。现在可以实时进行人脸检测,不用花上几个小时。


实践中的级联


虽然这个理论听起来很复杂,但在实践中却相当容易。级联本身只是一堆XML文件,其中包含用于检测对象的OpenCV数据。你用你想要的级联初始化你的代码,然后它为你做工作。

由于人脸检测是如此常见的情况,OpenCV附带了许多内置的级联,用于检测从脸到眼睛、手到腿的所有东西。对于非人类的事物,甚至还有级联。例如,如果你经营一家香蕉店,想追踪偷香蕉的人,为此造了一个!


安装OpenCV


首先,您需要找到正确的安装文件你的操作系统.

我发现安装OpenCV是这项任务中最困难的部分。如果出现奇怪的无法解释的错误,可能是由于库冲突、32/64位差异等原因造成的。我发现只使用Linux虚拟机并从头安装OpenCV是最简单的。

安装完成后,可以通过触发Python会话并键入:


>>> import cv2
>>>

>>>

如果你没有任何错误,你可以继续下一部分。

理解方法

让我们来分析一下实际的代码,可以从这网站https://github.com/shantnu/FaceDetect/下载这些代码。获取face_detect.py脚本、abba.png pic和haarcascade_frontalface_default.xml


# Get user supplied values
imagePath = sys.argv[1]
cascPath = sys.argv[2]

首先将图像和串级名称作为命令行参数传递。我们将使用ABBA图像以及默认级联来检测OpenCV提供的面孔。


# Create the haar cascade
faceCascade = cv2.CascadeClassifier(cascPath)

现在我们创建这个级联并用我们的脸级联初始化它。这会将脸级联加载到内存中,这样就可以使用了。记住,级联只是一个XML文件,它包含用于检测面孔的数据。


# Read the image
image = cv2.imread(imagePath)
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

在这里,我们读取图像并将其转换为灰度。OpenCV中的许多操作都是以灰度形式完成的。

    # Detect faces in the image
    faces = faceCascade.detectMultiScale(
        gray,
        scaleFactor=1.1,
        minNeighbors=5,
        minSize=(30, 30),
        flags = cv2.cv.CV_HAAR_SCALE_IMAGE
    )

    这个函数检测实际的外观,是代码的关键部分,所以让我们来看看下面的选项:

    1. 这个detectMultiScale功能是一个检测对象的通用函数。因为我们叫它在面部级联,这就是它检测到的。
    2. 第一个选项是灰度图像。
    3. 第二个是scaleFactor...因为有些脸可能离摄像机更近,所以看起来比后面的脸要大。比例因子对此进行补偿。
    4. 该检测算法使用移动窗口检测物体。minNeighbors定义在当前对象声明找到的脸之前,在当前对象附近检测到多少个对象。minSize同时,给出每个窗口的大小。

    注:我取了这些字段常用的值。在现实生活中,您将尝试不同的窗口大小、比例因子等值,直到找到最适合您的值为止。

    该函数返回一个矩形列表,其中它认为它找到了一张脸。接下来,我们将循环到它认为它发现了什么东西的地方。


    print "Found {0} faces!".format(len(faces))
    # Draw a rectangle around the faces
    for (x, y, w, h) in faces:
        cv2.rectangle(image, (x, y), (x+w, y+h), (0, 255, 0), 2)

    此函数返回4个值:xy矩形的位置,以及矩形的宽度和高度(w , h).

    使用这些值绘制一个矩形。rectangle()功能。

      cv2.imshow("Faces found", image)
      cv2.waitKey(0)

      最后,我们显示图像,等待用户按下键。


      检查结果


      让我们根据ABBA的照片进行测试:


      $ python face_detect.py abba.png haarcascade_frontalface_default.xml



      这起作用了。再来一张照片怎么样:



      那个…不是一张脸。我们再试一次。我更改了参数,发现设置scaleFactor把错误的脸去掉了。


      What?


      第一张照片是用高质量的相机拍的。第二个似乎是从远处拿来的,可能是用手机拍的。这就是为什么scaleFactor必须修改。正如我说过的,你必须在逐个案例的基础上设置算法,以避免误报。

      但是,请注意,由于这是基于机器学习,结果永远不会是100%的准确性。在大多数情况下,您将获得足够好的结果,但有时算法会将不正确的对象识别为Faces。

      最后的代码可以找到。https://github.com/shantnu/FaceDetect

      相关文章
      |
      10月前
      |
      存储 算法 调度
      【复现】【遗传算法】考虑储能和可再生能源消纳责任制的售电公司购售电策略(Python代码实现)
      【复现】【遗传算法】考虑储能和可再生能源消纳责任制的售电公司购售电策略(Python代码实现)
      445 26
      |
      10月前
      |
      测试技术 开发者 Python
      Python单元测试入门:3个核心断言方法,帮你快速定位代码bug
      本文介绍Python单元测试基础,详解`unittest`框架中的三大核心断言方法:`assertEqual`验证值相等,`assertTrue`和`assertFalse`判断条件真假。通过实例演示其用法,帮助开发者自动化检测代码逻辑,提升测试效率与可靠性。
      607 1
      |
      10月前
      |
      机器学习/深度学习 算法 调度
      基于多动作深度强化学习的柔性车间调度研究(Python代码实现)
      基于多动作深度强化学习的柔性车间调度研究(Python代码实现)
      424 1
      |
      9月前
      |
      测试技术 Python
      Python装饰器:为你的代码施展“魔法”
      Python装饰器:为你的代码施展“魔法”
      389 100
      |
      9月前
      |
      开发者 Python
      Python列表推导式:一行代码的艺术与力量
      Python列表推导式:一行代码的艺术与力量
      589 95
      |
      10月前
      |
      Python
      Python的简洁之道:5个让代码更优雅的技巧
      Python的简洁之道:5个让代码更优雅的技巧
      395 104
      |
      10月前
      |
      开发者 Python
      Python神技:用列表推导式让你的代码更优雅
      Python神技:用列表推导式让你的代码更优雅
      690 99
      |
      10月前
      |
      IDE 开发工具 开发者
      Python类型注解:提升代码可读性与健壮性
      Python类型注解:提升代码可读性与健壮性
      451 102
      |
      9月前
      |
      缓存 Python
      Python装饰器:为你的代码施展“魔法
      Python装饰器:为你的代码施展“魔法
      503 88
      |
      9月前
      |
      监控 机器人 编译器
      如何将python代码打包成exe文件---PyInstaller打包之神
      PyInstaller可将Python程序打包为独立可执行文件,无需用户安装Python环境。它自动分析代码依赖,整合解释器、库及资源,支持一键生成exe,方便分发。使用pip安装后,通过简单命令即可完成打包,适合各类项目部署。
      1473 68

      推荐镜像

      更多