详解OpenVINO 模型库中的人脸检测模型

简介: 详解OpenVINO 模型库中的人脸检测模型

人脸检测模型

OpenVINO的模型库中有多个人脸检测模型,这些模型分别支持不同场景与不同分辨率的人脸检测,同时检测精度与速度也不同。下面以OpenVINO2020 R04版本为例来逐一解释模型库中的人脸检测,列表如下:

从列表中可以看出骨干特征网络主要是MobileNetv2与SqueezeNet两种支持实时特征网络,ResNet152是高精度的特征网络,检测头分别支持SSD、FCOS、ATSS。

MobileNetv2版本的模型结构

深度可分离卷积

ResNet网络

残差网络模型在2015年提出,OpenCV从3.3版本开始支持,相关的论文如下:

https://arxiv.org/pdf/1512.03385.pdf

SqueezeNet网络

该模型与MobileNet网络都是支持移动端/端侧可部署的模型,2016提出,相关论文如下:

https://arxiv.org/pdf/1602.07360.pdf

模型结构

检测模型

根据不同的检测头,组合生成不同的对象检测模型,这里三种常见的检测模型:

SSD检测SSD论文中给出的是基于VGG-16作为backbone网络的,替换VGG为MobileNetV2,然后从第12个权重层开始提取特征到第14或者15个权重层,针对anchor预测与类别预测完成回归与分类损失计算,实现对象检测模型训练。



FCOS检测

跟YOLOv1相似是一个anchor-free的网络模型

多了一个中心输出来压制低质量的bounding box输出。

ATSS

ATSS的全称是自适应训练样本选择,

作者首先对比了RetinaNet与FCOS两种对象检测方法,发现对象检测在回归阶段的本质问题是如何选择正负样本,解决样本不平衡性问题,从而提出了一种新的正负样本选择定义方法-自适应训练样本选择(ATSS)。流程如下:

该方法可以获得更好的对象检测精度与mAP,适用RetinaNet与FCOS等对象检测网络。实际实验数据对比:

实验对比:

上面的OpenVINO的人脸检测模型列表中,MobileNetv2 + SSD/FCOS适用于速度优先,不同分辨率的场景,ResNet152 + ATSS是OpenVINO模型库中的精度最高的人脸检测预训练模型。下面我们就通过代码分别测试FCOS与ATSS两种检测模型的检测效果比较,针对同一张测试人脸图像,图示如下:


统一调整阈值为0.25,推理时间与检测人脸总数的对比图如下:

最终分别得到测试图像如下:


相关文章
|
2月前
|
机器学习/深度学习 人工智能 开发工具
如何快速部署本地训练的 Bert-VITS2 语音模型到 Hugging Face
Hugging Face是一个机器学习(ML)和数据科学平台和社区,帮助用户构建、部署和训练机器学习模型。它提供基础设施,用于在实时应用中演示、运行和部署人工智能(AI)。用户还可以浏览其他用户上传的模型和数据集。Hugging Face通常被称为机器学习界的GitHub,因为它让开发人员公开分享和测试他们所训练的模型。 本次分享如何快速部署本地训练的 Bert-VITS2 语音模型到 Hugging Face。
如何快速部署本地训练的 Bert-VITS2 语音模型到 Hugging Face
|
24天前
|
机器学习/深度学习 人机交互 计算机视觉
基于YOLOv8深度学习的人脸面部表情识别系统【python源码+Pyqt5界面+数据集+训练代码】深度学习实战
基于YOLOv8深度学习的人脸面部表情识别系统【python源码+Pyqt5界面+数据集+训练代码】深度学习实战
基于YOLOv8深度学习的人脸面部表情识别系统【python源码+Pyqt5界面+数据集+训练代码】深度学习实战
|
24天前
|
机器学习/深度学习 存储 监控
基于YOLOv8深度学习的智能车牌检测与识别系统【python源码+Pyqt5界面+数据集+训练代码】目标检测、深度学习实战
基于YOLOv8深度学习的智能车牌检测与识别系统【python源码+Pyqt5界面+数据集+训练代码】目标检测、深度学习实战
|
24天前
|
机器学习/深度学习 存储 自动驾驶
基于YOLOv8深度学习的45种交通标志智能检测与识别系统【python源码+Pyqt5界面+数据集+训练代码】目标检测、深度学习实战
基于YOLOv8深度学习的45种交通标志智能检测与识别系统【python源码+Pyqt5界面+数据集+训练代码】目标检测、深度学习实战
|
2月前
|
机器学习/深度学习 PyTorch TensorFlow
深度学习模型加速:Pytorch模型转TensorRT模型
深度学习模型加速:Pytorch模型转TensorRT模型
178 0
|
机器学习/深度学习 数据采集 算法
利用Pytorch实现一个完整的基于深度学习的人脸表情识别项目
利用Pytorch实现一个完整的基于深度学习的人脸表情识别项目
462 0
|
机器学习/深度学习 人工智能 并行计算
Python 深度学习AI - 利用训练好的模型库进行图像分割、一键抠图实例演示,百度深度学习平台飞浆paddlepaddle-gpu的安装与使用
Python 深度学习AI - 利用训练好的模型库进行图像分割、一键抠图实例演示,百度深度学习平台飞浆paddlepaddle-gpu的安装与使用
584 0
Python 深度学习AI - 利用训练好的模型库进行图像分割、一键抠图实例演示,百度深度学习平台飞浆paddlepaddle-gpu的安装与使用
|
人工智能 并行计算 计算机视觉
|
机器学习/深度学习 数据可视化 Java
深度学习--Pytorch构建栈式自编码器实现以图搜图任务(以cifar10数据集为例)
本文旨在使用CIFAR-10数据集,构建与训练栈式自编码器,提取数据集中图像的特征;基于所提取的特征完成CIFAR-10中任意图像的检索任务并展示效果。
178 0
|
机器学习/深度学习 编解码 缓存
如何用ModelScope训练出一个语音降噪模型?
如何用ModelScope训练出一个语音降噪模型?
395 0