YCRB色彩空间域助力快速完成人脸识别数据集

简介: YCRB色彩空间域助力快速完成人脸识别数据集

前言


  近期分享给大家一个快速制作人脸识别数据集制作的方法,此项目分为MATLAB版和Python版,这二者都有目录式的数据集制作和Voc数据集的制作,在这里为大家着重介绍逻辑结构设计,代码部分为会更新至仓库中,这里为将以MATLAB为蓝本为大家介绍其逻辑结构




MATLAB版本


函数整体介绍:


当你下载此项目后打开MATLAB可以发下如下结果:


MakeVocDataSet.m : 代表制作Voc数据集


MakeDataSet.m : 代表制作普通图像分类的数据集,其导入格式为目录式


FindFace.m : 回调函数(发现人脸)



函数流程讲解


FindFace.m:


此函数主要作用是检测出图像中的人脸以及人脸的坐标。


通过RGB空间域转换到ycbcr空间域,检测符合黄种人肤色的人脸部分,大家也可以根据空间域自行调节,便于自己使用。


MakeVocDataSet.m (用来创建VOC式数据集)


此函数主要作用是通过摄像头对准人脸部分进行制作数据集,核心流程步骤如下:


  1. 读取摄像头


  1. 构造True循环


  1. 获取视频画面


  1. 对视频画面进行归一化(可设置成自己需要的大小方便后面计算人脸框,避免因外接相机不同造成Bug)


  1. 调用FindFace.m 函数,返回值分别为:人脸图像、X轴坐标值、Y轴坐标值


  1. 判断返回值中是否存在人脸图像或XY值(有时候画面中没有人脸或人脸被遮挡会报错跳出TURE循环)


  1. 如果返回值判断为不存在人脸则disp(No Face)


  1. 如果返回值判断为存在人脸则执行下面的程序


  1. 给图像命名。图像全名 = 图像名称 + 图像格式


  1. 存储命名结束的图像至指定位置


  1. 给txt文件信息部分进行赋值。txtinfo = 图像全名+空格+标签+空格+Xmin+空格+Ymin+空格+Xmax+空格+Ymax


  1. 对txtinfo进行创建txt文件并存储。txt全程 = 图像名称 + .txt


  1. 结束if 和 while 1 == 1 循环


MakeDataSet.m(用来创建目录式数据集)



  1. 读取摄像头


  1. 构造True循环


  1. 获取视频画面


  1. 调用FindFace.m 函数,返回值分别为:人脸图像、X轴坐标值、Y轴坐标值


  1. 判断返回值中是否存在人脸图像或XY值(有时候画面中没有人脸或人脸被遮挡会报错跳出TURE循环)


  1. 如果返回值判断为不存在人脸则disp(No Face)


  1. 如果返回值判断为存在人脸则执行下面的程序


  1. 对获取到的人脸画面进行归一化(可设置成自己需要的大小方便训练数据的大小)


  1. 给图像命名。图像全名 = 图像名称 + 图像格式


  1. 存储命名结束的图像至指定位置


  1. 结束if 和 while 1 == 1 循环


txt2xml.py (用来将txt文件转化为xml文件)



Python版本



程序的逻辑结构可以参考MATLAB版本,在语法上二者有些许差异但是在逻辑上二者一致。



相关文章
|
6月前
|
机器学习/深度学习 TensorFlow 算法框架/工具
【Python深度学习】Tensorflow+CNN进行人脸识别实战(附源码和数据集)
【Python深度学习】Tensorflow+CNN进行人脸识别实战(附源码和数据集)
660 4
|
存储 算法 数据库
人脸识别数据集
人脸识别数据集
|
算法 测试技术 数据库
人脸识别常用数据集大全(12/20更新)
人脸识别常用数据集大全(12/20更新) 原文首发地址:人脸识别常用数据集大全(12/20更新) - 极市博客   1.PubFig: Public Figures Face Database(哥伦比亚大学公众人物脸部数据库) The PubFig database is a large,...
3411 0
|
6月前
|
弹性计算 Java PHP
新手用户注册阿里云账号、实名认证、购买云服务器图文教程参考
对于初次购买阿里云产品的用户来说,第一步要做的是注册账号并完成实名认证,然后才是购买阿里云服务器或者其他云产品,本文为大家以图文形式展示一下新手用户从注册阿里云账号、实名认证到购买云服务器完整详细教程,以供参考。
新手用户注册阿里云账号、实名认证、购买云服务器图文教程参考
|
5月前
|
文字识别 算法 API
视觉智能开放平台产品使用合集之uniapp框架如何使用阿里云金融级人脸识别
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
137 0
|
机器学习/深度学习 搜索推荐 计算机视觉
【阿里云OpenVI-人脸感知理解系列之人脸识别】基于Transformer的人脸识别新框架TransFace ICCV-2023论文深入解读
本文介绍 阿里云开放视觉智能团队 被计算机视觉顶级国际会议ICCV 2023接收的论文 "TransFace: Calibrating Transformer Training for Face Recognition from a Data-Centric Perspective"。TransFace旨在探索ViT在人脸识别任务上表现不佳的原因,并从data-centric的角度去提升ViT在人脸识别任务上的性能。
2164 341
|
6月前
对于阿里云OpenAPI的域名实名认证
【1月更文挑战第5天】【1月更文挑战第22篇】对于阿里云OpenAPI的域名实名认证
78 1
|
安全 数据安全/隐私保护
阿里云账号注册、实名认证、账号信息管理、密码找回及账号注销流程及常见问题
本文为大家详细介绍我们在注册阿里云账号,完成账号实名认证,管理账号信息,账号密码找回以及注销账号的详细流程及常见问题。
阿里云账号注册、实名认证、账号信息管理、密码找回及账号注销流程及常见问题
|
人工智能 计算机视觉
阿里云产品体系分为6大分类——人工智能——分为10种模块——人脸识别
阿里云产品体系分为6大分类——人工智能——分为10种模块——人脸识别自制脑图
126 1

热门文章

最新文章