机器视觉之AR美颜人脸识别项目设计

简介:

现在大多数美颜相机拍照后,都只有添加各种滤镜、加几个字、变白一点,早已经不能满足广大女性群体对于美颜的需求;加上如今年轻女性和男性的审美标准和猎奇心理都在发生改变,社交方式的趣味性也变得不同,比如原来大家可能在空间、朋友圈、直播上看到美女帅哥都会觉得很吸睛,点赞粉丝直奔而来,但随着快手和抖音的出现,可以发现不仅仅是俊男靓女的照片和视频能引起围观,同样的各种普通群众的搞怪合成视频或合成照片(虚拟的AR特效带来的各种浮夸造型)同样能吸引无数粉丝的追捧,让普通人也能享受被人膜拜的满足感,而这些都需要用到人脸识别的相关技术。工业智能相机
人脸识别
目标用户画像分析:
1、了解目标用户的主流群体:
学生(大学生、高中生、初中生)群体对月美颜美妆的心理需求、时尚人士的美妆需求、长相普通的人和长相突出的人对于美颜的心理需求等。
2、了解用户的年龄组成、地域分布对应美妆的特点。
3、不同收入群体(白领、金领、蓝领等)的美颜美妆需求关注点。
(3)市场分析:美颜美妆的市场规模,产业链,潜在的边际效应利益等。
2)文档准备
(1)需求文档:
详细的分析目前的用户需求,针对不同群体,设计不同的产品解决方案,包括市场的需求文档。
(2)数据文档:
前期的人脸图片收集、分发、标注总结文档(确定什么样的图片能要,什么样的不能要),各种脸型(长的、宽的、圆的、前额凸出的、眼睛深陷的等等)的分类,多少人完成眼睛美颜图片的分类等。
(3)产品文档:
1、场景落地文档:如听歌时头上戴虚拟耳机,叹气时嘴上叼烟,说话时唾沫星子等针对不同的人脸姿态场景研究可能的落地产品形式。
2、产品的设计文档:如美颜APP的页面交互设计、导航设计、视觉呈现设计等;直播APP中的弹幕呈现设计、点赞分享按钮设计等。
3、产品开发流程文档:如PM先提交需求、可行性分析、立项、设计流程、开发流程,算法搭建、模型训练、测试训练等一系列流程的步骤及跟进。
4、模型训练及测试文档:数据标注好后,喂给算法,搭建人脸识别美颜的模型框架,如前期用成千上万的照片训练机器的人脸关键点定位,让机器找准鼻子、眼睛、耳朵、嘴等位置等。
3)数据标注
(1)数据图片的采集:
在文档的指引下,从公开网站上爬取收集符合模型训练的人脸图片、或是运用公司的数据图片等。
(2)数据图片的标注:
在标注规范文档的指引下,将图片分发给标注团队进行数据的标注,对一些模棱两可的图片,如图片中的人脸较模糊,此时该照片是要还是不要,期间应与算法同事保持沟通,有时暗的图片在算法的优化中能准确识别,这样增加实际情况的容错率(实际中较暗的人脸图像也能定位出关键部位),那么这张图片则视为有效数据;有时较暗的图片经过算法之后并不能达到要求(及无法定位出人脸关键点),此时这照片则视为无效数据,直接剔除;但是标注团队并不知道这张图片是有效还是无效,所以标注过程中,算法同事也需间接参与进来。

(3)数据的反馈:
在部分图片标注过程后,交于算法同事训练模型调节参数,期间将测试后的数据(精确率和召回率的计算,来反映数据的标注结果)反馈给还在标注的人员,有时可能造成过拟合有时可能造成欠拟合等方便对数据进行重新操作。
4)项目流程跟踪
(1)产品立项后,每天的任务管理,流程进度跟踪,产出时间管理,开会反馈工作成果等。
(2)软硬件端:在开发流程文档的指引下,按照常规的软硬件跟踪开发。
(3)算法流程:
人脸采集、人脸检测、图像的预处理(模糊的则用算法去模糊等)、人脸特征提取、图像的匹配识别、AR虚拟等。
5)项目测试:
1、手机摄像头测试
2、平台后台程序测序
3、算法与平台后台测试
4、模型识别时间、准确率、召回率测试
5、服务器稳定性测试
6、网络带宽限制测试
7、其他平台、硬件产品常规测试
8、目标用户使用测试
6)项目优化:经过各种测试之后,针对反馈回来的数据进行产品的优化
如一张嘴就给你来根烟,结果烟插到鼻子上了,这就明显是没有定位到人脸关键点,是数据的原因还是算法的原因,这些都要经过优化处理;经过种子用户测试后,反馈得知这个点赞按钮操作起来有点别扭,应该怎样怎样,这时可能要与设计的同学讨论一下,该怎样优化产品的设计和体验。
7)项目验收上线
产品按照流程功能进行验收后上线。

相关文章
|
12天前
|
存储 传感器 编解码
ROS机器视觉入门:从基础到人脸识别与目标检测
前言 从本文开始,我们将开始学习ROS机器视觉处理,刚开始先学习一部分外围的知识,为后续的人脸识别、目标跟踪和YOLOV5目标检测做准备工作。我采用的笔记本是联想拯救者游戏本,系统采用Ubuntu20.04,ROS采用noetic。 颜色编码格式,图像格式和视频压缩格式 (1)RGB和BGR:这是两种常见的颜色编码格式,分别代表了红、绿、蓝三原色。不同之处在于,RGB按照红、绿、蓝的顺序存储颜色信息,而BGR按照蓝、绿、红的顺序存储。 rgb8图像格式:常用于显示系统,如电视和计算机屏幕。 RGB值以8 bits表示每种颜色,总共可以表示256×256×256=16777216种颜色
121 70
|
29天前
|
存储 传感器 编解码
ROS机器视觉入门:从基础到人脸识别与目标检测
【11月更文挑战第9天】从本文开始,我们将开始学习ROS机器视觉处理,刚开始先学习一部分外围的知识,为后续的人脸识别、目标跟踪和YOLOV5目标检测做准备工作。
135 56
|
机器学习/深度学习 算法 决策智能
ubuntu16.04下ROS操作系统学习笔记(六 )机器视觉-摄像头标定-ROS+OpenCv-人脸识别-物体跟踪-二维码识别(下)
ubuntu16.04下ROS操作系统学习笔记(六 )机器视觉-摄像头标定-ROS+OpenCv-人脸识别-物体跟踪-二维码识别(下)
381 0
|
存储 机器学习/深度学习 编解码
ubuntu16.04下ROS操作系统学习笔记(六 )机器视觉-摄像头标定-ROS+OpenCv-人脸识别-物体跟踪-二维码识别(上)
ubuntu16.04下ROS操作系统学习笔记(六 )机器视觉-摄像头标定-ROS+OpenCv-人脸识别-物体跟踪-二维码识别(上)
446 0
|
7月前
|
弹性计算 Java PHP
新手用户注册阿里云账号、实名认证、购买云服务器图文教程参考
对于初次购买阿里云产品的用户来说,第一步要做的是注册账号并完成实名认证,然后才是购买阿里云服务器或者其他云产品,本文为大家以图文形式展示一下新手用户从注册阿里云账号、实名认证到购买云服务器完整详细教程,以供参考。
新手用户注册阿里云账号、实名认证、购买云服务器图文教程参考
|
6月前
|
文字识别 算法 API
视觉智能开放平台产品使用合集之uniapp框架如何使用阿里云金融级人脸识别
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
149 0
|
机器学习/深度学习 搜索推荐 计算机视觉
【阿里云OpenVI-人脸感知理解系列之人脸识别】基于Transformer的人脸识别新框架TransFace ICCV-2023论文深入解读
本文介绍 阿里云开放视觉智能团队 被计算机视觉顶级国际会议ICCV 2023接收的论文 "TransFace: Calibrating Transformer Training for Face Recognition from a Data-Centric Perspective"。TransFace旨在探索ViT在人脸识别任务上表现不佳的原因,并从data-centric的角度去提升ViT在人脸识别任务上的性能。
2209 341
|
7月前
对于阿里云OpenAPI的域名实名认证
【1月更文挑战第5天】【1月更文挑战第22篇】对于阿里云OpenAPI的域名实名认证
81 1

热门文章

最新文章