CVPR2022 Oral | CosFace、ArcFace的大统一升级,AdaFace解决低质量图像人脸识(二)

本文涉及的产品
视觉智能开放平台,分割抠图1万点
视觉智能开放平台,视频资源包5000点
视觉智能开放平台,图像资源包5000点
简介: CVPR2022 Oral | CosFace、ArcFace的大统一升级,AdaFace解决低质量图像人脸识(二)

4实验


4.1 消融实验

1、图像质量指标h的影响

如表1所示。当h=0.33时,模型表现最佳。当h=0.22或h=0.66时,成绩仍然高于curriculum face。只要把h设置成类似的情况,就仅仅只是一些变化,h不是很敏感。这里设h=0.33。

2、超参数m的影响

Margin m既对应于angular margin的最大范围,也对应于additive margins的大小。从表1可以看出:

  • 对于HQ数据集,m=0.4时性能最好,
  • 对于LQ数据集,m=0.75时性能最好。

m越大,基于图像质量的angular margin变化也越大,自适应能力越强。在后续的实验中,选择m=0.4,因为它在LQ数据集上有很好的性能,而在HQ数据集上又不牺牲性能。

3、代理选择的影响

在表1中,为了显示使用特征范数作为图像质量代理的有效性,将特征范数与其他数量进行了切换,例如(1-BRISQUE)或。使用特征规范的性能优于使用其他范数。对于训练数据集,BRISQUE评分是预先计算的,因此当使用增强训练时,它不能有效地捕捉图像质量。作者引入来说明特征范数的适应性不同于难度的适应性。

4、数据增强的影响

表2显示,数据增强确实为AdaFace带来了性能提升。HQ数据集的性能保持不变,而LQ数据集的性能显著提高。需要注意的是,数据增强会影响CurricularFace的性能,这与假设是一致的,即数据增强获得更多数据的积极效果无法识别的图像的消极效果之间的权衡。基于Margin的softmax之前的工作不包括动态增强,因为性能可能会更差。AdaFace避免了对不可识别图像的过拟合,可以更好地利用增强效果。

分析

image.png图6

为了显示特征范数以及训练样本的难度在训练过程中的变化情况,在图6中绘制了样本轨迹。从训练数据中随机抽取共计1536个样本。热力图中的每一列代表一个样本,x轴是根据上一个Epoch的范数排序的。

样本#600大约是低范数样本向高范数样本过渡的中间点。底部的图显示,许多低范数样本的概率轨迹直到最后才得到高概率。这与假设是一致的,低规范特征更可能是无法识别的图像。这证明了不太重视这些案例的动机,尽管它们是很难的案例。

低范数特征比高范数特征具有增强的样本百分比更高。对于编号为#0到#600的样本,大约62.0%的样本至少有一种类型的增强。对于#600或更高的样本,该百分比约为38.5%。

4.2 SOTA方法对比

image.png表3a表3b

4.3 局限性与影响

1、局限性

这项工作解决了训练数据中存在的无法识别的图像。然而,噪声标签也是大规模人脸训练数据集的突出特征之一。AdaFace损失函数对贴错标签的样品没有特殊处理。由于自适应损失赋予高质量的困难样本很大的重要性,高质量的错误标记图像可能会被错误地强调。未来可以同时适应不可识别性标签噪声

2、潜在的社会影响

作者认为,计算机视觉社区作为一个整体,应该努力尽量减少负面的社会影响。论文的实验使用了训练数据集MS1MV*,这是MS-Celeb的副产品,一个由其创建者撤回的数据集。

使用MS1MV*是必要的,以比较本文的结果与SoTA方法的公平对比。然而,作者认为社区应该转向新的数据集,所以作者还在最新发布的WebFace4M进行了,以促进未来的研究。

在科学界,收集人类数据需要获得伦理委员会的批准,以确保知情同意。虽然IRB状态通常不是由数据集创建者提供的,但由于收集过程的性质,假设大多数FR数据集(除了IJB-S)没有IRB。FR社区的一个方向是在知情同意的情况下收集大型数据集,促进没有社会关注的研发。

检索展示

可以看到使用AdaFace得到的gallery结果的置信度都比ArcFace要高。


5参考


[1].AdaFace: Quality Adaptive Margin for Face Recognition


6推荐阅读


YOLOv5永不缺席 | YOLO-Pose带来实时性高且易部署的姿态估计模型!!!

Transformer崛起| TopFormer打造Arm端实时分割与检测模型,完美超越MobileNet!

阿里巴巴提出USI 让AI炼丹自动化了,训练任何Backbone无需超参配置,实现大一统!

相关文章
|
6月前
|
机器学习/深度学习 算法 计算机视觉
【论文速递】CVPR2022-弱监督旋转不变的航空目标检测网络
【论文速递】CVPR2022-弱监督旋转不变的航空目标检测网络
|
6月前
|
机器学习/深度学习 传感器 算法
【论文速递】AAAI2023 - BEVDepth: 用于多视图三维物体检测的可靠深度采集
【论文速递】AAAI2023 - BEVDepth: 用于多视图三维物体检测的可靠深度采集
|
6月前
|
传感器 编解码 人工智能
GEE数据集——MOD13A1.006Terra星搭载的中分辨率成像光谱仪获取的L3级植被指数产品
GEE数据集——MOD13A1.006Terra星搭载的中分辨率成像光谱仪获取的L3级植被指数产品
104 2
|
6月前
|
算法 测试技术 vr&ar
【论文速递】CVPR2022 : 用于目标跟踪的统一transformer跟踪器
【论文速递】CVPR2022 : 用于目标跟踪的统一transformer跟踪器
|
6月前
|
机器学习/深度学习 传感器 算法
GEE好文推荐——利用样本点迁移方法快速实现全球范围内1984年至今基于Landsat影像的土地分类
GEE好文推荐——利用样本点迁移方法快速实现全球范围内1984年至今基于Landsat影像的土地分类
222 0
|
12天前
|
计算机视觉
ECCV2024 Oral:第一视角下的动作图像生成,Meta等提出LEGO模型
【10月更文挑战第25天】Meta公司提出了一种名为LEGO的新模型,旨在从第一视角生成动作图像,以促进技能传递。LEGO结合了视觉大型语言模型和扩散模型,通过微调和生成技术,实现了更准确的动作图像生成。该研究已在ECCV2024上被选为口头报告。
21 2
|
5月前
|
算法 图形学 计算机视觉
CVPR 2024:合成视频数据集里只有单人数据?M3Act破解人群行为标注难题
【6月更文挑战第12天】CVPR 2024上的M3Act数据集解决了复杂人群行为标注难题,提供多视角、多群体的合成视频数据,助力计算机视觉研究。利用Unity引擎生成高度真实的人类动作和群体活动,促进以人类为中心任务的学习。实验显示,M3Act能提升目标检测等任务性能,降低数据收集成本,并支持3D群体活动的可控生成。尽管面临数据复杂性、偏差和计算资源限制等问题,M3Act为相关研究提供了宝贵资源。[论文链接](https://arxiv.org/abs/2306.16772)
71 4
|
6月前
|
机器学习/深度学习 自然语言处理 计算机视觉
CVPR 2024:生成不了光线极强的图片?微信视觉团队有效解决扩散模型奇点问题
【4月更文挑战第14天】中山大学和微信团队的研究者提出 SingDiffusion,一种解决扩散模型在处理极端亮度图像时的平均亮度问题的新方法。SingDiffusion 可无缝集成到预训练模型中,无需额外训练,通过处理 t=1 时间步长的采样问题,改善了图像生成的亮度偏差。在 COCO 数据集上的实验显示,相较于现有模型,SingDiffusion 在 FID 和 CLIP 分数上表现更优。
78 7
CVPR 2024:生成不了光线极强的图片?微信视觉团队有效解决扩散模型奇点问题
|
6月前
|
定位技术
高分GF与环境HJ系列国产卫星遥感影像数据图像免费批量下载方法
高分GF与环境HJ系列国产卫星遥感影像数据图像免费批量下载方法
157 1
|
数据采集 SQL 编解码
CVPR2022 Oral | CosFace、ArcFace的大统一升级,AdaFace解决低质量图像人脸识(一)
CVPR2022 Oral | CosFace、ArcFace的大统一升级,AdaFace解决低质量图像人脸识(一)
333 0

热门文章

最新文章