4实验
4.1 消融实验
1、图像质量指标h的影响
如表1所示。当h=0.33时,模型表现最佳。当h=0.22或h=0.66时,成绩仍然高于curriculum face。只要把h设置成类似的情况,就仅仅只是一些变化,h不是很敏感。这里设h=0.33。
2、超参数m的影响
Margin
m既对应于angular margin
的最大范围,也对应于additive margins
的大小。从表1可以看出:
- 对于HQ数据集,m=0.4时性能最好,
- 对于LQ数据集,m=0.75时性能最好。
m越大,基于图像质量的angular margin
变化也越大,自适应能力越强。在后续的实验中,选择m=0.4,因为它在LQ数据集上有很好的性能,而在HQ数据集上又不牺牲性能。
3、代理选择的影响
在表1中,为了显示使用特征范数
作为图像质量代理
的有效性,将特征范数
与其他数量进行了切换,例如(1-BRISQUE)或。使用特征规范的性能优于使用其他范数。对于训练数据集,BRISQUE评分
是预先计算的,因此当使用增强训练时,它不能有效地捕捉图像质量。作者引入来说明特征范数的适应性不同于难度的适应性。
4、数据增强的影响
表2显示,数据增强确实为AdaFace
带来了性能提升。HQ数据集的性能保持不变,而LQ数据集的性能显著提高。需要注意的是,数据增强会影响CurricularFace
的性能,这与假设是一致的,即数据增强
是获得更多数据的积极效果
和无法识别的图像的消极效果
之间的权衡
。基于Margin
的softmax之前的工作不包括动态增强,因为性能可能会更差。AdaFace
避免了对不可识别图像的过拟合,可以更好地利用增强效果。
分析
图6
为了显示特征范数以及训练样本的难度在训练过程中的变化情况,在图6中绘制了样本轨迹。从训练数据中随机抽取共计1536个样本。热力图中的每一列代表一个样本,x轴是根据上一个Epoch的范数排序的。
样本#600大约是低范数样本向高范数样本过渡的中间点。底部的图显示,许多低范数样本的概率轨迹直到最后才得到高概率。这与假设是一致的,低规范特征更可能是无法识别的图像。这证明了不太重视这些案例的动机,尽管它们是很难的案例。
低范数特征比高范数特征具有增强的样本百分比更高。对于编号为#0到#600的样本,大约62.0%的样本至少有一种类型的增强。对于#600或更高的样本,该百分比约为38.5%。
4.2 SOTA方法对比
表3a表3b
4.3 局限性与影响
1、局限性
这项工作解决了训练数据中存在的无法识别的图像。然而,噪声标签也是大规模人脸训练数据集的突出特征之一。AdaFace
损失函数对贴错标签的样品没有特殊处理。由于自适应损失赋予高质量的困难样本很大的重要性,高质量的错误标记图像可能会被错误地强调。未来可以同时适应不可识别性
和标签噪声
。
2、潜在的社会影响
作者认为,计算机视觉社区作为一个整体,应该努力尽量减少负面的社会影响。论文的实验使用了训练数据集MS1MV*,这是MS-Celeb的副产品,一个由其创建者撤回的数据集。
使用MS1MV*是必要的,以比较本文的结果与SoTA方法的公平对比。然而,作者认为社区应该转向新的数据集,所以作者还在最新发布的WebFace4M进行了,以促进未来的研究。
在科学界,收集人类数据需要获得伦理委员会的批准,以确保知情同意。虽然IRB状态通常不是由数据集创建者提供的,但由于收集过程的性质,假设大多数FR数据集(除了IJB-S)没有IRB。FR社区的一个方向是在知情同意的情况下收集大型数据集,促进没有社会关注的研发。
检索展示
可以看到使用AdaFace
得到的gallery结果的置信度都比ArcFace
要高。
5参考
[1].AdaFace: Quality Adaptive Margin for Face Recognition
6推荐阅读
YOLOv5永不缺席 | YOLO-Pose带来实时性高且易部署的姿态估计模型!!!