4 实验
4.1 基础实验
对于实验想必大家对于公开数据集已经非常熟悉了,作者对于比较主流的公开数据集都进行了实验,数据集列表如下:
下面是一些主流Backbone与基于Transformer的对比结果,可以看出把图像分为12份得到的语义嵌入的结果比ResNet50、101、152以及ResNeSt50、200都要好:
下表是SOTA模型的对比表,可以看出TransReID已经达到SOTA水平,同时也超越了很多主流的ReID模型,诸如,CBN、OSNet、MGN、HOReID等。同时对于具有遮挡的ReID任务也有比较好的效果,同时TransReID在车辆ReID也达到了SOTA水平。
4.2 消融实验
通过下表可以看出,SIE可以编码不同的相机组合ID和/或视角信息。
在下图的图4a和图4b中,摄像机和视角之间的分布差距明显。当在Vit-BoT中引入SIE模块时,在下图的图4c和图4d中减少了摄像头间/视角和摄像头内/视角之间的分布差距,这说明SIE模块可以减少各种摄像头以及视角造成的外观偏差。
在Vit-BoT的基础上,JPM在MSMT17和VeRi-776上分别提升了2.6%的mAP和1.0%的mAP。增加k组的数量可以提高性能,同时也略微增加了推理时间。论文建议k=4是权衡速度和性能一个不错的选择。
5 参考
[1].TransReID: Transformer-based Object Re-Identification.