前言
注意力机制是计算机视觉领域研究中的一个重要方向,可以使卷积神经网络模型增强对特征图中关键 信息的学习与理解,所以被广泛嵌入于卷积神经网络模型中,用于提高模型在图像分类、目标检测和语义分割等领域的应用精度。
注意力机制研究的两个方向
注意力机制模块研究的两个改进方向:
- 在使用注意力机制模块提高的模型应用 精度的同时,增加更少参数和计算量;
- 从 SE 的通道注意力到 BAM 的空间注意力,后来的 CA 的位置信 息,可以充分融合特征图中的信息。针对上述思考,本文提出,在获取到基于三个维度通道注意力的增强 特征图,将增强后的特征图输入到使用卷积模块操作的空间注意力模块中进行处理。在尽可能利用特征图 通道信息的同时,对特征图中每个位置的空间依赖性进行聚合,模型应用精度得到提升。
多注意力融合的抗遮挡目标跟踪
基于多注意力融合的抗遮挡跟踪方法。如下图所示,网络由骨干网络、特征增强网 络和预测头三个部分组成。主干网络分别提取模板和搜索区域的特征。然后,利用特征融合网络对特征进 行增强和融合。最后,预测头对增强的特征进行二值分类和边界盒回归,生成跟踪结果。
孪生网络目标跟踪框架
特征抽取: 同基于 Siamese 结构的跟踪器一样,所提出的网络采用一对图像块作为主干网络的输入。模板图像是由视频序列第一帧中目标的中心边长扩展两倍 得到,其中包括目标及其局部周围场景的外观信息。搜索区域从前一帧中目标的中心坐标的边长度扩展四 倍,并且搜索区域通常覆盖目标可能的移动范围。搜索区域和模板被重塑为正方形,紧接着,搜索图像经 过渐进式随机遮挡模块处理,得到遮挡图像,将遮挡图像和 模板图像送入主干网络处理。
特征融合网络 多注意力融合模块由三维度通道注意力和空间注意力组成。利用三维度通道注意力机制可以从三个维 度捕获特征图有用信息,利用空间注意力机制可以引导模型关注特征图空间信息,将基于三维度的通道注意力机制和空间注意力机制融合,在保持特征通道间关联性的同时保留了特征图的空间信息。
多注意力融合模型
通过融合三维度通道、空间注意力机制,能使网络有效地抑制背景噪声,突出目标区域,更好地 提取目标特征,提高了算法的跟踪效果。