基于多注意力融合的抗遮挡目标跟踪算法综述

简介: 基于多注意力融合的抗遮挡目标跟踪算法综述

前言


  注意力机制是计算机视觉领域研究中的一个重要方向,可以使卷积神经网络模型增强对特征图中关键 信息的学习与理解,所以被广泛嵌入于卷积神经网络模型中,用于提高模型在图像分类、目标检测和语义分割等领域的应用精度。




注意力机制研究的两个方向


注意力机制模块研究的两个改进方向:


  1. 在使用注意力机制模块提高的模型应用 精度的同时,增加更少参数和计算量;


  1. 从 SE 的通道注意力到 BAM 的空间注意力,后来的 CA 的位置信 息,可以充分融合特征图中的信息。针对上述思考,本文提出,在获取到基于三个维度通道注意力的增强 特征图,将增强后的特征图输入到使用卷积模块操作的空间注意力模块中进行处理。在尽可能利用特征图 通道信息的同时,对特征图中每个位置的空间依赖性进行聚合,模型应用精度得到提升。



多注意力融合的抗遮挡目标跟踪


  基于多注意力融合的抗遮挡跟踪方法。如下图所示,网络由骨干网络、特征增强网 络和预测头三个部分组成。主干网络分别提取模板和搜索区域的特征。然后,利用特征融合网络对特征进 行增强和融合。最后,预测头对增强的特征进行二值分类和边界盒回归,生成跟踪结果。

image.png

image.png




孪生网络目标跟踪框架


  特征抽取: 同基于 Siamese 结构的跟踪器一样,所提出的网络采用一对图像块作为主干网络的输入。模板图像是由视频序列第一帧中目标的中心边长扩展两倍 得到,其中包括目标及其局部周围场景的外观信息。搜索区域从前一帧中目标的中心坐标的边长度扩展四 倍,并且搜索区域通常覆盖目标可能的移动范围。搜索区域和模板被重塑为正方形,紧接着,搜索图像经 过渐进式随机遮挡模块处理,得到遮挡图像,将遮挡图像和 模板图像送入主干网络处理。


  特征融合网络 多注意力融合模块由三维度通道注意力和空间注意力组成。利用三维度通道注意力机制可以从三个维 度捕获特征图有用信息,利用空间注意力机制可以引导模型关注特征图空间信息,将基于三维度的通道注意力机制和空间注意力机制融合,在保持特征通道间关联性的同时保留了特征图的空间信息。




多注意力融合模型


   通过融合三维度通道、空间注意力机制,能使网络有效地抑制背景噪声,突出目标区域,更好地 提取目标特征,提高了算法的跟踪效果。


image.png



相关文章
|
机器学习/深度学习 存储 监控
yolov5单目测距+速度测量+目标跟踪(算法介绍和代码)
yolov5单目测距+速度测量+目标跟踪(算法介绍和代码)
|
3月前
|
传感器 机器学习/深度学习 分布式计算
卡尔曼滤波的多传感器数据融合算法
卡尔曼滤波的多传感器数据融合算法
307 0
|
13天前
|
机器学习/深度学习 并行计算 算法
【超级棒的算法改进】融合鱼鹰和柯西变异的麻雀优化算法研究(Matlab代码实现)
【超级棒的算法改进】融合鱼鹰和柯西变异的麻雀优化算法研究(Matlab代码实现)
|
10天前
|
传感器 算法 数据挖掘
基于协方差交叉(CI)的多传感器融合算法matlab仿真,对比单传感器和SCC融合
基于协方差交叉(CI)的多传感器融合算法,通过MATLAB仿真对比单传感器、SCC与CI融合在位置/速度估计误差(RMSE)及等概率椭圆上的性能。采用MATLAB2022A实现,结果表明CI融合在未知相关性下仍具鲁棒性,有效降低估计误差。
108 15
|
14天前
|
传感器 算法 Shell
【使用卡尔曼滤波器将陀螺仪和加速度计的读数融合,以获取IMU的姿态(四元数)】实现了所谓的“零速度更新”算法,用于行人跟踪(步态跟踪)(Matlab代码实现)
【使用卡尔曼滤波器将陀螺仪和加速度计的读数融合,以获取IMU的姿态(四元数)】实现了所谓的“零速度更新”算法,用于行人跟踪(步态跟踪)(Matlab代码实现)
|
2月前
|
传感器 机器学习/深度学习 算法
多旋翼无人机组合导航系统-多源信息融合算法(Matlab代码实现)
多旋翼无人机组合导航系统-多源信息融合算法(Matlab代码实现)
|
2月前
|
机器学习/深度学习 传感器 边缘计算
【轴承故障诊断】基于融合鱼鹰和柯西变异的麻雀优化算法OCSSA-VMD-CNN-BILSTM轴承诊断研究【西储大学数据】(Matlab代码实现)
【轴承故障诊断】基于融合鱼鹰和柯西变异的麻雀优化算法OCSSA-VMD-CNN-BILSTM轴承诊断研究【西储大学数据】(Matlab代码实现)
|
机器学习/深度学习 算法 计算机视觉
[YOLOv8/YOLOv7/YOLOv5系列算法改进NO.5]改进特征融合网络PANET为BIFPN(更新添加小目标检测层yaml)
本文介绍了改进YOLOv5以解决处理复杂背景时可能出现的错漏检问题。
500 5
|
12月前
|
数据采集 监控 安全
厂区地图导航制作:GIS技术与路径导航算法融合
在智能化、数字化时代,GIS技术为厂区的运营管理带来了革命性变化。本文探讨了如何利用GIS技术,通过数据采集、地图绘制、路径规划、位置定位和信息查询等功能,打造高效、精准的智能厂区地图导航系统,提升企业的竞争力和管理水平。
570 0
厂区地图导航制作:GIS技术与路径导航算法融合
|
机器学习/深度学习 算法 TensorFlow
深入探索强化学习与深度学习的融合:使用TensorFlow框架实现深度Q网络算法及高效调试技巧
【8月更文挑战第31天】强化学习是机器学习的重要分支,尤其在深度学习的推动下,能够解决更为复杂的问题。深度Q网络(DQN)结合了深度学习与强化学习的优势,通过神经网络逼近动作价值函数,在多种任务中表现出色。本文探讨了使用TensorFlow实现DQN算法的方法及其调试技巧。DQN通过神经网络学习不同状态下采取动作的预期回报Q(s,a),处理高维状态空间。
217 1

热门文章

最新文章