多目标跟踪问题综述

简介: 多目标跟踪(Multiple Object Tracking,MOT)在计算机视觉领域的作用十分重要,高质量的跟踪算法是解决包括视频监控、自动驾驶汽车、动作识别及人群行为分析等许多问题的基础。MOT研究的问题在于跟踪视频序列中不同目标(通常是行人、汽车等)的轨迹。近年来,随着深度学习理论的发展和基准测试的建立,基于深度学习的多目标跟踪方法从表征学习发展到网络建模。

    多目标跟踪简称 MOT(Multiple  Object  Tracking)或 MTT(Multiple  Target Tracking),多目标跟踪的主要需要解决的问题是在一个图像序列中,找到序列中所需要跟踪的目标,并将不同帧的目标一一对应。所跟踪的物体可以是任意的,从泛化性和实用性来考虑,目前多目标跟踪的主要研究对象是行人和车辆。因为行人是典型的非刚体追踪目标,相比于刚体目标的跟踪难度更大,实用价值和研究价值也更高,因此相比于车辆跟踪问题的研究,更多人选择研究行人跟踪的问题。      

     多目标跟踪问题可以公式化描述为,给定图像序列{I1,I2,...,It,...},每帧图像中有Mt个目标,其中 t 为当前帧标号,每个目标的状态表示为s(t),其中目标的状态包括目标的位置,形状,大小,外观等,也可以将目标状态理解为当前帧 某 一 目 标 的 特 征 , 则 每 一 帧 图 像 中 所 有 目 标 的 状 态 集 合 可 以 表 示 为St={s1(t),s2(t),...sM(t)}, 相应的每个目标(第 i 个目标)到当前帧(t 帧)为止的轨迹可以描述为si(1:t)={si(1),si(2),si(t)},到当前帧(t 帧)为止的所有目标的状态集合可以表示为S(1:t)={S1,S2,...,St},对应的目标的观测结果(detection observations)分别通过oi(t),oi(1:t)和O(1:t)表示。多目标跟踪的任务就是通过观测结果找出所有帧的状态结合S(1:t)于是可以将多目标跟踪问题使用后验概率进行描述:

RFME3~23T[RKD[@}6Y7E)YX.png

解决上式的方法主要分为两种,概率推导法(Probabilistic Inference)和确定性优化法(Deterministic  Optimization),这两种方法分别对应的是在线多目标跟踪(online)和离线多目标跟踪(offline)。        

    其中在线多目标跟踪算法是指,该算法仅使用当前帧和当前帧之前帧的信息,而当前帧之后的信息对于算法来说是不可用的信息。这种方法的步骤分为两步,即预测和更新,分别对应的表达式为如下两公式。属于这类跟踪算法的有粒子滤波法(Praticle Filter)、蒙特卡洛拟退火法(MCMC)等。

$ZC81[6K_KDH0)MNJF}}$ZC.png

     而离线多目标跟踪算法则是利用了当前帧的的信息和,当前帧相邻或不相邻的前后帧信息进行优化求解的跟踪算法,这种算法可通过直接优化P(O(1:t)|S(1:t))来得出原问题的答案。除此之外多目标跟踪问题也可以通过直接求解相关能量函数来解决,其具体算法有二分图匹配、动态规划、最大权重独立集等方法。

     根据初始化目标的方式可分为 Detection  Based  Tracking(DBT)和 Detection Free  Tracking(DFT),其中 DBT 类算法是指,在进行跟踪前目标已经被检测出来了,也就是说有一个独立的目标检测过程,通过目标检测算法将帧中的目标检测出来,然后目标跟踪算法将当前帧检测出的目标和跟踪轨迹进行匹配,得到截至当前帧的目标轨迹,以此类推得到整个序列的跟踪结果。从中可以看出目标检测的结果很大程度上影响了此次多目标跟踪的结果。

    而 DFT 类算法没有独立的检测模块进行每一帧的目标检测工作,目标的初始化工作由人工完成,而后再根据初始化的目标进行下一帧的目标检探测和跟踪。和 DBT 类算法相比,DFT 的实用性较弱,由于这类算法需要通过人工标定需要跟踪目标,对于非第一帧出现的目标和中间帧目标消失问题都不能取到很好的跟踪效果,这类算法的优点在于跟踪的精确度较高,有特定的目标。

     相对于单目标跟踪来说,多目标跟踪问题更复杂,除了需要解决单目标跟踪中存在的物体形变,背景干扰等问题,还需要解决以下问题:    

(1)目标的出现和消失问题,每一帧都可能有新的目标出现再图像中,也可能有老的目标从图像范围中消失或是重新出现。    

(2)准确的区分每一个目标,并与跟踪路径进行匹配。

相关文章
|
6月前
|
机器学习/深度学习 监控 算法
图像去雾综述
图像去雾综述
|
6月前
|
机器学习/深度学习 自然语言处理 数据挖掘
【论文精读】TNNLS 2022 - 基于深度学习的事件抽取研究综述
【论文精读】TNNLS 2022 - 基于深度学习的事件抽取研究综述
|
4月前
|
机器学习/深度学习 人工智能 算法
计算机视觉:目标检测算法综述
【7月更文挑战第13天】目标检测作为计算机视觉领域的重要研究方向,近年来在深度学习技术的推动下取得了显著进展。然而,面对复杂多变的实际应用场景,仍需不断研究和探索更加高效、鲁棒的目标检测算法。随着技术的不断发展和应用场景的不断拓展,相信目标检测算法将在更多领域发挥重要作用。
|
6月前
|
机器学习/深度学习 编解码 监控
【aiy篇】小目标检测综述
【aiy篇】小目标检测综述
153 2
|
6月前
|
存储 自然语言处理 文字识别
MLLM首篇综述 | 一文全览多模态大模型的前世、今生和未来
MLLM首篇综述 | 一文全览多模态大模型的前世、今生和未来
2694 0
|
自然语言处理 算法 计算机视觉
【计算机视觉】DETR 系列的最新综述!
DEtection TRansformer (DETR)将检测视为集合预测问题,而不需要生成候选区和后处理步骤,从而将TRansformer引入到目标检测任务中
1172 0
|
机器学习/深度学习 存储 人工智能
自监督学习技术综述
自监督学习技术综述
399 0
|
机器学习/深度学习 编解码 运维
2022年深度学习在时间序列预测和分类中的研究进展综述(上)
2022年深度学习在时间序列预测和分类中的研究进展综述
|
机器学习/深度学习 存储 人工智能
2022年深度学习在时间序列预测和分类中的研究进展综述(下)
2022年深度学习在时间序列预测和分类中的研究进展综述
|
机器学习/深度学习 传感器 数据采集
领域最全 | 计算机视觉算法在路面坑洼检测中的应用综述(基于2D图像/3D LiDAR/深度学习)(上)
本文首先介绍了用于2D和3D道路数据采集的传感系统,包括摄像机、激光扫描仪和微软Kinect。随后,对 SoTA 计算机视觉算法进行了全面深入的综述,包括: (1)经典的2D图像处理,(2)3D点云建模与分割,(3)机器/深度学习。本文还讨论了基于计算机视觉的路面坑洼检测方法目前面临的挑战和未来的发展趋势: 经典的基于2D图像处理和基于3D点云建模和分割的方法已经成为历史; 卷积神经网络(CNN)已经展示了引人注目的路面坑洼检测结果,并有望在未来的进展中打破瓶颈的自/无监督学习多模态语义分割。作者相信本研究可为下一代道路状况评估系统的发展提供实用的指导。
领域最全 | 计算机视觉算法在路面坑洼检测中的应用综述(基于2D图像/3D LiDAR/深度学习)(上)