《中国人工智能学会通讯》——11.70 基于黎曼流形稀疏表示的视觉目 标跟踪方法-阿里云开发者社区

开发者社区> 人工智能> 正文

《中国人工智能学会通讯》——11.70 基于黎曼流形稀疏表示的视觉目 标跟踪方法

简介: 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第11章,第11.70节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。

11.70 基于黎曼流形稀疏表示的视觉目 标跟踪方法

如引言所述,视觉目标跟踪中表观建模主要分为目标表示和统计建模两部分。上两节主要关注的是在跟踪中如何设计一种有效的统计模型。本节主要关注的是表观建模中的目标表示策略。近年来,稀疏表示作为一种有效的物体中层表示策略在视觉跟踪中得到了广泛应用[2] 。稀疏表示的核心思想就是将数据表示为一个字典中基元的线性组合,而且只需要较少的几个基元就可以将数据表示出来,线性组合权重向量称之为稀疏参数。目前基于稀疏表示的跟踪方法都假定数据位于欧式空间 。然而,在实际应用中,特征数据往往位于具有某种潜在几何结构的黎曼流形 M 上。如果直接用欧式空间中获得数据稀疏表示的策略来处理位于黎曼流形的数据既不合理也不恰当,因为黎曼流形 M 上的点不能简单地表示为字典中某些基元的线性组合。

为了能使用欧式空间的理论和方法,首先需要将位于黎曼流形的数据嵌入到某个欧式空间中,然而,这种嵌入映射很难得到。即使我们能获得嵌入映射,在映射过程中很难保证原始数据内在的几何结构。例如,假设黎曼流形 M 上两个点 x 和 y 有很大的测地线距离足以将它们分开。但是当经过嵌入 f:M 后,在欧式空间中的 f(x) 和 f(y) 可能会有很小的距离。因此在欧式空间中对 f(x) 和 f(y)进行稀疏编码是会有非常相近的稀疏系数,这与在原始黎曼流形中不相似的两点 x 和 y 相违背。

为了解决上述难点,一种很自然的方法就是利用黎曼对数映射构造 M 上每个数据点的切空间[10-11] ;在切空间中计算流形数据点的稀疏表示。因为 M上每个点的切空间就是一个欧式向量空间,所以在切空间中可以将每个数据点表示为基元的稀疏线性组合;然后再将数据点通过黎曼指数映射映射回流形 M 上。这类方法是利用切空间的欧式距离来近似流形上的真实距离。虽然比较简单,但是在切空间中只有切点间的距离是真正的测地线距离,其他任意两点间的距离不能表示流形的几何结构。也就是说,在稀疏表示过程中,这类方法没有考虑真正的黎曼几何结构。此外,迭代地使用黎曼对数映射和黎曼指数映射无疑增加了计算负担。

本节提出了一种新的流形自适应核稀疏表示方法。流形自适应核函数将黎曼流形嵌入到高维的可再生核希尔伯特空间(Reproducing Kernel HilbertSpaces,RKHS)。在 RKHS 上,每个数据点可表示为字典基元的稀疏线性组合。图拉普拉斯(GraphLaplacian)算子被整合到 RKHS 中可以有效地反映数据中潜在的几何结构。同时,本章介绍并证明了两种定义在正定对称矩阵这类黎曼流形上的有效核函数。通过核变换,这两种核函数可直接构造出对应的流形自适应核。随后,在粒子滤波目标跟踪框架下用核稀疏表示建模目标区域中相互重叠的局部图像块,然后将每个图像块的核稀疏系数作为目标直方图描述子的一个簇。用簇比重直方图距离计算目标模板与候选目标之间的距离来作为粒子滤波的观测模型,以确定最终的跟踪区域。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
人工智能
使用钉钉扫一扫加入圈子
+ 订阅

了解行业+人工智能最先进的技术和实践,参与行业+人工智能实践项目

其他文章