论文笔记之 SST: Single-Stream Temporal Action Proposals-阿里云开发者社区

论文笔记之 SST: Single-Stream Temporal Action Proposals

2017-06-11 2220

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： SST: Single-Stream Temporal Action Proposals2017-06-11 14:28:00 　　本文提出一种时间维度上的 proposal 方法，进行行为的识别。

SST: Single-Stream Temporal Action Proposals

2017-06-11 14:28:00

　　本文提出一种时间维度上的 proposal 方法，进行行为的识别。本文方法具有如下的几个特点：

　　　　1. 可以处理 long video sequence，只需要一次前向传播就可以处理完毕整个video；可以处理任意长度的 video，而不需要处理重叠的时间窗口；

　　　　2. 在 proposal generation task 上取得了顶尖的效果；

　　　　3. SST proposals 提供了一个较强的基准，进行 temporal action localization，将该方法结合到现有的分类任务中，可以改善分类的性能。

　　所提出方法的流程图如下所示：

　　Technical Approach:

　　我们所要达到的目标是：在一个 long video 上产生 temporal action proposals。

　　网络的几个重要的部分：

　　1. Visual Encoder (C3D) 用于编码 video frame，感知输入 video ；

　　2. Seq.Encoder (GRU) 的输入是降维后的 C3D feature，设计该模块的目的是： accumulate evidence across time as the video sequence progresses. 为了能够更好的产生 good proposals，该模块应该能够收集信息直到确定某个动作已经发生了，与此同时，扔掉不相关的背景信息。

　　Training:

　　由于行为识别本身就是一个多分类问题，所以这里用到了交叉熵损失函数来作为最终 loss function。

　　而总的 loss 就是该 loss 的加和：

　　数据集提供了裁剪好的 video，所以就是给定 gt 的监督训练任务，完全可以用反向传播算法进行训练。　　

　　Reference:

　　1. Paper: http://vision.stanford.edu/pdf/buch2017cvpr.pdf

　　2. Github: https://github.com/ranjaykrishna/SST

文章标签：

算法

论文笔记之 SST: Single-Stream Temporal Action Proposals

热门文章

最新文章

相关电子书

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

论文笔记之 SST: Single-Stream Temporal Action Proposals

热门文章

最新文章

相关电子书