长时序建模问题新解，斩获ACM MM-阿里云开发者社区

长时序建模问题新解，斩获ACM MM

2023-05-10 428

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： ACMMM（ACM International Conference on Multimedia, 国际多媒体会议）是ACM多媒体领域的顶级会议，也是中国计算机学会推荐的A类国际学术会议，每年举办一次。其接收的论文覆盖了多媒体、多媒体检索、机器学习、人工智能、视觉、数据科学、HCI、多媒体信号处理以及医疗保健、教育、娱乐等多个领域的众多研究方向。

论文题目

Enlarging the Long-time Dependencies via RL-based Memory Network in Movie Affective Analysis

论文简介

电影的情感内容理解是近年来情感计算领域的研究热点，其在电影质量评估、高潮点检测、多媒体检索等方面有着重要的应用价值。目前主流的方法（如LSTM/Transformer等）在电影级长时序序列建模中存在固有的缺陷：梯度消失/爆炸、记忆能力有限、计算量大等，针对于此，本文提出了一种基于强化学习的记忆网络用来处理长时序建模问题。具体来讲，我们引入了一个可读可写的memory bank用来存储历史信息，从而提升模型的记忆能力，然后利用强化学习（DDPG）中的策略网络和价值网络建模长时依赖，自适应地更新memory bank中的内容，同时利用强化学习的one-step时序差分的优化方式来避免BPTT中的梯度消失/爆炸的问题。为了验证我们方法的有效性，我们在情感预测任务的LIRIS-ACCEDE数据集上以及音乐情感预测、视频摘要等任务的相关数据集上进行了实验，结果均达到了SOTA。该方法在业务数据应用而得到的模型，在AI内容体检，北斗智投和影视元素内容图谱等业务场景得到了广泛应用。

论文作者

张杰、赵寅、钱凯

（作者均来自阿里巴巴文娱AI大脑北斗星团队）

阿里文娱北斗星AI大脑

通过大数据和AI挖掘用户需求，建立内容采买结构化评估、适配性选角、AI成片体检、排播、数字化宣发等能力，以支撑内容全生命周期辅助决策，从而达到为平台降本增效的目的。

长时序建模问题新解，斩获ACM MM

阿里文娱技术

热门文章

最新文章

相关课程

相关电子书

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

长时序建模问题新解，斩获ACM MM

阿里文娱技术

热门文章

最新文章

相关课程

相关电子书