长时序建模问题新解,斩获ACM MM

简介: ACMMM(ACM International Conference on Multimedia, 国际多媒体会议)是ACM多媒体领域的顶级会议,也是中国计算机学会推荐的A类国际学术会议,每年举办一次。其接收的论文覆盖了多媒体、多媒体检索、机器学习、人工智能、视觉、数据科学、HCI、多媒体信号处理以及医疗保健、教育、娱乐等多个领域的众多研究方向。

论文题目

Enlarging the Long-time Dependencies via RL-based Memory Network in Movie Affective Analysis


论文简介

电影的情感内容理解是近年来情感计算领域的研究热点,其在电影质量评估、高潮点检测、多媒体检索等方面有着重要的应用价值。目前主流的方法(如LSTM/Transformer等)在电影级长时序序列建模中存在固有的缺陷:梯度消失/爆炸、记忆能力有限、计算量大等,针对于此,本文提出了一种基于强化学习的记忆网络用来处理长时序建模问题。具体来讲,我们引入了一个可读可写的memory bank用来存储历史信息,从而提升模型的记忆能力,然后利用强化学习(DDPG)中的策略网络和价值网络建模长时依赖,自适应地更新memory bank中的内容,同时利用强化学习的one-step时序差分的优化方式来避免BPTT中的梯度消失/爆炸的问题。为了验证我们方法的有效性,我们在情感预测任务的LIRIS-ACCEDE数据集上以及音乐情感预测、视频摘要等任务的相关数据集上进行了实验,结果均达到了SOTA。该方法在业务数据应用而得到的模型,在AI内容体检,北斗智投和影视元素内容图谱等业务场景得到了广泛应用。


论文作者

张杰、赵寅、钱凯

(作者均来自阿里巴巴文娱AI大脑北斗星团队)


阿里文娱北斗星AI大脑

通过大数据和AI挖掘用户需求,建立内容采买结构化评估、适配性选角、AI成片体检、排播、数字化宣发等能力,以支撑内容全生命周期辅助决策,从而达到为平台降本增效的目的。

相关文章
|
2月前
KDD 2024:零样本即可时空预测!港大、华南理工等发布时空大模型UrbanGPT
【8月更文挑战第21天】UrbanGPT是由香港大学等机构研发的时空大模型,针对城市管理中因数据稀缺导致的预测难题,通过时空依赖编码器与指令调整技术实现强大的泛化能力。此模型能在多种城市任务中无需样本进行准确预测,如交通流量和人群流动等,有效应对数据收集难的问题,在零样本场景下表现优异,为智慧城市管理提供了有力工具。[论文](https://arxiv.org/abs/2403.00813)
39 1
|
4月前
|
机器学习/深度学习 计算机视觉
ICLR 2024 Oral :应对随时间变化的分布偏移,西安大略大学等提出学习时序轨迹方法
【6月更文挑战第27天】ICLR 2024 Oral 提出解决时间分布偏移新策略:潜在轨迹学习。针对数据分布随时间变化的挑战,西安大略大学研究团队提出一种方法,通过学习数据的时序轨迹增强模型泛化。在连续的潜在空间中建模分布变化,改善对未见数据的适应性。实验显示在多种场景下性能提升,但需更多计算资源且依赖部分标记数据。[论文链接](https://openreview.net/pdf?id=bTMMNT7IdW)**
42 2
|
4月前
|
机器学习/深度学习 定位技术
ICLR 2024 Spotlight:连续数值分布式表征加持,浙大UIUC让语言模型擅长表格预测
【6月更文挑战第23天】在ICLR 2024会议上,浙大和UIUC的研究团队推出TP-BERTa,一种改进的BERT模型,专为表格预测。通过将连续数值特征转为文本并利用自注意力机制,TP-BERTa能有效处理高维、异构表格数据,提高预测性能。预训练和微调策略使其在XGBoost等传统方法及FT-Transformer等深度学习模型中脱颖而出。论文链接:[anzIzGZuLi](https://openreview.net/pdf?id=anzIzGZuLi)
95 5
|
5月前
|
机器学习/深度学习 运维 算法
[ICDE2024]多正常模式感知的频域异常检测算法MACE
阿里云计算平台大数据基础工程技术团队主导,与浙江大学合作的论文《Learning Multi-Pattern Normalities in the Frequency Domain for Efficient Time Series Anomaly Detection》被ICDE2024收录,该论文解决了云服务环境中不同服务存在不同正常模式,而传统神经网络一个训练好的模型只能较好捕捉一种或少数几种正常模式的问题,该论文提出的方法可以使用一个统一模型对不同服务进行检测,就达到比为每一个服务定制一个模型的SOTA方法更好的效果。
|
5月前
|
机器学习/深度学习 算法 数据挖掘
JCR一区5.4分|经典~非肿瘤机器学习筛选生物标志物+qPCR
本文介绍了一项使用机器学习算法识别间变性甲状腺癌(ATC)新型生物标志物和免疫浸润特征的研究。该研究发表在2023年9月的《Journal of Endocrinological Investigation》上,IF为5.4。通过对GEO数据库中的RNA测序数据进行分析,研究人员鉴定出425个差异表达基因,并利用LASSO和SVM-RFE算法确定了4个ATC特征基因(ADM、PXDN、MMP1和TFF3)。这些基因在诊断、药物敏感性和免疫微环境中具有潜在价值,可能成为ATC诊断和治疗的生物标志物。
111 0
|
5月前
|
机器学习/深度学习 人工智能 Java
【AI for Science】量子化学:分子属性预测-第2次打卡-特征工程baseline上分
【AI for Science】量子化学:分子属性预测-第2次打卡-特征工程baseline上分
|
5月前
|
机器学习/深度学习 计算机视觉
【论文速递】MMM2020 - 电子科技大学提出一种新颖的局部变换模块提升小样本分割泛化性能
【论文速递】MMM2020 - 电子科技大学提出一种新颖的局部变换模块提升小样本分割泛化性能
39 0
牛顿法和P-Q分解法IEEE14系统潮流计算(附matlab代码)
潮流计算是电力系统中最基本,应用最广泛的一种计算,是电力系统稳定计算和故障分析的基础。本文主要介绍极坐标下牛顿法和P-Q分解法的原理以及matlab实现,适用IEEE14节点系统进行测试,计算结果和应用matpower的潮流计算完全一致。
|
算法
基于前推回代法的连续潮流计算研究【IEEE33节点】(Matlab代码实现)
基于前推回代法的连续潮流计算研究【IEEE33节点】(Matlab代码实现)
202 0
|
机器学习/深度学习 人工智能 算法
IEEE TPAMI | 火山语音提出多源迁移高斯回归模型,效果超越多个SOTA方法
IEEE TPAMI | 火山语音提出多源迁移高斯回归模型,效果超越多个SOTA方法
193 0