蚂蚁保险科技获“国际认知识别类技术挑战赛”双冠军

简介: 第29届ACM国际多媒体会议(ACM International Conference on Multimedia)于24日在成都落幕,作为多媒体领域的国际顶级学术会议,本次会议吸引了全球来自中国、美国、德国、澳大利亚、瑞典、法国、日本等19个国家和地区1000余名学者参会,共收到来自近40个国家,共计2000余篇论文,创下了ACM的规模纪录。

第29届ACM国际多媒体会议(ACM International Conference on Multimedia)于24日在成都落幕,作为多媒体领域的国际顶级学术会议,本次会议吸引了全球来自中国、美国、德国、澳大利亚、瑞典、法国、日本等19个国家和地区1000余名学者参会,共收到来自近40个国家,共计2000余篇论文,创下了ACM的规模纪录。

 

蚂蚁保险科技与中国科学院自动化研究所联合组队,参加了多模态认知技术挑战赛“MuSe2021”两个赛道的比赛,摘得两项冠军。

 

76435BC4-11C4-4CF8-90D8-14FA29728E0A_4_5005_c.jpeg

F1A26CC5-DA5F-40C0-9320-11595D0492A4_4_5005_c.jpeg

 

MuSe竞赛全称为The Multimodal Sentiment Challenge,由英国帝国理工学院、德国奥格斯堡大学以及新加坡南洋理工大学等高校共同举办。该挑战赛源于著名的AVEC(Audio-Visual Emotion Challenge)竞赛,自2020年开始在ACM MM会议期间定期举办,是多模态认知技术与心理学交叉学科的顶级赛事。相比于之前的AVEC竞赛,MuSe竞赛面向自然场景和复杂环境,更加注重结合语义信息的多模态深度融合能力的评测。

 

今年,MuSe2021吸引了来自全球的32支队伍参赛,共分为四个赛道,蚂蚁保险科技和与中国科学院自动化研究所组成的参赛队伍参加了其中MuSe-Wilder和MuSe-Sent 两个赛道。在这两个赛道中,参赛者基于官方提供的自然场景下音视频和文本的多模态数据,在唤醒和效价两个维度,分别预测出连续和离散标签。最终,MuSe-Wilder赛道的平均CCC指标相比第二名高0.1191,MuSe-Sent赛道的平均Macro-F1指标相比第二名高0.0671。

 

比赛中,蚂蚁保险科技团队使用了声学、视觉、文本各模态的多种low-level手工设计特征与high-level深度学习表征,并提出一种使用self-attention机制增强的BiLSTM模型,对特征序列中的复杂时序依赖进行建模。同时,采用与评测目标一致的CCC loss和F1 loss替代回归与分类问题中常用的均方误差和交叉熵损失函数,显著提升了模型性能。


在多模态信息融合阶段,业界主流技术分为前融合与后融合两种,由于在该比赛中特征维度过高,前融合效果不佳,蚂蚁保险科技团队采用了后融合方案,引入第二级BiLSTM模型,对每个独立模态的预测结果进行融合,获得了显著优于单模态预测的性能。

 

本次赛事涉及人工智能与心理学的交叉学科,在自然场景的多模态交互中的认知技术是业界的研究热点,众多国际顶级科研机构与科技企业近年来均进行了大力投入。

 

目前,多模态认知与理解技术已经落地于蚂蚁集团的保险、理财、安全、客服等多领域中。譬如,在碎屏险增信、安全反欺诈等场景中起到提升用户体验的积极作用。未来也将在重疾险理赔中发挥重要作用。

相关文章
|
1月前
|
人工智能
破壁人AI百度:科技公司反内卷的典型样本
请你仅使用两个栈实现先入先出队列。队列应当支持一般队列支持的所有操作(push、pop、peek、empty): 实现 MyQueue 类: void push(int x) 将元素 x 推到队列的末尾 int pop() 从队列的开头移除并返回元素 int peek() 返回队列开头的元素 boolean empty() 如果队列为空,返回 true ;否则,返回 false class MyQueue: def __init__(self): self.stack_in=[] self.stack_out=[] def push(
17 3
|
3天前
|
人工智能 弹性计算 运维
开启运维新纪元!阿里云OS Copilot深度评测 & 体验分享
OS Copilot是Alibaba Cloud为Linux推出的一款基于大模型的智能助手,它能理解自然语言、辅助命令执行和系统运维。目前仅支持Alibaba Cloud Linux 3的x86_64架构。安装过程涉及线上和本地体验,包括申请试用、配置环境变量、安装组件等步骤。OS Copilot提供命令行和多轮交互模式,能进行代码生成和摘要,辅助开发和运维工作。产品体验评测中,OS Copilot因其自然语言理解和高效辅助得到高度评价,尤其对运维人员来说,能大幅提升工作效率。然而,目前仅限于特定操作系统,是其局限性。未来有望扩展更多功能和支持更多平台。
89334 13
|
6天前
|
人工智能 弹性计算 API
创意“孵化机”——基于通义万相加速绘画创作流程
阿里云在2023年推出了AI绘画平台**通义万相**,该平台能够根据文本描述生成图像,应用于艺术创作。近期,阿里云优化了通义万相的接入方式,提供API文档和一键部署服务,使得非技术人员也能轻松集成到Web应用中。为促进用户尝试,阿里云还推出了解决方案评测活动,参与者有机会获得奖品。通义万相通过ECS、OSS、VPC和DashScope等云服务支持,简化了技术架构,加速了绘画创作流程。此外,阿里云提供了优惠购买方案,新人享有特别折扣。该服务不仅适用于艺术家,还可应用于多个领域,提高内容生成效率。
70721 19
|
9天前
|
人工智能 自然语言处理 算法
阿里云PAI大模型评测最佳实践
在大模型时代,模型评测是衡量性能、精选和优化模型的关键环节,对加快AI创新和实践至关重要。PAI大模型评测平台支持多样化的评测场景,如不同基础模型、微调版本和量化版本的对比分析。本文为您介绍针对于不同用户群体及对应数据集类型,如何实现更全面准确且具有针对性的模型评测,从而在AI领域可以更好地取得成就。
|
14天前
|
弹性计算 关系型数据库 数据库
手把手带你从自建 MySQL 迁移到云数据库,一步就能脱胎换骨
阿里云瑶池数据库来开课啦!自建数据库迁移至云数据库 RDS原来只要一步操作就能搞定!
|
14天前
|
机器学习/深度学习 算法 开发工具
通义千问2(Qwen2)大语言模型在PAI-QuickStart的微调、评测与部署实践
阿里云的人工智能平台PAI,作为一站式的机器学习和深度学习平台,对Qwen2模型系列提供了全面的技术支持。无论是开发者还是企业客户,都可以通过PAI-QuickStart轻松实现Qwen2系列模型的微调、评测和快速部署。
|
16天前
|
人工智能 机器人 API
用AppFlow玩转通义百炼大模型应用
阿里云百炼平台提供一站式大模型开发服务,支持创建和定制应用,预置丰富插件和API。用户可以通过平台快速构建大模型应用,并利用AppFlow将其接入钉钉群聊,以AI卡片形式展示。
72978 5
|
14天前
|
存储 网络协议 安全
阿里云hpc8ae实例商业化发布详解
近日,全球领先的云计算厂商阿里云宣布最新HPC优化实例hpc8ae的正式商业化,该实例依托阿里云自研的「飞天+CIPU」架构体系,搭载第四代AMD EPYC处理器,专为高性能计算应用优化,特别适用于计算流体、有限元分析、多物理场模拟等仿真类应用,CAE场景下的性价比最少提升50%。
|
15天前
|
SQL 搜索推荐 OLAP
Flink 流批一体场景应用及落地情况
本文由阿里云 Flink 团队苏轩楠老师撰写,旨在介绍 Flink 流批一体在几个常见场景下的应用。
67528 3
Flink 流批一体场景应用及落地情况
|
15天前
|
Kubernetes 测试技术 应用服务中间件
基于 Nginx Ingress + 云效 AppStack 实现灰度发布
本文将演示结合云效 AppStack,来看下如何在阿里云 ACK 集群上进行应用的 Ingress 灰度发布。
64565 18