【喜讯】阿里巴巴文娱生成式信息抽取论文中选ACL

简介: 是由国际计算语言学协会主办的自然语言处理领域最负盛名的顶级学术会议,每年举办一次,其接收的论文覆盖了对话系统、语义分析、摘要生成、信息抽取、问答系统、语言模型、机器翻译、情感计算、知识图谱等自然语言处理领域的众多研究方向。

文娱妹导读

ACL会议

Annual Meeting of the Association for Computational Linguistics

是由国际计算语言学协会主办的自然语言处理领域最负盛名的顶级学术会议,每年举办一次,其接收的论文覆盖了对话系统、语义分析、摘要生成、信息抽取、问答系统、语言模型、机器翻译、情感计算、知识图谱等自然语言处理领域的众多研究方向。



Seq2Path: Generating Sentiment Tuples as Paths of a Tree


论文简介

生成式信息抽取是近年来NLP领域的研究热点,由于其良好的表现以及end-to-end的特性已经成为了很多信息抽取相关任务的新范式。目前主流的Seq2Seq信息抽取框架面临多个元组(tuple)的情形时会在解码阶段强行引入tuple之间的序列约束,本文针对这一缺点,提出了一种Seq2Path的方法。具体来说,将每个需要识别的tuple视为树结构中的独立路径(path),在训练阶段拟合average loss over paths;在预测阶段,采用beam search with constrained decoding进行解码,并通过引入一个判别token来自动选择正确的path。本文以细粒度情感分析(ABSA)任务为例,在ABSA五个子任务对应的公开数据集上进行了实验,结果充分验证了本文方法的有效性。目前文本方法已经在阿里文娱大脑(北斗星)情感计算相关场景中得到了应用。


图片.png


作者


茅越

沈一

杨竞潮

朱晓颖

蔡龙军

(作者撰文时均来自阿里巴巴文娱AI大脑北斗星团队)


AI阿里文娱AI大脑北斗星团队


通过大数据和AI挖掘用户需求,建立内容采买结构化评估、适配性选角、AI成片体检、排播、数字化宣发等能力,以支撑内容全生命周期辅助决策,从而达到为平台降本增效的目的。

相关文章
|
机器学习/深度学习 数据采集 编解码
优酷老片修复算法,超高清重温童年回忆
优酷老片修复算法,超高清重温童年回忆
548 0
优酷老片修复算法,超高清重温童年回忆
|
传感器 人工智能 算法
AI概述:阿里文娱智能算法的新应用
阿里巴巴文娱-智能算法的新应用方向
AI概述:阿里文娱智能算法的新应用
|
9月前
|
人工智能 自动驾驶 安全
破壁人AI百度:科技公司反内卷的典型样本
简介: 互联网整个行业都在陷入被动且尴尬的局面。去年开始流行的“内卷”一词,恰如其分的描述了互联网的现状,比如抖音开始做外卖,微信强推视频号,一直硝烟弥漫的电商市场,更是激战在社区团购上。内卷背后也有人感慨,互联网到了尽头。支撑这一论述的是,移动互联网的人口红利已经消失,几款国民型APP用户增长都固定在了10亿这个级别,只能依靠自然人口的增长和迁移。
破壁人AI百度:科技公司反内卷的典型样本
|
文字识别 自然语言处理 算法
CVPR 2022 | 关注文本阅读顺序,蚂蚁集团、上海交通大学提出多模态文档理解模型XYLayoutLM
CVPR 2022 | 关注文本阅读顺序,蚂蚁集团、上海交通大学提出多模态文档理解模型XYLayoutLM
296 0
|
人工智能 自然语言处理 数据可视化
ACL 2022 | 提升支付宝搜索体验,蚂蚁、北大提出基于层次化对比学习的文本生成框架
ACL 2022 | 提升支付宝搜索体验,蚂蚁、北大提出基于层次化对比学习的文本生成框架
259 0
|
机器学习/深度学习 Web App开发 自然语言处理
基于神经标签搜索,中科院&微软亚研零样本多语言抽取式摘要入选ACL 2022
基于神经标签搜索,中科院&微软亚研零样本多语言抽取式摘要入选ACL 2022
120 0
|
机器学习/深度学习 人工智能 自然语言处理
阿里巴巴资深算法专家张伟:百科类知识图谱构建和应用已到深水区,行业和多模态知识图谱引关注
知识图谱是近年来人工智能技术蓬勃发展的核心驱动力之一,已广泛应用在金融、电商、医疗、政务等众多领域,经过短短几年的发展,热度依旧不减,未来,知识图谱又将面临哪些新的挑战?又有哪些发展趋势呢?
|
9月前
|
小程序 JavaScript 前端开发
【经验分享】如何实现小程序代码热更新| 江海计划
【经验分享】如何实现小程序代码热更新| 江海计划
163 8
|
人工智能 算法 前端开发
优酷弹幕穿人「渲染技术」揭秘
优酷弹幕穿人「渲染技术」揭秘
507 0
优酷弹幕穿人「渲染技术」揭秘
|
机器学习/深度学习 存储 人工智能
【技术新趋势】面向图像文档的版面智能分析与理解
在OCR系统中,纸质文档被相机拍摄成文档图像后,首先要进行版面分析、版面理解,之后才能正式数字化为电子文档。本篇文章将关注面向文档图像的版面分析与理解方向,并讨论这些任务的目前的优秀技术和方法。
【技术新趋势】面向图像文档的版面智能分析与理解