【喜讯】阿里巴巴文娱生成式信息抽取论文中选ACL

简介: 是由国际计算语言学协会主办的自然语言处理领域最负盛名的顶级学术会议,每年举办一次,其接收的论文覆盖了对话系统、语义分析、摘要生成、信息抽取、问答系统、语言模型、机器翻译、情感计算、知识图谱等自然语言处理领域的众多研究方向。

文娱妹导读

ACL会议

Annual Meeting of the Association for Computational Linguistics

是由国际计算语言学协会主办的自然语言处理领域最负盛名的顶级学术会议,每年举办一次,其接收的论文覆盖了对话系统、语义分析、摘要生成、信息抽取、问答系统、语言模型、机器翻译、情感计算、知识图谱等自然语言处理领域的众多研究方向。



Seq2Path: Generating Sentiment Tuples as Paths of a Tree


论文简介

生成式信息抽取是近年来NLP领域的研究热点,由于其良好的表现以及end-to-end的特性已经成为了很多信息抽取相关任务的新范式。目前主流的Seq2Seq信息抽取框架面临多个元组(tuple)的情形时会在解码阶段强行引入tuple之间的序列约束,本文针对这一缺点,提出了一种Seq2Path的方法。具体来说,将每个需要识别的tuple视为树结构中的独立路径(path),在训练阶段拟合average loss over paths;在预测阶段,采用beam search with constrained decoding进行解码,并通过引入一个判别token来自动选择正确的path。本文以细粒度情感分析(ABSA)任务为例,在ABSA五个子任务对应的公开数据集上进行了实验,结果充分验证了本文方法的有效性。目前文本方法已经在阿里文娱大脑(北斗星)情感计算相关场景中得到了应用。


图片.png


作者


茅越

沈一

杨竞潮

朱晓颖

蔡龙军

(作者撰文时均来自阿里巴巴文娱AI大脑北斗星团队)


AI阿里文娱AI大脑北斗星团队


通过大数据和AI挖掘用户需求,建立内容采买结构化评估、适配性选角、AI成片体检、排播、数字化宣发等能力,以支撑内容全生命周期辅助决策,从而达到为平台降本增效的目的。

相关文章
|
3月前
|
机器学习/深度学习 人工智能 算法
AIGC著作权归属谁?国内“AI文生图第一案”这样判决
【1月更文挑战第14天】AIGC著作权归属谁?国内“AI文生图第一案”这样判决
68 2
AIGC著作权归属谁?国内“AI文生图第一案”这样判决
|
8月前
|
人工智能 达摩院
社区供稿 | 达摩院多模态对话大模型猫头鹰mPLUG-Owl大升级,登顶MMBench
近日,在上海人工智能实验室发布的多模态大模型榜单MMBench中,来自达摩院的mPLUG-Owl 超过MiniGPT4,LLaVA,VisualGLM等14个多模态大模型,登顶榜首。目前,mPLUG-Owl最新的预训练,SFT模型都已在ModelScope开源,欢迎大家体验。
|
11月前
|
数据采集 机器学习/深度学习 搜索推荐
覆盖四种场景、包含正负向反馈,腾讯、西湖大学等发布推荐系统公开数据集Tenrec(2)
覆盖四种场景、包含正负向反馈,腾讯、西湖大学等发布推荐系统公开数据集Tenrec
132 0
|
11月前
|
机器学习/深度学习 数据采集 移动开发
覆盖四种场景、包含正负向反馈,腾讯、西湖大学等发布推荐系统公开数据集Tenrec(1)
覆盖四种场景、包含正负向反馈,腾讯、西湖大学等发布推荐系统公开数据集Tenrec
164 0
|
11月前
|
文字识别 自然语言处理 算法
CVPR 2022 | 关注文本阅读顺序,蚂蚁集团、上海交通大学提出多模态文档理解模型XYLayoutLM
CVPR 2022 | 关注文本阅读顺序,蚂蚁集团、上海交通大学提出多模态文档理解模型XYLayoutLM
177 0
|
11月前
|
人工智能 自然语言处理 数据可视化
ACL 2022 | 提升支付宝搜索体验,蚂蚁、北大提出基于层次化对比学习的文本生成框架
ACL 2022 | 提升支付宝搜索体验,蚂蚁、北大提出基于层次化对比学习的文本生成框架
181 0
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
ACL 2022 | 腾讯QQ浏览器实验室提出文本语义匹配训练策略,与PLM结合效率不减
ACL 2022 | 腾讯QQ浏览器实验室提出文本语义匹配训练策略,与PLM结合效率不减
100 0
|
11月前
|
SQL 存储 人工智能
多项榜单第一,达摩院算法工程师深度揭秘让表格说话的TableQA技术
多项榜单第一,达摩院算法工程师深度揭秘让表格说话的TableQA技术
119 0
|
11月前
|
机器学习/深度学习 算法 搜索推荐
CIKM论文解读 | 淘宝内容化推荐场景下对多场景全域表征的思考与应用
我们结合逛逛推荐场景中的具体问题,从多场景全域表征的视角进行了一系列的探索与内容推荐场景的应用,从全域表征的范围、信息迁移方式以及模型框架的应用等维度展开我们的优化工作,取得了阶段性的优化经验和业务效果。
400 0
|
存储
ICCV2021 | 快手联合北大提出多层次对比学习的跨模态检索方法
近年来,互联网环境中的多媒体内容大量增加,如何通过视频文本相互检索,提升用户获取信息的效率,满足不同的用户对多媒体内容的消费需求变得异常重要。随着短视频内容社区的兴起,多媒体内容的创作门槛变低,UGC 内容成为主流,视频文本检索任务面临更加复杂和困难的挑战。本文针对视频文本检索任务提出层次化对比学习的跨模态检索思路,实现了更加高效且精准的视频文本检索方法,目前该论文已经被 ICCV2021 接收。
285 0
ICCV2021 | 快手联合北大提出多层次对比学习的跨模态检索方法