【喜讯】阿里巴巴文娱生成式信息抽取论文中选ACL

简介: 是由国际计算语言学协会主办的自然语言处理领域最负盛名的顶级学术会议,每年举办一次,其接收的论文覆盖了对话系统、语义分析、摘要生成、信息抽取、问答系统、语言模型、机器翻译、情感计算、知识图谱等自然语言处理领域的众多研究方向。

文娱妹导读

ACL会议

Annual Meeting of the Association for Computational Linguistics

是由国际计算语言学协会主办的自然语言处理领域最负盛名的顶级学术会议,每年举办一次,其接收的论文覆盖了对话系统、语义分析、摘要生成、信息抽取、问答系统、语言模型、机器翻译、情感计算、知识图谱等自然语言处理领域的众多研究方向。



Seq2Path: Generating Sentiment Tuples as Paths of a Tree


论文简介

生成式信息抽取是近年来NLP领域的研究热点,由于其良好的表现以及end-to-end的特性已经成为了很多信息抽取相关任务的新范式。目前主流的Seq2Seq信息抽取框架面临多个元组(tuple)的情形时会在解码阶段强行引入tuple之间的序列约束,本文针对这一缺点,提出了一种Seq2Path的方法。具体来说,将每个需要识别的tuple视为树结构中的独立路径(path),在训练阶段拟合average loss over paths;在预测阶段,采用beam search with constrained decoding进行解码,并通过引入一个判别token来自动选择正确的path。本文以细粒度情感分析(ABSA)任务为例,在ABSA五个子任务对应的公开数据集上进行了实验,结果充分验证了本文方法的有效性。目前文本方法已经在阿里文娱大脑(北斗星)情感计算相关场景中得到了应用。


图片.png


作者


茅越

沈一

杨竞潮

朱晓颖

蔡龙军

(作者撰文时均来自阿里巴巴文娱AI大脑北斗星团队)


AI阿里文娱AI大脑北斗星团队


通过大数据和AI挖掘用户需求,建立内容采买结构化评估、适配性选角、AI成片体检、排播、数字化宣发等能力,以支撑内容全生命周期辅助决策,从而达到为平台降本增效的目的。

相关文章
|
2月前
|
人工智能 数据库
【科研技巧】如何判断某个期刊是什么类别及影响因子?是否是顶会?如何期刊内检索?AI写综述?AI做PPT?
本文提供了关于如何判断期刊类别、影响因子,识别顶级会议,以及在期刊内部进行检索的科研技巧,并探讨了AI技术在撰写综述和制作PPT方面的应用。
149 6
【科研技巧】如何判断某个期刊是什么类别及影响因子?是否是顶会?如何期刊内检索?AI写综述?AI做PPT?
|
3月前
|
存储 人工智能
深度解析RAG大模型知识冲突,清华西湖大学港中文联合发布
【7月更文挑战第27天】清华大学、西湖大学与香港中文大学联合发布的论文深入探讨了RAG(Retrieval-Augmented Generation)大模型在处理信息时遇到的知识冲突问题及其解决方案。RAG模型通过结合预训练语言模型与外部知识库生成准确内容,但会面临上下文记忆、上下文间及内部记忆冲突。研究提出了基于上下文感知的记忆管理、多上下文推理及知识选择权衡等方法来缓解这些问题。尽管取得了进展,但在计算资源需求、解决方案效果验证及模型鲁棒性等方面仍有挑战待克服。[论文](https://arxiv.org/abs/2403.08319)
99 3
|
机器学习/深度学习 JSON 自然语言处理
全国大数据与计算智能挑战赛:面向低资源的命名实体识别基线方案,排名13/64
全国大数据与计算智能挑战赛:面向低资源的命名实体识别baseline,排名13/64。第一名:0.68962791,基线:0.67902593 ,感兴趣小伙伴可以刷刷榜。 国防科技大学系统工程学院(大数据与决策实验室)
全国大数据与计算智能挑战赛:面向低资源的命名实体识别基线方案,排名13/64
|
存储 弹性计算 安全
星河杯“黑名单共享查询”赛题基于隐语实现baseline
星河杯“黑名单共享查询”赛题基于隐语实现baseline
288 0
|
机器学习/深度学习 数据采集 移动开发
覆盖四种场景、包含正负向反馈,腾讯、西湖大学等发布推荐系统公开数据集Tenrec(1)
覆盖四种场景、包含正负向反馈,腾讯、西湖大学等发布推荐系统公开数据集Tenrec
286 0
|
数据采集 机器学习/深度学习 搜索推荐
覆盖四种场景、包含正负向反馈,腾讯、西湖大学等发布推荐系统公开数据集Tenrec(2)
覆盖四种场景、包含正负向反馈,腾讯、西湖大学等发布推荐系统公开数据集Tenrec
191 0
|
文字识别 自然语言处理 算法
CVPR 2022 | 关注文本阅读顺序,蚂蚁集团、上海交通大学提出多模态文档理解模型XYLayoutLM
CVPR 2022 | 关注文本阅读顺序,蚂蚁集团、上海交通大学提出多模态文档理解模型XYLayoutLM
257 0
|
机器学习/深度学习 Web App开发 自然语言处理
基于神经标签搜索,中科院&微软亚研零样本多语言抽取式摘要入选ACL 2022
基于神经标签搜索,中科院&微软亚研零样本多语言抽取式摘要入选ACL 2022
|
SQL 存储 人工智能
多项榜单第一,达摩院算法工程师深度揭秘让表格说话的TableQA技术
多项榜单第一,达摩院算法工程师深度揭秘让表格说话的TableQA技术
161 0
|
机器学习/深度学习 算法 搜索推荐
CIKM论文解读 | 淘宝内容化推荐场景下对多场景全域表征的思考与应用
我们结合逛逛推荐场景中的具体问题,从多场景全域表征的视角进行了一系列的探索与内容推荐场景的应用,从全域表征的范围、信息迁移方式以及模型框架的应用等维度展开我们的优化工作,取得了阶段性的优化经验和业务效果。
833 0