【喜讯】阿里巴巴文娱生成式信息抽取论文中选ACL

简介: 是由国际计算语言学协会主办的自然语言处理领域最负盛名的顶级学术会议,每年举办一次,其接收的论文覆盖了对话系统、语义分析、摘要生成、信息抽取、问答系统、语言模型、机器翻译、情感计算、知识图谱等自然语言处理领域的众多研究方向。

文娱妹导读

ACL会议

Annual Meeting of the Association for Computational Linguistics

是由国际计算语言学协会主办的自然语言处理领域最负盛名的顶级学术会议,每年举办一次,其接收的论文覆盖了对话系统、语义分析、摘要生成、信息抽取、问答系统、语言模型、机器翻译、情感计算、知识图谱等自然语言处理领域的众多研究方向。



Seq2Path: Generating Sentiment Tuples as Paths of a Tree


论文简介

生成式信息抽取是近年来NLP领域的研究热点,由于其良好的表现以及end-to-end的特性已经成为了很多信息抽取相关任务的新范式。目前主流的Seq2Seq信息抽取框架面临多个元组(tuple)的情形时会在解码阶段强行引入tuple之间的序列约束,本文针对这一缺点,提出了一种Seq2Path的方法。具体来说,将每个需要识别的tuple视为树结构中的独立路径(path),在训练阶段拟合average loss over paths;在预测阶段,采用beam search with constrained decoding进行解码,并通过引入一个判别token来自动选择正确的path。本文以细粒度情感分析(ABSA)任务为例,在ABSA五个子任务对应的公开数据集上进行了实验,结果充分验证了本文方法的有效性。目前文本方法已经在阿里文娱大脑(北斗星)情感计算相关场景中得到了应用。


图片.png


作者


茅越

沈一

杨竞潮

朱晓颖

蔡龙军

(作者撰文时均来自阿里巴巴文娱AI大脑北斗星团队)


AI阿里文娱AI大脑北斗星团队


通过大数据和AI挖掘用户需求,建立内容采买结构化评估、适配性选角、AI成片体检、排播、数字化宣发等能力,以支撑内容全生命周期辅助决策,从而达到为平台降本增效的目的。

相关文章
|
Linux C语言
linux yum安装ffmpeg 图文详解
linux yum安装ffmpeg 图文详解
2272 0
|
3月前
|
存储 关系型数据库 Shell
CMP7(类Cloudera CDP 7 404版华为Kunpeng)用开源软件Label Studio做数据标注
Cloudera CMP 7 不直接提供数据标注功能,但可集成开源工具如 Label Studio、Doccano、LabelU 和 CVAT 实现多模态数据标注。推荐通过 CML 在私有云或公有云环境部署这些工具,结合 HDFS/S3 数据湖存储,构建端到端 AI/ML 标注与训练闭环,支持预标注、多人协作与企业级集成。
|
机器学习/深度学习 数据采集 编解码
优酷老片修复算法,超高清重温童年回忆
优酷老片修复算法,超高清重温童年回忆
777 0
优酷老片修复算法,超高清重温童年回忆
|
传感器 人工智能 算法
AI概述:阿里文娱智能算法的新应用
阿里巴巴文娱-智能算法的新应用方向
AI概述:阿里文娱智能算法的新应用
|
Ubuntu
Ubuntu20.04 编译安装FFmpeg,出错分析以及解决方案
通过上述步骤,可以在 Ubuntu 20.04 上成功编译和安装 FFmpeg。如果遇到问题,可以通过检查依赖包的安装情况以及 `config.log` 文件来解决。掌握这些技巧和解决方案,可以有效地解决编译过程中遇到的各种问题,提高安装成功率。
1345 13
|
机器学习/深度学习 人工智能 安全
千问团队开源会思考的QwQ模型,这模型成精了!
QwQ是由Qwen团队开发的大型语言模型,专注于增强AI的推理能力。此预览版本在数学和编程领域表现出色,但在其他领域仍有提升空间。模型具备深度自省和自我质疑的能力,通过逐步推理和假设检验,能够在复杂问题上取得突破性进展。QwQ不仅支持本地推理和Ollama直接运行,还提供了详细的微调指南,助力开发者根据特定需求定制模型。尽管QwQ在推理过程中存在语言切换和安全性等方面的局限性,Qwen团队仍致力于不断优化,推动模型向更高层次的智能迈进。[了解更多](https://modelscope.cn/studios/Qwen/QwQ-32B-preview)
3947 0
千问团队开源会思考的QwQ模型,这模型成精了!
|
关系型数据库 OLAP 分布式数据库
揭秘Polardb与OceanBase:从OLTP到OLAP,你的业务选对数据库了吗?热点技术对比,激发你的选择好奇心!
【8月更文挑战第22天】在数据库领域,阿里巴巴的Polardb与OceanBase各具特色。Polardb采用共享存储架构,分离计算与存储,适配高并发OLTP场景,如电商交易;OceanBase利用灵活的分布式架构,优化数据分布与处理,擅长OLAP分析及大规模数据管理。选择时需考量业务特性——Polardb适合事务密集型应用,而OceanBase则为数据分析提供强大支持。
4746 2
|
数据可视化 大数据 数据处理
大数据处理时的python和R语言
【5月更文挑战第5天】本文讨论了在语言Python 和R中数据处理时的框架,比如Python中的 OpenCV, Matplotlib, NumPy, Pandas, 和Seaborn。
268 1
大数据处理时的python和R语言
|
安全 API 分布式计算
“Dataphin功能tips”系列
hello,大家好: 为了更好地引导广大用户深入探索和高效利用Dataphin全方位的数据智能能力,我们特别推出“Dataphin功能小Tips”系列,旨在通过生动直观的场景描述与对应的功能应用方案,以简洁明快的语言呈现,力求让每一位用户都能轻松解锁Dataphin中的每一个实用功能点。 这一系列内容专为提升您的使用体验而设计,期待能为大家解决实际问题、优化数据管理工作带来切实的帮助,在此,我们也诚挚邀请所有用户积极参与互动,随时分享您宝贵的使用心得与建议。您的反馈将是我们不断迭代优化的重要动力!
766 0
|
人工智能 监控 搜索推荐
智能管理日常花销 — AI Coze打造个人财务小助手的全新体验(初版)(一)
智能管理日常花销 — AI Coze打造个人财务小助手的全新体验(初版)
802 0