MUSIED: A Benchmark for Event Detection from Multi-Source Heterogeneous Informal Texts 论文解读

简介: 事件检测(ED)从非结构化文本中识别和分类事件触发词,作为信息抽取的基本任务。尽管在过去几年中取得了显著进展

MUSIED: ABenchmark for Event Detection from Multi-Source Heterogeneous Informal Texts



论文:2211.13896.pdf (53yu.com)


代码:myeclipse/MUSIED: MUSIED: A Benchmark for Event Detection from Multi-Source Heterogeneous Informal Texts (github.com)


期刊/会议:Arxiv 2022


摘要


事件检测(ED)从非结构化文本中识别和分类事件触发词,作为信息抽取的基本任务。尽管在过去几年中取得了显著进展,但大多数研究工作都集中于从正式文本(例如新闻文章、维基百科文档、财务公告)中检测事件。此外,每个数据集中的文本要么来自单一来源,要么来自多个相对同类别的来源。随着大量用户生成的文本在网络和企业内部积累,在这些非正式文本中识别有意义的事件(通常来自多个不同来源)已成为一个具有重大实用价值的问题。作为将事件检测扩展到涉及非正式和异构文本的场景的开拓性探索,我们在领先的食品服务电子商务平台中,基于用户评论、文本对话和电话对话,提出了一个新的大规模中文事件检测数据集。我们通过定量和定性检查数据样本,仔细研究了所提出数据集的文本非正规性和多源异质性特征。使用最先进的事件检测方法进行的大量实验验证了这些特征带来的独特挑战,表明多源非正式事件检测仍然是一个开放的问题,需要进一步努力。


1、简介


现有的事件抽取工作存在两个问题:1、当前的工作主要是从正式的文本中进行事件检测,如ACE2005、MEAVEN(来自Wikipedia)等。2、目标事件相关文本要么来自单一来源,要么来自多个同质来源。


为了解决这两个问题,我们将事件检测扩展到涉及非正式和异构文本的场景。我们基于中国最受欢迎的食品服务电子商务平台美团构建了一个新的大规模中国事件检测数据集,该数据集为用户提供了多种反馈食品安全问题(事件)的方式,例如发布评论和与售后人员沟通。我们从三个典型场景中收集脱敏数据:i)用户发布评论,ii)用户通过短信与售后人员沟通,以及iii)用户通过电话与售后人员交流。通过抽取用户评论、文本对话和电话对话,我们创建了一个由多源异构非正式文本组成的大规模数据集,用于事件检测(MUSIDE)。


我们的贡献可以总结如下:


  • 我们通过精心策划一个新的大规模数据集,首次将事件检测扩展到涉及非正式和异构文本的场景。


  • 使用最先进的方法进行的广泛实验验证了文本非正规性和多源异质性特征带来的独特挑战,并指出了值得探索的多个有前途的方向。


2、事件检测定义


事件:涉及参与者的特定事件(地点、时间、主题、对象等)。事件提及:描述事件的短语或句子。事件触发词:最清楚地表达事件发生的主要单词或短语。事件类型:事件的语义类。


ED通常分为两个子任务:(1)触发词识别,旨在识别事件触发词。(2) 触发词分类,旨在将识别的触发词分类为预定义的类别。这两个子任务都以micro precision、recall和F1 score进行评估。


3、数据收集和标注


316b59ff4a3a47e79dd710235c47106e.png

fd600e331d384f3b8e28717ae35d2bed.png


该模式包含21种事件类型,广泛涵盖了用户对上述情况的反馈。


4、数据分析


c694fa92ffba4de083c45f5d6c621567.png

6c51ef13bd5b4a22853c2e3cd176c4ba.png

51c895d2bbdc436fb1cd0e223456c833.png


触发词偏长、多事件、多错字的特点。


5、实验


38ce21cd14df47268ef22b5d24d8d1e8.png


80e4bc2b6aa44fccb227a2dc7c1842f6.png

92d4b5e4074a4606a6927ab8db65da20.png

1e44fad4b92f4b4680b4c4efc7174bb7.png

78e6556cdf0b4661b3fed7c61587e517.png

7edd73ec7cab485ba00e13ae41f1c589.png


6、总结和未来工作


我们展示了MUSIED,这是一个用于事件检测的大规模多源异构非正式文本数据集,基于在线食品服务的用户评论、文本对话和电话对话。广泛的评估验证了文本非正规性和多源异质性特征带来的独特挑战。我们的深入研究提出了多个有前景的方向,包括利用文档级信息、多领域学习和领域适应。未来,我们有兴趣将MUSIED扩展到更多与事件相关的任务,如事件论元抽取。

有前景的方向,包括利用文档级信息、多领域学习和领域适应。未来,我们有兴趣将MUSIED扩展到更多与事件相关的任务,如事件论元抽取。

目录
相关文章
|
6月前
|
传感器 机器学习/深度学习 人工智能
从“手环”到“健康顾问”:可穿戴设备背后的数据魔法
从“手环”到“健康顾问”:可穿戴设备背后的数据魔法
394 10
从“手环”到“健康顾问”:可穿戴设备背后的数据魔法
|
5月前
|
人工智能 自然语言处理 语音技术
|
5月前
|
Linux 程序员 API
CentOS如何使用Pthread线程库
这就是在CentOS下使用Pthread线程库的全过程。可见,即使是复杂的并发编程,只要掌握了基本的知识与工具,就能够游刃有余。让我们积极拥抱并发编程的魅力,编写出高效且健壮的代码吧!
105 11
|
12月前
|
人工智能 NoSQL 机器人
MongoDB Atlas与YoMio.AI近乎完美适配:推理更快速、查询更灵活、场景更丰富
随着MongoDB的新发布和革新,YoMio.AI的“闪电式发展”值得期待。
|
12月前
|
缓存 算法 JavaScript
纯函数在实际开发中的应用场景有哪些
纯函数在实际开发中广泛应用,如React等框架的状态管理、数据处理和验证、缓存机制等,因其无副作用、可预测性及易于测试的特点,提升了代码的可靠性和维护性。
|
7月前
|
Java 关系型数据库 MySQL
weixin050高校体育场管理系统+ssm(文档+源码)_kaic
本文针对高校体育场管理系统的开发与实现进行详细介绍。随着经济快速发展,人们对手机软件需求增加,高校体育场管理系统应运而生。系统采用JAVA技术、Mysql数据库和SSM框架等成熟技术,通过分析功能需求、可行性及性能,设计出包含管理员、用户和学生角色的功能模块。系统实现用户注册登录、信息管理等功能,简化传统手工统计模式,提高管理效率,满足用户对信息获取的及时性与准确性需求。
weixin050高校体育场管理系统+ssm(文档+源码)_kaic
|
8月前
|
机器学习/深度学习 计算机视觉 索引
YOLOv11改进策略【Conv和Transformer】| ECCV-2024 Histogram Transformer 直方图自注意力 适用于噪声大,图像质量低的检测任务
YOLOv11改进策略【Conv和Transformer】| ECCV-2024 Histogram Transformer 直方图自注意力 适用于噪声大,图像质量低的检测任务
386 9
YOLOv11改进策略【Conv和Transformer】| ECCV-2024 Histogram Transformer 直方图自注意力 适用于噪声大,图像质量低的检测任务
|
8月前
|
存储 机器学习/深度学习 网络协议
阿里云企业级ARM计算规格族简介:特点、场景与价格参考
Arm计算是指基于 ARM 架构的处理器进行的计算,本文将为您解析阿里云ARM云服务器的特点、适用场景,以及最新价格情况,以供了解和参考。
|
9月前
|
开发工具 数据安全/隐私保护 git
GPG 101
本文介绍了GPG(GnuPG)的基本使用方法,GPG是OpenPGP标准的完整免费实现,支持数据加密和签名。文章涵盖GPG的基础概念、安装、密钥生成与管理、导出与导入、签名与验证、加密与解密以及Git配置等内容。特别提醒不要上传任何信息到公共密钥服务器,以免造成安全隐患。更多详细内容请参考我的博客:[gpg-101](https://blog.timerring.com/posts/gpg-101)。
234 6
|
8月前
|
测试技术
新年第一弹!全新的过程奖励模型PRM开源
新年第一弹!全新的过程奖励模型PRM开源