MUSIED: A Benchmark for Event Detection from Multi-Source Heterogeneous Informal Texts 论文解读

简介: 事件检测(ED)从非结构化文本中识别和分类事件触发词,作为信息抽取的基本任务。尽管在过去几年中取得了显著进展

MUSIED: ABenchmark for Event Detection from Multi-Source Heterogeneous Informal Texts



论文:2211.13896.pdf (53yu.com)


代码:myeclipse/MUSIED: MUSIED: A Benchmark for Event Detection from Multi-Source Heterogeneous Informal Texts (github.com)


期刊/会议:Arxiv 2022


摘要


事件检测(ED)从非结构化文本中识别和分类事件触发词,作为信息抽取的基本任务。尽管在过去几年中取得了显著进展,但大多数研究工作都集中于从正式文本(例如新闻文章、维基百科文档、财务公告)中检测事件。此外,每个数据集中的文本要么来自单一来源,要么来自多个相对同类别的来源。随着大量用户生成的文本在网络和企业内部积累,在这些非正式文本中识别有意义的事件(通常来自多个不同来源)已成为一个具有重大实用价值的问题。作为将事件检测扩展到涉及非正式和异构文本的场景的开拓性探索,我们在领先的食品服务电子商务平台中,基于用户评论、文本对话和电话对话,提出了一个新的大规模中文事件检测数据集。我们通过定量和定性检查数据样本,仔细研究了所提出数据集的文本非正规性和多源异质性特征。使用最先进的事件检测方法进行的大量实验验证了这些特征带来的独特挑战,表明多源非正式事件检测仍然是一个开放的问题,需要进一步努力。


1、简介


现有的事件抽取工作存在两个问题:1、当前的工作主要是从正式的文本中进行事件检测,如ACE2005、MEAVEN(来自Wikipedia)等。2、目标事件相关文本要么来自单一来源,要么来自多个同质来源。


为了解决这两个问题,我们将事件检测扩展到涉及非正式和异构文本的场景。我们基于中国最受欢迎的食品服务电子商务平台美团构建了一个新的大规模中国事件检测数据集,该数据集为用户提供了多种反馈食品安全问题(事件)的方式,例如发布评论和与售后人员沟通。我们从三个典型场景中收集脱敏数据:i)用户发布评论,ii)用户通过短信与售后人员沟通,以及iii)用户通过电话与售后人员交流。通过抽取用户评论、文本对话和电话对话,我们创建了一个由多源异构非正式文本组成的大规模数据集,用于事件检测(MUSIDE)。


我们的贡献可以总结如下:


  • 我们通过精心策划一个新的大规模数据集,首次将事件检测扩展到涉及非正式和异构文本的场景。


  • 使用最先进的方法进行的广泛实验验证了文本非正规性和多源异质性特征带来的独特挑战,并指出了值得探索的多个有前途的方向。


2、事件检测定义


事件:涉及参与者的特定事件(地点、时间、主题、对象等)。事件提及:描述事件的短语或句子。事件触发词:最清楚地表达事件发生的主要单词或短语。事件类型:事件的语义类。


ED通常分为两个子任务:(1)触发词识别,旨在识别事件触发词。(2) 触发词分类,旨在将识别的触发词分类为预定义的类别。这两个子任务都以micro precision、recall和F1 score进行评估。


3、数据收集和标注


316b59ff4a3a47e79dd710235c47106e.png

fd600e331d384f3b8e28717ae35d2bed.png


该模式包含21种事件类型,广泛涵盖了用户对上述情况的反馈。


4、数据分析


c694fa92ffba4de083c45f5d6c621567.png

6c51ef13bd5b4a22853c2e3cd176c4ba.png

51c895d2bbdc436fb1cd0e223456c833.png


触发词偏长、多事件、多错字的特点。


5、实验


38ce21cd14df47268ef22b5d24d8d1e8.png


80e4bc2b6aa44fccb227a2dc7c1842f6.png

92d4b5e4074a4606a6927ab8db65da20.png

1e44fad4b92f4b4680b4c4efc7174bb7.png

78e6556cdf0b4661b3fed7c61587e517.png

7edd73ec7cab485ba00e13ae41f1c589.png


6、总结和未来工作


我们展示了MUSIED,这是一个用于事件检测的大规模多源异构非正式文本数据集,基于在线食品服务的用户评论、文本对话和电话对话。广泛的评估验证了文本非正规性和多源异质性特征带来的独特挑战。我们的深入研究提出了多个有前景的方向,包括利用文档级信息、多领域学习和领域适应。未来,我们有兴趣将MUSIED扩展到更多与事件相关的任务,如事件论元抽取。

有前景的方向,包括利用文档级信息、多领域学习和领域适应。未来,我们有兴趣将MUSIED扩展到更多与事件相关的任务,如事件论元抽取。

目录
相关文章
|
6月前
|
机器学习/深度学习 TensorFlow 算法框架/工具
MTCNN(Multi-task Cascaded Convolutional Networks)
MTCNN(Multi-task Cascaded Convolutional Networks)
119 0
|
数据挖掘
【提示学习】Automatic Multi-Label Prompting: Simple and Interpretable Few-Shot Classification
文章提出了一种简单确高效地构建verbalization的方法:
|
机器学习/深度学习 移动开发 自然语言处理
DEPPN:Document-level Event Extraction via Parallel Prediction Networks 论文解读
当在整个文档中描述事件时,文档级事件抽取(DEE)是必不可少的。我们认为,句子级抽取器不适合DEE任务,其中事件论元总是分散在句子中
142 0
DEPPN:Document-level Event Extraction via Parallel Prediction Networks 论文解读
|
机器学习/深度学习 自然语言处理 数据挖掘
UnifiedEAE: A Multi-Format Transfer Learning Model for Event Argument Extraction via Variational论文解读
事件论元抽取(Event argument extraction, EAE)旨在从文本中抽取具有特定角色的论元,在自然语言处理中已被广泛研究。
97 0
|
自然语言处理 算法
【论文精读】COLING 2022 - CLIO: Role-interactive Multi-event Head Attention Network for DEE
将网络上的大量非结构化文本转换为结构化事件知识是NLP的一个关键但尚未解决的目标,特别是在处理文档级文本时。
77 0
|
机器学习/深度学习 自然语言处理 数据可视化
M2E2: Cross-media Structured Common Space for Multimedia Event Extraction 论文解读
我们介绍了一个新的任务,多媒体事件抽取(M2E2),旨在从多媒体文档中抽取事件及其参数。我们开发了第一个基准测试
111 0
|
机器学习/深度学习 自然语言处理 索引
GTEE-DYNPREF: Dynamic Prefix-Tuning for Generative Template-based Event Extraction 论文解读
我们以基于模板的条件生成的生成方式考虑事件抽取。尽管将事件抽取任务转换为带有提示的序列生成问题的趋势正在上升,但这些基于生成的方法存在两个重大挑战
150 0
|
自然语言处理 算法 知识图谱
DEGREE: A Data-Efficient Generation-Based Event Extraction Model论文解读
事件抽取需要专家进行高质量的人工标注,这通常很昂贵。因此,学习一个仅用少数标记示例就能训练的数据高效事件抽取模型已成为一个至关重要的挑战。
169 0
|
机器学习/深度学习 自然语言处理 搜索推荐
TSAR: A Two-Stream AMR-enhanced Model for Document-level Event Argument Extraction论文解读
以往的研究大多致力于从单个句子中抽取事件,而文档级别的事件抽取仍未得到充分的研究。在本文中,我们专注于从整个文档中抽取事件论元
214 0
|
机器学习/深度学习 自然语言处理 计算机视觉
【计算机视觉】MDETR - Modulated Detection for End-to-End Multi-Modal Understanding
对于图像模型,MDETR采用的是一个CNN backbone来提取视觉特征,然后加上二维的位置编码;对于语言模态,作者采用了一个预训练好的Transformer语言模型来生成与输入值相同大小的hidden state。然后作者采用了一个模态相关的Linear Projection将图像和文本特征映射到一个共享的embedding空间。 接着,将图像embedding和语言embedding进行concat,生成一个样本的图像和文本特征序列。这个序列特征首先被送入到一个Cross Encoder进行处理,后面的步骤就和DETR一样,设置Object Query用于预测目标框。