【论文速递】ACL 2021-CasEE: 一种用于重叠事件抽取的级联解码联合学习框架

简介: 【论文原文】:A Joint Learning Framework with Cascade Decoding for Overlapping Event Extraction

【论文原文】:A Joint Learning Framework with Cascade Decoding for Overlapping Event Extraction


【作者信息】:Sheng, Jiawei and Guo, Shu and Yu, Bowen and Li, Qian and Hei, Yiming and Wang, Lihong and Liu, Tingwen and Xu, Hongbo


论文:https://aclanthology.org/2021.findings-acl.14.pdf
代码:https://github.com/JiaweiSheng/CasEE


博主关键词:重叠事件抽取,联合学习,类型语义


推荐论文:无


摘要


事件抽取(Event extraction, EE)是一项重要的信息抽取任务,旨在抽取文本中的事件信息。现有方法大多假设事件出现在句子中没有重叠,这不适用于复杂的重叠事件抽取。本文系统地研究了现实事件重叠问题,即一个词可能作为多种类型的触发词或具有不同作用的论元。为了解决上述问题,我们提出了一种新的联合学习框架,该框架具有级联解码,用于重叠事件抽取,称为CasEE。具体而言,CasEE依次执行类型检测、触发词抽取和论元抽取,其中重叠的目标根据前者的特定预测分别抽取。所有子任务都在一个框架中联合学习,以捕获子任务之间的依赖关系。对公共事件抽取基准FewFC的评估表明,CasEE在重叠事件抽取方面比以前的竞争方法取得了显著改进。


1、简介


事件抽取(EE)是自然语言理解中一个重要而又具有挑战性的任务。给定一个句子,事件抽取系统应该识别句子中出现的事件类型、触发词和论元。作为一个例子,图1(b)展示了一个Share Reduction类型的事件,由“reduced”触发。有几种说法,如“Fuda Industry”在事件中发挥了“subject”作用。


然而,事件经常在句子中复杂地出现,其中触发词和论点可能在句子中有重叠。这个文章聚焦在一个具有挑战性和现实意义的问题:重叠事件抽取。一般来说,我们将所有重叠的情况分为三种模式**:1)一个词可以在多个事件中作为不同事件类型的触发词**。图1(a)显示了“获得(acquire)”的token同时触发投资(Investment)事件和股份转让(Share Transfer)事件。2)一个词可以作为论元,在多个事件中扮演不同的角色。图1(a)显示,“盛悦网络(Shengyue Network)”在投资事件中扮演客体(object)角色,在股权转让(Share Transfer)事件中扮演主体(subject)角色。3)一个词可以作为论元在一个事件中扮演不同的角色。从图1(b)可以看出,“福达实业(Fuda Industry)”在一个事件中既是主体(subject)角色,又是目标(object)角色。为简单起见,在下文中,我们将模式1)称为重叠触发词问题,将模式2)和模式3)称为重叠论元问题。在中国金融事件抽取数据集中,FewFC (Zhou et al, 2021),约有13.5% / 21.7%的句子存在重叠的触发词/论元问题。


c38d8cebd06e43019e839268e46a353e.png


现有的大部分EE研究假设事件出现在句子中没有重叠,这并不适用于复杂的重叠场景。通常,目前的EE研究可以大致分为两个类别:1)传统联合方法(Nguyen等人, 2016;刘等人,2018;Nguyen和Nguyen, 2019),通过统一的解码器同时抽取触发词和论元,并且只标记一次句子。然而,由于标签冲突,它们无法抽取重叠的目标,其中一个token可能有多个类型化标签,但只能分配一个标签。2)管道方法(Chen等人, 2015;Yang等人,2019;Du和Cardie, 2020b),在不同的阶段依次抽取触发词和论元。Yang等人(2019)试图以管道方式解决重叠论元问题,但忽略了重叠触发词问题。然而,管道方法忽略了触发词和论元之间的特征级依赖关系,并受到错误传播的影响。据我们所知,现有的EE研究忽视了重叠问题或只关注一个重叠问题。很少有研究同时解决上述三种重叠模式。


为了解决上述问题,我们提出了CasEE,一种用于重叠事件抽取的Cascade解码联合学习框架。具体来说,CasEE通过一个共享的文本编码器和三个用于类型检测、触发词抽取和论元抽取的解码器来实现事件抽取。为了抽取跨事件的重叠目标,CasEE依次解码三个子任务,根据前者的预测进行触发词抽取和论元抽取。这种级联解码策略根据不同的条件抽取事件元素,使重叠的目标分阶段抽取。条件融合函数用于显式地模拟相邻子任务之间的依赖关系。所有的子任务解码器被联合学习,以进一步建立子任务之间的连接,从而通过下游子任务之间的特征级交互来改进共享文本编码器。


本文的贡献有三个方面:


(1)我们系统地研究了EE中的重叠问题,并将其分为三种模式。据我们所知,这篇论文是第一批同时处理所有三种重叠模式的论文之一。


(2)我们提出了一种新型的带有级联解码的联合学习框架CasEE,以同时解决所有三种重叠模式。


(3)我们在中国公开的金融事件抽取基准——FewFC上进行了实验。实验结果表明,与现有的竞争方法相比,CasEE在重叠事件抽取方面取得了显著的改进。


2、模型


caf21eef4ea148cfbc8b2a73b974323e.png


图2展示了CasEE的细节。CasEE采用一个共享的BERT编码器来捕获文本特征,三个解码器用于类型检测、触发词抽取和论元抽取。由于与之前的管道方法相比,所有子任务都是联合学习的(Yang等人,2019;Li等人,2020),CasEE可以捕获子任务之间的特征级依赖关系。对于预测,CasEE在级联解码过程中按顺序预测事件类型、触发词和论元。


3、实验结果


61326e0fedc74f9bb6fd330623d04265.png


所有方法在FewFC数据集上的性能如表2所示。从表中可以看出:


(1)与联合序列标记方法相比,CasEE在F1分数上表现更好。CasEE在AC F1评分上分别比BERT-CRF提高4.5%和BERT-CRF-joint提高4.3%。此外,由于序列标记方法存在标签冲突,对于多标签token只能预测一个标签,CasEE在评价指标的召回率上有较高的结果。结果证明了CasEE在重叠事件抽取方面的有效性。


(2)与管道方法相比,我们的方法在F1分数上也优于管道方法。结果表明,与PLMEE相比,CasEE在TC和AC的F1评分上分别提高了3.1%和2.6%,说明解决EE重叠触发词问题的重要性。尽管基于MRC的基线可以抽取重叠的触发词和论元,但CasEE仍然取得更好的效果。具体来说,CasEE相对强基线MQAEE-2提高了4.1%。原因可能是CasEE共同学习子任务的文本表示,在子任务之间构建有用的交互和连接。结果表明,CasEE优于上述管线基线。


CasEE:全文阅读


【论文速递 | 精选】


fcc8fa9f87404652beb9e08a0ac9652d.png


论坛地址:https://bbs.csdn.net/forums/paper

目录
相关文章
|
12天前
|
机器学习/深度学习 人工智能 自然语言处理
LEC: 基于Transformer中间层隐藏状态的高效特征提取与内容安全分类方法
通过利用Transformer中间层的隐藏状态,研究提出了层增强分类(LEC)技术,该技术能够以极少的训练样本和参数实现高效的内容安全和提示注入攻击分类,显著提升了模型的性能,并验证了其跨架构和领域的泛化能力。
55 11
LEC: 基于Transformer中间层隐藏状态的高效特征提取与内容安全分类方法
|
8月前
|
机器学习/深度学习 计算机视觉 网络架构
【FCN】端到端式语义分割的开篇之作! 从中窥探后续语义分割网络的核心模块(一)
【FCN】端到端式语义分割的开篇之作! 从中窥探后续语义分割网络的核心模块(一)
454 0
【FCN】端到端式语义分割的开篇之作! 从中窥探后续语义分割网络的核心模块(一)
|
机器学习/深度学习 自然语言处理 测试技术
【论文速递】ACL 2020 - 多媒体事件抽取的跨媒体结构化公共空间
我们介绍了一个新的任务,多媒体事件抽取(M2E2),旨在从多媒体文档中抽取事件及其参数。我们开发了第一个基准测试
127 0
|
8月前
|
机器学习/深度学习 人工智能 自然语言处理
【论文精读】AAAI 2022- 统一的命名实体识别作为词与词之间的关系分类
【论文精读】AAAI 2022- 统一的命名实体识别作为词与词之间的关系分类
【论文精读】AAAI 2022- 统一的命名实体识别作为词与词之间的关系分类
|
机器学习/深度学习 传感器 编解码
万字长文 | 多目标跟踪最新综述(基于Transformer/图模型/检测和关联/孪生网络)(上)
随着自动驾驶技术的发展,多目标跟踪已成为计算机视觉领域研究的热点问题之一。MOT 是一项关键的视觉任务,可以解决不同的问题,例如拥挤场景中的遮挡、相似外观、小目标检测困难、ID切换等。为了应对这些挑战,研究人员尝试利用transformer的注意力机制、利用图卷积神经网络获得轨迹的相关性、不同帧中目标与siamese网络的外观相似性,还尝试了基于简单 IOU 匹配的 CNN 网络、运动预测的 LSTM。为了把这些分散的技术综合起来,作者研究了过去三年中的一百多篇论文,试图提取出近年来研究者们更加关注的解决 MOT 问题的技术。
万字长文 | 多目标跟踪最新综述(基于Transformer/图模型/检测和关联/孪生网络)(上)
|
8月前
|
自然语言处理 算法
【论文精读】COLING 2022 - CLIO: 用于文档级事件抽取的角色交互多事件头注意力网络
【论文精读】COLING 2022 - CLIO: 用于文档级事件抽取的角色交互多事件头注意力网络
|
机器学习/深度学习 自然语言处理
【论文速递】ACL 2022 - 查询和抽取:将事件抽取细化为面向类型的二元解码
事件抽取通常被建模为一个多分类问题,其中事件类型和论元角色被视为原子符号。这些方法通常仅限于一组预定义的类型。
150 1
|
机器学习/深度学习 自然语言处理 BI
FourIE:基于图卷积网络的跨任务实例表征交互和标签依赖的联合信息抽取模型
现有的信息抽取(IE)工作主要是分别解决四个主要任务(实体提及识别、关系抽取、事件触发词检测和论元抽取),无法从任务之间的相互依赖中获益。
127 2
|
机器学习/深度学习 人工智能 自然语言处理
GraphIE:通过建模实例间和标签间依赖性联合抽取实体、关系和事件 论文解读
事件触发词检测、实体提及识别、事件论元抽取和关系抽取是信息抽取中的四个重要任务,它们被联合执行(联合信息抽取- JointIE),以避免错误传播并利用任务实例之间的依赖关系
205 1
|
机器学习/深度学习 自然语言处理 文字识别
探索图像数据中的隐藏信息:语义实体识别和关系抽取的奇妙之旅
探索图像数据中的隐藏信息:语义实体识别和关系抽取的奇妙之旅