【论文速递】ACL 2021-CasEE: 一种用于重叠事件抽取的级联解码联合学习框架-阿里云开发者社区

【论文速递】ACL 2021-CasEE: 一种用于重叠事件抽取的级联解码联合学习框架

2023-08-02 132

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【论文原文】：A Joint Learning Framework with Cascade Decoding for Overlapping Event Extraction

【论文原文】：A Joint Learning Framework with Cascade Decoding for Overlapping Event Extraction

【作者信息】：Sheng, Jiawei and Guo, Shu and Yu, Bowen and Li, Qian and Hei, Yiming and Wang, Lihong and Liu, Tingwen and Xu, Hongbo

论文：https://aclanthology.org/2021.findings-acl.14.pdf
代码：https://github.com/JiaweiSheng/CasEE

博主关键词：重叠事件抽取，联合学习，类型语义

推荐论文：无

摘要

事件抽取(Event extraction, EE)是一项重要的信息抽取任务，旨在抽取文本中的事件信息。现有方法大多假设事件出现在句子中没有重叠，这不适用于复杂的重叠事件抽取。本文系统地研究了现实事件重叠问题，即一个词可能作为多种类型的触发词或具有不同作用的论元。为了解决上述问题，我们提出了一种新的联合学习框架，该框架具有级联解码，用于重叠事件抽取，称为CasEE。具体而言，CasEE依次执行类型检测、触发词抽取和论元抽取，其中重叠的目标根据前者的特定预测分别抽取。所有子任务都在一个框架中联合学习，以捕获子任务之间的依赖关系。对公共事件抽取基准FewFC的评估表明，CasEE在重叠事件抽取方面比以前的竞争方法取得了显著改进。

1、简介

事件抽取(EE)是自然语言理解中一个重要而又具有挑战性的任务。给定一个句子，事件抽取系统应该识别句子中出现的事件类型、触发词和论元。作为一个例子，图1(b)展示了一个Share Reduction类型的事件，由“reduced”触发。有几种说法，如“Fuda Industry”在事件中发挥了“subject”作用。

然而，事件经常在句子中复杂地出现，其中触发词和论点可能在句子中有重叠。这个文章聚焦在一个具有挑战性和现实意义的问题:重叠事件抽取。一般来说，我们将所有重叠的情况分为三种模式**:1)一个词可以在多个事件中作为不同事件类型的触发词**。图1(a)显示了“获得(acquire)”的token同时触发投资(Investment)事件和股份转让(Share Transfer)事件。2)一个词可以作为论元，在多个事件中扮演不同的角色。图1(a)显示，“盛悦网络(Shengyue Network)”在投资事件中扮演客体(object)角色，在股权转让(Share Transfer)事件中扮演主体(subject)角色。3)一个词可以作为论元在一个事件中扮演不同的角色。从图1(b)可以看出，“福达实业(Fuda Industry)”在一个事件中既是主体(subject)角色，又是目标(object)角色。为简单起见，在下文中，我们将模式1)称为重叠触发词问题，将模式2)和模式3)称为重叠论元问题。在中国金融事件抽取数据集中，FewFC (Zhou et al, 2021)，约有13.5% / 21.7%的句子存在重叠的触发词/论元问题。

现有的大部分EE研究假设事件出现在句子中没有重叠，这并不适用于复杂的重叠场景。通常，目前的EE研究可以大致分为两个类别：1)传统联合方法(Nguyen等人, 2016;刘等人,2018;Nguyen和Nguyen, 2019)，通过统一的解码器同时抽取触发词和论元，并且只标记一次句子。然而，由于标签冲突，它们无法抽取重叠的目标，其中一个token可能有多个类型化标签，但只能分配一个标签。2)管道方法(Chen等人, 2015;Yang等人,2019;Du和Cardie, 2020b)，在不同的阶段依次抽取触发词和论元。Yang等人(2019)试图以管道方式解决重叠论元问题，但忽略了重叠触发词问题。然而，管道方法忽略了触发词和论元之间的特征级依赖关系，并受到错误传播的影响。据我们所知，现有的EE研究忽视了重叠问题或只关注一个重叠问题。很少有研究同时解决上述三种重叠模式。

为了解决上述问题，我们提出了CasEE，一种用于重叠事件抽取的Cascade解码联合学习框架。具体来说，CasEE通过一个共享的文本编码器和三个用于类型检测、触发词抽取和论元抽取的解码器来实现事件抽取。为了抽取跨事件的重叠目标，CasEE依次解码三个子任务，根据前者的预测进行触发词抽取和论元抽取。这种级联解码策略根据不同的条件抽取事件元素，使重叠的目标分阶段抽取。条件融合函数用于显式地模拟相邻子任务之间的依赖关系。所有的子任务解码器被联合学习，以进一步建立子任务之间的连接，从而通过下游子任务之间的特征级交互来改进共享文本编码器。

本文的贡献有三个方面:

(1)我们系统地研究了EE中的重叠问题，并将其分为三种模式。据我们所知，这篇论文是第一批同时处理所有三种重叠模式的论文之一。

(2)我们提出了一种新型的带有级联解码的联合学习框架CasEE，以同时解决所有三种重叠模式。

(3)我们在中国公开的金融事件抽取基准——FewFC上进行了实验。实验结果表明，与现有的竞争方法相比，CasEE在重叠事件抽取方面取得了显著的改进。

2、模型

图2展示了CasEE的细节。CasEE采用一个共享的BERT编码器来捕获文本特征，三个解码器用于类型检测、触发词抽取和论元抽取。由于与之前的管道方法相比，所有子任务都是联合学习的(Yang等人，2019;Li等人，2020)，CasEE可以捕获子任务之间的特征级依赖关系。对于预测，CasEE在级联解码过程中按顺序预测事件类型、触发词和论元。

3、实验结果

所有方法在FewFC数据集上的性能如表2所示。从表中可以看出:

(1)与联合序列标记方法相比，CasEE在F1分数上表现更好。CasEE在AC F1评分上分别比BERT-CRF提高4.5%和BERT-CRF-joint提高4.3%。此外，由于序列标记方法存在标签冲突，对于多标签token只能预测一个标签，CasEE在评价指标的召回率上有较高的结果。结果证明了CasEE在重叠事件抽取方面的有效性。

(2)与管道方法相比，我们的方法在F1分数上也优于管道方法。结果表明，与PLMEE相比，CasEE在TC和AC的F1评分上分别提高了3.1%和2.6%，说明解决EE重叠触发词问题的重要性。尽管基于MRC的基线可以抽取重叠的触发词和论元，但CasEE仍然取得更好的效果。具体来说，CasEE相对强基线MQAEE-2提高了4.1%。原因可能是CasEE共同学习子任务的文本表示，在子任务之间构建有用的交互和连接。结果表明，CasEE优于上述管线基线。

CasEE：全文阅读

【论文速递 | 精选】

论坛地址：https://bbs.csdn.net/forums/paper

【论文速递】ACL 2021-CasEE: 一种用于重叠事件抽取的级联解码联合学习框架

摘要

1、简介

2、模型

3、实验结果

【论文速递 | 精选】

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

【论文速递】ACL 2021-CasEE: 一种用于重叠事件抽取的级联解码联合学习框架

摘要

1、简介

2、模型

3、实验结果

【论文速递 | 精选】

热门文章

最新文章

相关课程

相关电子书

相关实验场景