【论文速递】ACL 2022 - Prompt for Extraction? PAIE: Prompting Argument Interaction for Event Argument Extr

简介: 在本文中,我们提出了一个既有效又高效的模型PAIE,用于句子级和文档级的事件论元抽取(EAE),即使在缺乏训练数据的情况下也能很好地泛化。一方面,PAIE利用抽取目标的提示调优,以充分利用预训练语言模型(PLMs)的优势。

【论文原文】:Prompt for Extraction? PAIE: Prompting Argument Interaction for Event Argument Extraction


【作者信息】:


论文:https://aclanthology.org/2022.acl-long.466.pdf
代码:https://github.com/mayubo2333/PAIE


博主关键词:Ma, Yubo and Wang, Zehao and Cao, Yixin and Li, Mukai and Chen, Meiqi and Wang, Kun and Shao, Jing


推荐论文:无


摘要


在本文中,我们提出了一个既有效又高效的模型PAIE,用于句子级和文档级的事件论元抽取(EAE),即使在缺乏训练数据的情况下也能很好地泛化。一方面,PAIE利用抽取目标的提示调优,以充分利用预训练语言模型(PLMs)的优势。它根据提示在每个角色的输入文本中选择开始/结束标记,引入了两个span选择器。另一方面,它通过多角色提示捕获论元交互,并通过二部匹配损失进行最优跨度分配的联合优化。此外,通过灵活的提示设计,PAIE可以抽取具有相同角色的多个论元,而不是传统的启发式阈值调优。我们在三个基准上进行了广泛的实验,包括句子级和文档级EAE。结果显示,与PAIE相比有了很大的改善(在三个基准上,PAIE-base和PAIE-large的F1平均涨幅分别为3.5%和2.3%)。进一步的分析证明了不同抽取提示调优策略的效率、对少样本设置的泛化和有效性。


1、简介


通过识别事件和论元来理解文本一直是自然语言处理(NLP)的长期目标(Sundheim, 1992)。如图1所示,我们可以很快地理解该文档谈论的是一个Sell事件,有四个涉及的论元,即Vivendi (Seller)、Universal Studios (Artifact)、parks (Artifact)和company (Artifact),其中论元角色在括号中。由于事件检测近年来取得了巨大的成功(Wang et al, 2021),主要的挑战在于事件论元抽取(EAE)。


effa66dfa8ed495bad1e9a584460d9fe.png


典型的EAE工作可以大致分为两类。第一种方法将其表述为语义角色标签问题(Wei等人,2021)。通常有两个步骤——首先确定候选论元范围,然后对它们的角色进行分类。虽然提出了联合模型来共同优化它们,但对候选对象的高度依赖仍然可能受到误差传播的影响(Li et al, 2013)。在第二种方法中,最近的研究倾向于受预训练语言模型(PLMs)的启发,并通过**问答(QA)**解决EAE (Liu et al, 2021a;Wei等,2021;Du和Cardie, 2020;刘等,2020;Li等人,2020)和文本生成(Lu等人,2021;Li et al, 2021)。基于QA的模型可以有效地识别针对特定角色问题的论元边界,而预测则需要逐个进行。基于生成的方法对于生成所有论元是有效的,但是顺序预测会降低长距离和更多论元的性能。此外,最先进的性能仍然不尽人意(约68% F1在ACE2005数据集上)。这里提出了一个有趣的问题,有没有办法将上述方法的优点结合起来,同时提高性能?


本文针对真实场景,要求EAE模型在句子和文档级别上都有效且高效,甚至在没有足够训练数据的少样本设置下。为此,我们强调以下问题:


  • 如何同时抽取所有论元以提高效率?
  • 如何有效地捕捉长文本的论元交互,而不事先知道它们?
  • 我们如何从PLMs中引出更多的知识来降低标注的需求?


在本文中,我们研究了抽取设置下的提示微调,并提出了一种新的方法PAIE,即用于EAE的提示论元交互。它扩展了基于QA的模型来处理多论元抽取,同时充分利用了PLMs的优势。基本思想是设计合适的模板来提示PLM的所有论元角色,并获得特定角色的查询,以共同从文本中选择最佳范围。因此,模板中的每个角色都充当交互的插槽,而不是不可用的论元,在学习过程中,PLM倾向于通过匹配损失用精确的论元填充这些插槽。通过一起预测论元,PAIE享有高效和有效的学习过程。此外,相似角色提示之间的事件间知识迁移,减轻了标注成本的沉重负担。


具体来说,对于提示抽取,我们设计了两个基于角色提示的span选择器,用于在输入文本中选择开始/结束标记。我们将探讨三种类型的提示:手动模板、串联模板和软提示。它们在句子级EAE (S-EAE)和文档级EAE (D-EAE)方面都表现良好,并简化了穷举提示设计的要求。对于联合跨度的选择,我们设计了一种二部匹配损失,使预测与ground truth之间的匹配成本最小,使每个论元都能找到最优的角色提示。它还可以通过灵活的角色提示来处理具有相同角色的多个论元,而不是启发式阈值调优。我们将我们的贡献总结如下:


  • 我们提出了一个新的模型PAIE,该模型对S-EAE和D-EAE都是有效和高效的,并且对少样本设置具有鲁棒性。


  • 我们制定和研究在抽取设置下的提示调优,与最佳跨度分配的联合选择方案。


  • 我们在三个基准上进行了广泛的实验。结果表明,使用PAIE有很好的改善效果(基本模型和大模型的F1平均增益分别为3.5%和2.3%)。进一步的消融研究证明了我们提出的模型的效率和泛化到少样本设置,以及提示调整抽取的有效性。


2、方法


PAIE考虑多个论元及其相互作用,以提示PLM进行联合抽取。如图2所示,我们的模型包含三个核心组件:提示创建、跨度选择器解码和跨度预测。在下面的部分中,我们将首先制定抽取提示符,并依次描述每个组件。


9492b1bc44214b7ba7c97c592e7bfcbc.png


3、实验


本节将围绕以下几个问题进行求解:


  • PAIE能否更好地利用PLMs进行联合抽取来提高S-EAE和D-EAE的性能?
  • 不同的快速训练策略如何影响结果?
  • PAIE在各种实际设置中表现如何,包括在少样本、远距离和多论元的效率和泛化效果?


d72b76f59f8b47df90139df4c7777a52.png


表2将我们的方法与所有基线进行了比较。我们观察到PAIE在所有数据集上表现最好。对于S-EAE,我们的基本模型在ACE05上实现了绝对的Arg-C提高2.1%。对于DEAE,我们的基础模型在RAMS和WIKIEVENTS上分别获得2.1%和6.3%的ArgC增益。同样,我们的大版本模型实现了3.5%和2.9%的收益。这表明我们提出的方法在处理不同长度的上下文时具有良好的泛化能力。


723fcad7d5af410dae62e83324b2f812.png


【论文速递 | 精选】



论坛地址https://bbs.csdn.net/forums/paper

目录
相关文章
|
7月前
|
数据挖掘
【提示学习】Automatic Multi-Label Prompting: Simple and Interpretable Few-Shot Classification
文章提出了一种简单确高效地构建verbalization的方法:
|
9月前
|
自然语言处理 算法 vr&ar
X-GEAR:Multilingual Generative Language Models for Zero-Shot Cross-Lingual Event Argument Extraction
我们提出了一项利用多语言预训练生成语言模型进行零样本跨语言事件论元抽取(EAE)的研究。通过将EAE定义为语言生成任务,我们的方法有效地编码事件结构并捕获论元之间的依赖关系。
79 0
|
9月前
|
机器学习/深度学习 自然语言处理 算法
TASLP21-Reinforcement Learning-based Dialogue Guided Event Extraction to Exploit Argument Relations
事件抽取是自然语言处理的一项基本任务。找到事件论元(如事件参与者)的角色对于事件抽取至关重要。
62 0
|
7月前
|
数据挖掘
【提示学习】Prompt Tuning for Multi-Label Text Classification: How to Link Exercises to Knowledge Concept
文章这里使用的是BCEWithLogitsLoss,它适用于多标签分类。即:把[MASK]位置预测到的词表的值进行sigmoid,取指定阈值以上的标签,然后算损失。
|
9月前
|
自然语言处理 算法
Prompt for Extraction? PAIE: Prompting Argument Interaction for Event Argument Extraction 论文解读
在本文中,我们提出了一个既有效又高效的模型PAIE,用于句子级和文档级的事件论元抽取(EAE),即使在缺乏训练数据的情况下也能很好地泛化。
65 0
|
9月前
|
机器学习/深度学习 存储 数据挖掘
Global Constraints with Prompting for Zero-Shot Event Argument Classification 论文解读
确定事件论元的角色是事件抽取的关键子任务。大多数以前的监督模型都利用了昂贵的标注,这对于开放域应用程序是不实际的。
51 0
|
9月前
|
机器学习/深度学习 数据挖掘
ACL2023 - An AMR-based Link Prediction Approach for Document-level Event Argument Extraction
最近的工作引入了用于文档级事件论元提取(文档级EAE)的抽象语义表示(AMR),因为AMR提供了对复杂语义结构的有用解释,并有助于捕获长距离依赖关系
104 0
|
9月前
|
自然语言处理 Java 计算机视觉
ACL2023 - AMPERE: AMR-Aware Prefix for Generation-Based Event Argument Extraction Model
事件论元抽取(EAE)识别给定事件的事件论元及其特定角色。最近在基于生成的EAE模型方面取得的进展显示出了与基于分类的模型相比的良好性能和可推广性
119 0
|
9月前
|
机器学习/深度学习 自然语言处理 算法
Retrieval-Augmented Generative Question Answering for Event Argument Extraction论元解读
长期以来,事件论元抽取一直被研究为基于抽取的方法的序列预测问题,孤立地处理每个论元。尽管最近的工作提出了基于生成的方法来捕获交叉论元依赖性,但它们需要生成和后处理复杂的目标序列(模板)。
110 0
|
9月前
|
机器学习/深度学习 自然语言处理 数据挖掘
UnifiedEAE: A Multi-Format Transfer Learning Model for Event Argument Extraction via Variational论文解读
事件论元抽取(Event argument extraction, EAE)旨在从文本中抽取具有特定角色的论元,在自然语言处理中已被广泛研究。
51 0