【论文速递】COLING2022 - 因果情绪关联的双流注意力模型

简介: 【论文速递】COLING2022 - 因果情绪关联的双流注意力模型

【论文原文】:COLING2022 - TSAM: A Two-Stream Attention Model for Causal Emotion Entailment

论文:https://aclanthology.org/2022.coling-1.588/

代码:https://github.com/BladeDancer957/TSAM

博主关键词:因果情绪关联(CEE), mutual BiAffine transformation, attention,speaker relation graph

推荐相关论文

论文:Recognizing emotion cause in conversations

地址:https://link.springer.com/article/10.1007/s12559-021-09925-7

关联创新点:CEE任务与数据集提出者,基于独立的谈话对分类方式的CEE模型


摘要


因果情感关联(CEE)的任务目标是,发现对话所隐含情绪背后的潜在原因。以前的工作将CEE建模为独立的发言对儿分类问题,而忽略了对话中的情绪和发言人信息。本文采取一个新的视角,将CEE任务建模在一个联合框架中。作者对多轮发言同步进行分类,以捕捉发言之间的全局相关性;并提出一个双流注意模型(TSAM),以有效地模拟在对话历史中发言人情绪的影响。具体来说,TSAM包括三个模块模块:情绪注意力网络 Emotion Attention Network(EAN),发言人注意力网络 Speaker Attention Network(SAN)和交互模块。EAN和SAN并列地引入了情绪和发言人信息。随后的交互模块通过相互BiAffine变换,实现EAN和SAN之间的相关信息交流。RECCON-DD上的实验结果表明,TSAM实现了新的SOTA,显著地超过了基线模型。


简介


随着社交媒体平台(脸书,推特等)上对话数据的涌现,对话情绪分析Emotion Analysis in Conversations (EAC)成为NLP社区中的热点之一。传统的EAC任务主要是对话情绪识别Emotion Recognition in Conversations (ERC), 目标是判定对话中蕴含的情感,例如下图Figure 1中, 给定一组对话,ERC判断多轮对话中蕴含的情感(happy,neutral等)。ERC是general-level的情感分析。缺乏细粒度的,更深入的情感与观点挖掘,例如分析情感产生的刺激或原因,抽取出反应相关意见的文本等。2021年Poria等人提出了更细粒度的对话情感分析,命名为RECCON,包括两个不同的子任务: (1)因果短语抽取 Causal Span Extraction (CSE)  ;(2)因果情绪关联 Causal Emotion Entailment。本文主要关注对话级别(utterance-level)的因果情绪关联任务(CSE)。

640.png

与新闻文章的情感原因抽取 Emotion Cause Extraction(ECE)相比,CEE场景下的谈话者具有非正式的表达方式,并混杂了的谈话者之间的互动。Poria等人将CEE建模为一组独立的谈话对儿分类问题,忽略了对话历史中的情感和发言人信息。因此,他们既不能从全局角度捕捉上下文语料之间的相关性,也不能建模发言人的情绪影响,包括发言人内部(intra-speaker)和发言人之间(inter-speaker)的情绪影响。发言人内部(intra-speaker)的情绪影响是指,情绪的主要原因是由于发言人内部的,在以前的对话回合中诱发的,稳定情绪状态。如Figure 1(a)中,对话1显示出了发言人A(S{A})喜欢冬天, 触发了第3句和第5句对话中的快乐情绪。发言人之间(inter-speaker)的情绪影响是指,目标说话人的情绪是由其他说话人提到的事件或情绪引起的。如Figure 1(b)所示。发言人B(S{B})的快乐情绪可能是由S{A}提到的 "结婚 "事件引发的。S{A}提到的结婚事件,或者S{A}对结婚感到兴奋的这一种情绪,都可能触发S{B}的快乐情绪。

640.png

为了解决上述问题,作者提出在联合框架中处理CEE问题。通过对多轮对话进行同步分类,捕捉上下文语料之间的关联性;并提出TSAM来有效地模拟发言人在对话历史中的情绪影响因素。TSAM包含三个模块:EAN、SAN和交互模块EAN提供了对话到情感的交互,通过对情感嵌入分配注意力实现情感信息的纳入。SAN通过一张图(graph)来表示不同发言人对话间的关系。通过对发言人关系图的注意力机制,SAN提供了对话到对话的交互,纳入发言人信息。这两个模块并行地纳入了情感和发言人信息。随后,交互模块通过相互的BiAffine变换,在EAN和SAN之间交换相关信息。整个TSAM可以多层堆叠,通过迭代完善情感和发言人信息。

文章的主要创新点如下:

  • 本文首次在一个联合框架中处理对话因果情感关联问题CEE,在全局视角下捕捉上下文对话相关性。
  • 本文提出一个TSAM模拟发言人对话历史中的情绪影响, 包括EAN、SAN和交互模块,来整合交流情感信息和发言人信息
  • 在CEE数据集 RECCON-DD上,本文方法取得了新的SOTA效果。
相关文章
|
7月前
【论文速递】ICLR2018 - 用于小样本语义分割的条件网络
【论文速递】ICLR2018 - 用于小样本语义分割的条件网络
91 0
|
7月前
|
机器学习/深度学习 编解码 定位技术
【论文速递】ECCV2022 - 密集高斯过程的小样本语义分割
【论文速递】ECCV2022 - 密集高斯过程的小样本语义分割
|
4月前
|
机器学习/深度学习 自然语言处理
准确率达60.8%,浙大基于Transformer的化学逆合成预测模型,登Nature子刊
【8月更文挑战第29天】浙江大学团队在《Nature》子刊上发表的论文介绍了一款名为EditRetro的基于Transformer架构的化学逆合成预测模型,其准确率高达60.8%,为化学合成领域带来了革命性的变化。此模型无需依赖传统化学反应模板,具备更强的泛化能力和多样化合成路线生成能力,在药物研发和材料科学领域展现出巨大潜力,尽管仍存在一定的错误率和计算资源需求高等挑战。论文详情见:https://www.nature.com/articles/s41467-024-50617-1。
65 3
|
7月前
|
机器学习/深度学习 自动驾驶 机器人
【论文速递】CVPR2022 - 泛化的小样本语义分割
【论文速递】CVPR2022 - 泛化的小样本语义分割
|
7月前
|
存储 计算机视觉
【论文速递】WACV2023 - 循环相似注意力的小样本医学图像分割
【论文速递】WACV2023 - 循环相似注意力的小样本医学图像分割
|
7月前
|
机器学习/深度学习 数据挖掘 网络安全
【论文速递】CVPR2022 - 用于半监督物体检测的尺度等效蒸馏
【论文速递】CVPR2022 - 用于半监督物体检测的尺度等效蒸馏
|
7月前
|
机器学习/深度学习 传感器 算法
【论文速递】ICCCS2022 - FedMMD:基于多教师和多特征蒸馏的异构联邦学习
【论文速递】ICCCS2022 - FedMMD:基于多教师和多特征蒸馏的异构联邦学习
|
7月前
|
机器学习/深度学习 自然语言处理 算法
【论文精读】COLING 2022 -带有对偶关系图注意力网络的事件检测模型
【论文精读】COLING 2022 -带有对偶关系图注意力网络的事件检测模型
|
7月前
|
机器学习/深度学习 计算机视觉
【论文速递】ICCV2019 - 基于特征加权和增强的小样本分割
【论文速递】ICCV2019 - 基于特征加权和增强的小样本分割
56 0
|
机器学习/深度学习 编解码 自然语言处理
【论文速递】WACV 2023 - 一种全卷积Transformer的医学影响分割模型
我们提出了一种新的transformer,能够分割不同形态的医学图像。医学图像分析的细粒度特性所带来的挑战意味着transformer对其分析的适应仍处于初级阶段。
243 0
下一篇
DataWorks