【论文速递】COLING2022 - 因果情绪关联的双流注意力模型

简介: 【论文速递】COLING2022 - 因果情绪关联的双流注意力模型

【论文原文】:COLING2022 - TSAM: A Two-Stream Attention Model for Causal Emotion Entailment

论文:https://aclanthology.org/2022.coling-1.588/

代码:https://github.com/BladeDancer957/TSAM

博主关键词:因果情绪关联(CEE), mutual BiAffine transformation, attention,speaker relation graph

推荐相关论文

论文:Recognizing emotion cause in conversations

地址:https://link.springer.com/article/10.1007/s12559-021-09925-7

关联创新点:CEE任务与数据集提出者,基于独立的谈话对分类方式的CEE模型


摘要


因果情感关联(CEE)的任务目标是,发现对话所隐含情绪背后的潜在原因。以前的工作将CEE建模为独立的发言对儿分类问题,而忽略了对话中的情绪和发言人信息。本文采取一个新的视角,将CEE任务建模在一个联合框架中。作者对多轮发言同步进行分类,以捕捉发言之间的全局相关性;并提出一个双流注意模型(TSAM),以有效地模拟在对话历史中发言人情绪的影响。具体来说,TSAM包括三个模块模块:情绪注意力网络 Emotion Attention Network(EAN),发言人注意力网络 Speaker Attention Network(SAN)和交互模块。EAN和SAN并列地引入了情绪和发言人信息。随后的交互模块通过相互BiAffine变换,实现EAN和SAN之间的相关信息交流。RECCON-DD上的实验结果表明,TSAM实现了新的SOTA,显著地超过了基线模型。


简介


随着社交媒体平台(脸书,推特等)上对话数据的涌现,对话情绪分析Emotion Analysis in Conversations (EAC)成为NLP社区中的热点之一。传统的EAC任务主要是对话情绪识别Emotion Recognition in Conversations (ERC), 目标是判定对话中蕴含的情感,例如下图Figure 1中, 给定一组对话,ERC判断多轮对话中蕴含的情感(happy,neutral等)。ERC是general-level的情感分析。缺乏细粒度的,更深入的情感与观点挖掘,例如分析情感产生的刺激或原因,抽取出反应相关意见的文本等。2021年Poria等人提出了更细粒度的对话情感分析,命名为RECCON,包括两个不同的子任务: (1)因果短语抽取 Causal Span Extraction (CSE)  ;(2)因果情绪关联 Causal Emotion Entailment。本文主要关注对话级别(utterance-level)的因果情绪关联任务(CSE)。

640.png

与新闻文章的情感原因抽取 Emotion Cause Extraction(ECE)相比,CEE场景下的谈话者具有非正式的表达方式,并混杂了的谈话者之间的互动。Poria等人将CEE建模为一组独立的谈话对儿分类问题,忽略了对话历史中的情感和发言人信息。因此,他们既不能从全局角度捕捉上下文语料之间的相关性,也不能建模发言人的情绪影响,包括发言人内部(intra-speaker)和发言人之间(inter-speaker)的情绪影响。发言人内部(intra-speaker)的情绪影响是指,情绪的主要原因是由于发言人内部的,在以前的对话回合中诱发的,稳定情绪状态。如Figure 1(a)中,对话1显示出了发言人A(S{A})喜欢冬天, 触发了第3句和第5句对话中的快乐情绪。发言人之间(inter-speaker)的情绪影响是指,目标说话人的情绪是由其他说话人提到的事件或情绪引起的。如Figure 1(b)所示。发言人B(S{B})的快乐情绪可能是由S{A}提到的 "结婚 "事件引发的。S{A}提到的结婚事件,或者S{A}对结婚感到兴奋的这一种情绪,都可能触发S{B}的快乐情绪。

640.png

为了解决上述问题,作者提出在联合框架中处理CEE问题。通过对多轮对话进行同步分类,捕捉上下文语料之间的关联性;并提出TSAM来有效地模拟发言人在对话历史中的情绪影响因素。TSAM包含三个模块:EAN、SAN和交互模块EAN提供了对话到情感的交互,通过对情感嵌入分配注意力实现情感信息的纳入。SAN通过一张图(graph)来表示不同发言人对话间的关系。通过对发言人关系图的注意力机制,SAN提供了对话到对话的交互,纳入发言人信息。这两个模块并行地纳入了情感和发言人信息。随后,交互模块通过相互的BiAffine变换,在EAN和SAN之间交换相关信息。整个TSAM可以多层堆叠,通过迭代完善情感和发言人信息。

文章的主要创新点如下:

  • 本文首次在一个联合框架中处理对话因果情感关联问题CEE,在全局视角下捕捉上下文对话相关性。
  • 本文提出一个TSAM模拟发言人对话历史中的情绪影响, 包括EAN、SAN和交互模块,来整合交流情感信息和发言人信息
  • 在CEE数据集 RECCON-DD上,本文方法取得了新的SOTA效果。
相关文章
|
3月前
|
机器学习/深度学习 自然语言处理
准确率达60.8%,浙大基于Transformer的化学逆合成预测模型,登Nature子刊
【8月更文挑战第29天】浙江大学团队在《Nature》子刊上发表的论文介绍了一款名为EditRetro的基于Transformer架构的化学逆合成预测模型,其准确率高达60.8%,为化学合成领域带来了革命性的变化。此模型无需依赖传统化学反应模板,具备更强的泛化能力和多样化合成路线生成能力,在药物研发和材料科学领域展现出巨大潜力,尽管仍存在一定的错误率和计算资源需求高等挑战。论文详情见:https://www.nature.com/articles/s41467-024-50617-1。
56 3
|
4月前
|
人工智能 算法 数据挖掘
语义熵识破LLM幻觉!牛津大学新研究登Nature
【7月更文挑战第22天】牛津大学研究者在Nature发布"使用语义熵检测大模型幻觉"。语义熵新方法有效识别大模型(LLMs)生成的不实或误导信息,通过聚类分析不同回答的语义等价性并计算概率,展示超越基线的幻觉检测能力,提升LLMs的可靠性。
137 7
|
5月前
|
数据采集 人工智能 算法
ICLR 2024 Spotlight:单模型斩获蛋白质突变预测榜一!西湖大学提出基于结构词表方法
【6月更文挑战第1天】西湖大学团队研发的蛋白质语言模型SaProt,在结构词表方法下,于蛋白质突变预测任务中荣登榜首。SaProt利用Foldseek编码的结构标记理解蛋白质行为,超越现有基准模型,在10个下游任务中表现出色。尽管训练资源需求大,且有特定任务优化空间,但该模型为生物医学研究带来新工具,促进科学理解与合作。论文链接:[https://www.biorxiv.org/content/10.1101/2023.10.01.560349v4](https://www.biorxiv.org/content/10.1101/2023.10.01.560349v4)
190 7
|
人工智能 自然语言处理 知识图谱
【论文速递】COLING 2022 - 带有事件论元相关性的事件因果关系抽取
事件因果关系识别(ECI)是事件因果关系理解的重要任务,其目的是检测两个给定文本事件之间是否存在因果关系。然而,ECI任务忽略了关键的事件结构和因果关系组件信息
132 0
|
6月前
|
机器学习/深度学习 计算机视觉
【论文速递】MMM2020 - 电子科技大学提出一种新颖的局部变换模块提升小样本分割泛化性能
【论文速递】MMM2020 - 电子科技大学提出一种新颖的局部变换模块提升小样本分割泛化性能
42 0
|
6月前
|
机器学习/深度学习 自然语言处理 算法
【论文精读】COLING 2022 -带有对偶关系图注意力网络的事件检测模型
【论文精读】COLING 2022 -带有对偶关系图注意力网络的事件检测模型
【论文速递】EMNLP2022:随机模态缺失情况下的多模态情感分析
【论文速递】EMNLP2022:随机模态缺失情况下的多模态情感分析
|
机器学习/深度学习 编解码 自然语言处理
【论文速递】WACV 2023 - 一种全卷积Transformer的医学影响分割模型
我们提出了一种新的transformer,能够分割不同形态的医学图像。医学图像分析的细粒度特性所带来的挑战意味着transformer对其分析的适应仍处于初级阶段。
232 0
|
机器学习/深度学习 人工智能 搜索推荐
AAAI 2023 | 超越SOTA 3.27%,上交大等提出自适应本地聚合新方法
AAAI 2023 | 超越SOTA 3.27%,上交大等提出自适应本地聚合新方法
192 0
|
机器学习/深度学习 关系型数据库 MySQL
2023港科大新作 | 新颖注意力机制有效提升医学图像小样本语义分割精度!
2023港科大新作 | 新颖注意力机制有效提升医学图像小样本语义分割精度!
672 0