MemNet、AT-LSTM、IAN、AF-LSTM…你都掌握了吗?一文总结情感分析必备经典模型(2)

简介: MemNet、AT-LSTM、IAN、AF-LSTM…你都掌握了吗?一文总结情感分析必备经典模型

3、  IAN

本文作者认为目标和情境都可以单独建模,需要通过交互学习来学习它们自己的表现形式。在此基础上,提出了交互式注意网络(interactive attention networks, IAN),实现了目标和语境的注意力交互学习,并分别生成目标和语境的注意力表征。具体的,本文提出了基于长短期记忆网络(LSTM)和注意力机制的交互式注意力网络(Interactive Attention Networks,IAN)模型。情感分类网络利用与目标相关的注意力机制从上下文中获取重要信息,并计算上下文表示来进行情感分类。此外,网络利用上下文的交互信息监督目标的建模,这有助于判断情感。最后,将目标表示和上下文表示连接起来,IAN预测了目标在其上下文中的情感极性。

图4 IAN结构图

IAN模型由两部分组成,对目标和上下文进行交互建模。以单词嵌入为输入,采用LSTM网络来分别获得目标和其上下文在单词层面的隐藏状态。使用目标的隐藏状态和上下文的隐藏状态的平均值来监督注意力向量的生成,通过注意力机制来捕捉上下文和目标中的重要信息。通过这种设计,目标和上下文可以交互地影响其表示的生成。最后,串联目标表征和上下文表征作为最终表征,并被送入softmax函数用于属性级情感分类。

单词嵌入层将每个单词嵌入到一个低维实值向量中。词的嵌入可以看作是神经网络的参数,也可以看作是通过语言模型从适当的语料库中预先训练出来的。

LSTM隐藏层



得到上下文语境的隐藏状态、目标隐藏状态,以及上下文和目标的初始表征:



注意力层将上下文与目标的表征分别送入注意力层,考虑目标对上下文的影响和上下文对目标的影响:




最终,得到目标与上下文的表征:



最后,将目标表征和上下文表征连接成一个向量d作为分类器。这里,使用一个非线性层将d投射到目标C类的空间中:




当前SOTA!平台收录IAN共3个模型实现。


项目 SOTA!平台项目详情页

IAN

前往 SOTA!模型平台获取实现资源:https://sota.jiqizhixin.com/project/ian

4、  AF-LSTM

本文主要是针对ATAE-LSTM的改进,提出了AF-LSTM。通过增加一个Word- Aspect Fusion(aspect与word融合层)分离各层的职责,使模型首先对aspect和words之间的关系进行建模,然后使注意力层专注于学习已经经过融合的上下文words的相对重要性。


图5 AF-LSTM整体架构


Word-Aspect Fusion Attention Layer:模型输入是句子向量和aspect向量 s,句子长度为 L, 词向量维度为 k。
LSTM layer:句子向量作为LSTM模型的输入,输出是隐藏层向量H,模型参数向量维度为 d。
Word-Aspect Fusion Attention Layer:这一层是模型的重点。首先,对于LSTM的每个输出向量hiϵ H,都会学习word与aspect的联合表示,结果记为miϵR^d 。它对上下文单词h_i和aspect之间的关系进行了编码,为了学习h和s的联合表示,论文使用了associative memory operators 来得到m_i 。随后,经过编码的联合表示m1 ,m2,...,mL作为注意力层的输入,得到的结果进入Weighted Sum层进行加权求和。相对于ATAE-LSTM模型,这里最大的不同就是增加了一个word-aspect融合层,代替了原来的直接拼接的操作。这个操作就是用来建模acpect与words的关系,论文中对于这个操作定义了两个运算符,circular correlation和circular convolution ,分别定义如下:



总的来说,关联层的输出定义如下:



在学习h_i 和s的关联之前,还使用了一个可选的归一化层。接下来,将每个隐藏状态h_t和属性向量s通过关联运算符的组成用于学习注意力:



最终表示如下:



将句子的加权表示r传递到最后一层,该层将加权表示r转换为概率分布。这一层也包括一个线性转换层,然后是一个softmax函数。最后一层定义如下:


采用交叉熵损失函数进行优化:



当前SOTA!平台收录AF-LSTM共1个模型实现。

项目 SOTA!平台项目详情页

AF-LSTM

前往 SOTA!模型平台获取实现资源:https://sota.jiqizhixin.com/project/af-lstm


前往 SOTA!模型资源站(sota.jiqizhixin.com)即可获取本文中包含的模型实现代码、预训练模型及API等资源。

网页端访问:在浏览器地址栏输入新版站点地址 sota.jiqizhixin.com ,即可前往「SOTA!模型」平台,查看关注的模型是否有新资源收录。

移动端访问:在微信移动端中搜索服务号名称「机器之心SOTA模型」或 ID 「sotaai」,关注 SOTA!模型服务号,即可通过服务号底部菜单栏使用平台功能,更有最新AI技术、开发资源及社区动态定期推送。

相关文章
|
7月前
|
机器学习/深度学习 API 异构计算
7.1.3.2、使用飞桨实现基于LSTM的情感分析模型的网络定义
该文章详细介绍了如何使用飞桨框架实现基于LSTM的情感分析模型,包括网络定义、模型训练、评估和预测的完整流程,并提供了相应的代码实现。
|
7月前
|
机器学习/深度学习 自然语言处理 算法
7.1.3、使用飞桨实现基于LSTM的情感分析模型
该文章介绍了如何使用飞桨(PaddlePaddle)实现基于长短时记忆网络(LSTM)的情感分析模型,包括数据处理、网络定义、模型训练、评估和预测的详细步骤。
|
9月前
|
机器学习/深度学习 存储 人工智能
算法金 | LSTM 原作者带队,一个强大的算法模型杀回来了
**摘要:** 本文介绍了LSTM(长短期记忆网络)的发展背景和重要性,以及其创始人Sepp Hochreiter新推出的xLSTM。LSTM是为解决传统RNN长期依赖问题而设计的,广泛应用于NLP和时间序列预测。文章详细阐述了LSTM的基本概念、核心原理、实现方法和实际应用案例,包括文本生成和时间序列预测。此外,还讨论了LSTM与Transformer的竞争格局。最后,鼓励读者深入学习和探索AI领域。
109 7
算法金 | LSTM 原作者带队,一个强大的算法模型杀回来了
|
8月前
|
机器学习/深度学习 数据采集 自然语言处理
Python实现循环神经网络SimpleRNN、LSTM进行淘宝商品评论情感分析(含爬虫程序)
Python实现循环神经网络SimpleRNN、LSTM进行淘宝商品评论情感分析(含爬虫程序)
Python实现循环神经网络SimpleRNN、LSTM进行淘宝商品评论情感分析(含爬虫程序)
|
7月前
|
机器学习/深度学习 算法 数据可视化
基于Python flask的豆瓣电影数据分析可视化系统,功能多,LSTM算法+注意力机制实现情感分析,准确率高达85%
本文介绍了一个基于Python Flask框架的豆瓣电影数据分析可视化系统,该系统集成了LSTM算法和注意力机制进行情感分析,准确率高达85%,提供了多样化的数据分析和情感识别功能,旨在帮助用户深入理解电影市场和观众喜好。
224 0
|
8月前
|
机器学习/深度学习 数据采集 数据挖掘
Python实现循环神经网络RNN-LSTM回归模型项目实战(股票价格预测)
Python实现循环神经网络RNN-LSTM回归模型项目实战(股票价格预测)
|
10月前
|
机器学习/深度学习 算法
【MATLAB】基于VMD-SSA-LSTM的回归预测模型
【MATLAB】基于VMD-SSA-LSTM的回归预测模型
312 4
|
9月前
|
机器学习/深度学习 自然语言处理 PyTorch
【自然语言处理NLP】Bert预训练模型、Bert上搭建CNN、LSTM模型的输入、输出详解
【自然语言处理NLP】Bert预训练模型、Bert上搭建CNN、LSTM模型的输入、输出详解
377 0
|
3天前
|
机器学习/深度学习 数据采集 算法
基于GA遗传优化的CNN-LSTM-SAM网络时间序列回归预测算法matlab仿真
本项目使用MATLAB 2022a实现时间序列预测算法,完整程序无水印。核心代码包含详细中文注释和操作视频。算法基于CNN-LSTM-SAM网络,融合卷积层、LSTM层与自注意力机制,适用于金融市场、气象预报等领域。通过数据归一化、种群初始化、适应度计算及参数优化等步骤,有效处理非线性时间序列,输出精准预测结果。
|
5月前
|
机器学习/深度学习 算法 数据安全/隐私保护
基于贝叶斯优化CNN-LSTM网络的数据分类识别算法matlab仿真
本项目展示了基于贝叶斯优化(BO)的CNN-LSTM网络在数据分类中的应用。通过MATLAB 2022a实现,优化前后效果对比明显。核心代码附带中文注释和操作视频,涵盖BO、CNN、LSTM理论,特别是BO优化CNN-LSTM网络的batchsize和学习率,显著提升模型性能。

热门文章

最新文章