【5分钟Paper】Pointer Network指针网络

简介: 【5分钟Paper】Pointer Network指针网络

所解决的问题?


提出了一个网络结构,学习输入序列的位置关系。


背景


学习输入序列的位置关系这一类问题可以被看做是seq2seq问题,输出序列长度与输入序列长度一致,并且是一个可变变量。可以用来处理变量排序或者组合优化问题。

这篇文章是2017年发表的,在这之前,对于循环神经网络这一类算法,主要还是基于先验固定了输出的字典,也就是隐藏层输出单元的预测大小并不可知。


所采用的方法?


与之前采用的attention用于编码encoder输入的隐藏状态不同,作者提出的Ptr-Net是基于Attention去选择的。

论文中核心的网络结构就在decoder部分。主要有两点:

  1. 与以往的seq2seq模型不同,decoder每一个时刻的输入其实上一个时刻被选中的节点输入信息,是最原始的坐标信息编码之后进入到encoder中的输入信息。
  2. 在计算decoder的输出的时候,采用的attention的计算如下:输入是[bs, hidden_dim, seq_len]context和维度为[bs, hidden_dim]input。这里的input就是decoder的输入和隐藏层经过LSTM得到的输出。

context经过一个一维度卷积操作,也相当于经过一个权重矩阵W 1 W_{1}W1得到[bs, hidden_dim, seq_len]维度不变的矩阵。input经过一个权重矩阵W 2 W_{2}W2再扩展维度到[bs, hidden_dim, seq_len]。之后这两个矩阵相加再与一个[bs, 1, hidden_dim]的可学习的变量V VV相乘。得到[bs, seq]维度的attention矩阵。对应到原文公式就是:

image.png

过一层softmax得到attention矩阵

image.png

这个[bs, seq]维度的attention矩阵再与维度为[bs, hidden_dim, seq_len]context矩阵相乘得到隐藏层的输出[bs, hidden_dim],作为LSTM的下一个时刻的hidden state


image.png

取得的效果?

所出版信息?作者信息?

参考链接

相关文章
|
7月前
|
网络协议 前端开发 数据处理
|
2月前
|
机器学习/深度学习 Python
深度学习笔记(九):神经网络剪枝(Neural Network Pruning)详细介绍
神经网络剪枝是一种通过移除不重要的权重来减小模型大小并提高效率的技术,同时尽量保持模型性能。
66 0
深度学习笔记(九):神经网络剪枝(Neural Network Pruning)详细介绍
|
2月前
指针(Pointer)的深度理解(2)
指针(Pointer)的深度理解(2)
35 1
|
3月前
|
C++
C++(十八)Smart Pointer 智能指针简介
智能指针是C++中用于管理动态分配内存的一种机制,通过自动释放不再使用的内存来防止内存泄漏。`auto_ptr`是早期的一种实现,但已被`shared_ptr`和`weak_ptr`取代。这些智能指针基于RAII(Resource Acquisition Is Initialization)原则,即资源获取即初始化。RAII确保对象在其生命周期结束时自动释放资源。通过重载`*`和`->`运算符,可以方便地访问和操作智能指针所指向的对象。
|
4月前
|
存储 Linux 网络安全
【Azure 存储服务】如何把开启NFS 3.0协议的Azure Blob挂载在Linux VM中呢?(NFS: Network File System 网络文件系统)
【Azure 存储服务】如何把开启NFS 3.0协议的Azure Blob挂载在Linux VM中呢?(NFS: Network File System 网络文件系统)
|
6月前
|
Docker 容器
docker network inspect 查询出来的网络的创建命令是什么
【6月更文挑战第17天】docker network inspect 查询出来的网络的创建命令是什么
88 1
|
6月前
|
监控 网络协议 Ubuntu
Linux网络配置全攻略:解读/etc/network/interfaces文件的精髓
Linux网络配置全攻略:解读/etc/network/interfaces文件的精髓
1145 1
|
7月前
|
存储 网络协议 Linux
NFS(Network File System 网络文件服务)
NFS(Network File System 网络文件服务)
|
6月前
|
机器学习/深度学习 计算机视觉
【YOLOv8改进】MSFN(Multi-Scale Feed-Forward Network):多尺度前馈网络
**HCANet: 高光谱图像去噪新方法**\n混合卷积与注意力网络(Hybrid Convolutional and Attention Network)是针对HSI去噪的创新模型,结合CNN和Transformer,强化全局与局部特征。它使用卷积注意力融合模块捕获长距离依赖和局部光谱相关性,多尺度前馈网络提升多尺度信息聚合。代码可在[GitHub](https://github.com/summitgao/HCANet)获取。
|
6月前
|
Web App开发 JSON 前端开发
网络调试利器:Chrome Network工具的详细指南
Chrome开发者工具的Network面板是测试工程师的利器,用于监视HTTP请求、响应及资源加载。打开它可通过右键点击页面选择“检查”或使用快捷键。界面包含请求列表和详细信息,如Headers、Preview、Response、Timing。过滤器帮助定位特定请求,而瀑布流图展示加载顺序。模拟网络环境和保存HAR文件功能便于性能分析和问题排查。