程序与技术分享:DeepMemoryNetwork深度记忆网络

简介: 程序与技术分享:DeepMemoryNetwork深度记忆网络

RNN解决长期依赖的能力随着文本长度的增加越来越差,attention机制是解决这种问题的一种思路,今天我们再来看另外一种思路,深度记忆网络。Deep Memory Network在QA和Aspect based Sentiment等NLP领域都有过成功的实践,但其提出者本身是以通用模型的形式提出的。


Introduce of Memory Network


Memory Networks


一个记忆网络是由一个记忆


m


m


m(一个以


m


i


m_i


mi?作为索引的数组对象)和4个组件


I


,


G


,


O


,


R


I,G,O,R


I,G,O,R组成。其中:


Memory Networks的处理过程


给定一个输入x(例:字符、词或者句子(视处理力度而定),图像或者声音信号),模型处理过程如下:


将x转化为中间特征表示


I


(


x


)


I(x)


I(x)。使用新输入更新记忆


m


i


m_i


mi?:


m


i


=


G


(


m


i


,


I


(


x


)


,


m


)


,


?


i


m_i=G(m_i, I(x), m), \forall i


mi?=G(mi?,I(x)//代码效果参考:http://hnjlyzjd.com/hw/wz_24181.html

,m),?i使用新输入的中间特征表示和记忆计算输出特征

o


o


o:


o


=


O


(


I


(


x


)


,


m


)


o=O(I(x), m)


o=O(I(x),m)最后,解码输出特征到最终回复:


r


=


R


(


o


)


r=R(o)


r=R(o)


这个过程在训练和测试时都适用,两者之间的区别在于:测试时记忆也会被存储,但模型参数


I


,


G


,


O


,


R


I,G,O,R


I,G,O,R将不会再更新。


I


,


G


,


O


,


R


I,G,O,R


I,G,O,R可以使用现有任何机器学习的方法来实现(SVM, 决策树)。


组件


I


I


I:


I


I


I可以使用标准的预处理步骤来实现,比如输入文本的语法分析、指代消解、实体识别等。它同样也可以将输入编码到一个中间的特征表示(将文本转化为稀疏或者稠密的特征向量)。


组件


G


G


G: 最简单的G的形式可以是将


I


(


x


)


I(x)


I(x)储存起来的槽位(slot):


m


H


(


x


)


=


I


(


x


)


m_{H(x)}=I(x)


mH(x)?=I(x)


其中


H


(


x


)


H(x)


H(x)是选择槽位的一个函数。即,


G


G


G只更新m的索引


H


(


x


)


H(x)


H(x),其他索引下的记忆部分将保持不变。更复杂的


G


G


G的实现还可以允许


G


G


G去根据当前输入x得到的新证据去更新先前存储的记忆。如果输入是字符级别或者词级别的你也可以将其进行分组。


如果记忆非常庞大(假设要记忆整个Freebase或者Wikipedia),你可能不得不把记忆使用


H


(


x


)


H(x)


H(x)来组织起来。


如果记忆已经被填满。你也可以使用


H


H


H来实现一种遗忘机制。


O


O


O和


R


R


R组件:


O


O


O组件被特别应用于读取记忆和执行推断,


R


R


R组件则根据


O


O


O的输出产生最终回复。例:在QA中,使用


O


O


O查找相关的记忆,然后


R


R


R生成文字来组成答案。


R


R


R可以是RNN,视


O


O


O的输出而定。这种设计基于的假设是,如果没有限定在这种记忆上,RNN会表现得相当差(事实上很多场景下确实如此)。


原论文给了一个QA的例子,但由于这个模型并没有广泛使用这里就不介绍了。我们转而介绍一种常用的端到端的记忆网络实现。


End-To-End Memory Network


端到端的记忆网络本质上也是一种RNN架构,但与RNN不同之处在于,在递归过程中会多次读取大型外部存储的记忆来输出一个符号。下面介绍的Memory Network可以有很多层,也易于反向传播,需要对网络的每一层进行监督训练。它以端到端的形式被应用于QA和Aspect Based Sentiment。


模型将一系列离散的输入


x


i


,


.


.


.


,


x


n


x_i,...,x_n


xi?,...,xn?存储在记忆中,并接受一个查询


q


q


q,输出回答


a


a


a。模型会将所有的


x


x


x写为记忆存储在一个固定大小的缓存中,然后寻求一个


x


x


x和


q


q


q的连续表示。该连续表示会被多跳处理以输出a。这使得错误信号能够在多级记忆中反向传播到输入。


Single Layer


整个模型是很多层堆起来的,我们先介绍单个层。


输入记忆表示(Input memory representation):假定我们把给定输入集


x


1


,


.


.


.


,


x


i


x_1,...,x_i


x1?,...,xi?存储在记忆中。整个输入集


x


i


{x_i}


xi?都会经由每个


x


i


x_i


xi?所处的连续空间的嵌入(embedding)被转化为维度为


d


d


相关文章
用MASM32按Time Protocol(RFC868)协议编写网络对时程序中的一些有用的函数代码
用MASM32按Time Protocol(RFC868)协议编写网络对时程序中的一些有用的函数代码
|
19天前
|
网络协议 物联网 数据处理
C语言在网络通信程序实现中的应用,介绍了网络通信的基本概念、C语言的特点及其在网络通信中的优势
本文探讨了C语言在网络通信程序实现中的应用,介绍了网络通信的基本概念、C语言的特点及其在网络通信中的优势。文章详细讲解了使用C语言实现网络通信程序的基本步骤,包括TCP和UDP通信程序的实现,并讨论了关键技术、优化方法及未来发展趋势,旨在帮助读者掌握C语言在网络通信中的应用技巧。
32 2
|
2月前
|
机器学习/深度学习 存储 自然语言处理
从理论到实践:如何使用长短期记忆网络(LSTM)改善自然语言处理任务
【10月更文挑战第7天】随着深度学习技术的发展,循环神经网络(RNNs)及其变体,特别是长短期记忆网络(LSTMs),已经成为处理序列数据的强大工具。在自然语言处理(NLP)领域,LSTM因其能够捕捉文本中的长期依赖关系而变得尤为重要。本文将介绍LSTM的基本原理,并通过具体的代码示例来展示如何在实际的NLP任务中应用LSTM。
154 4
|
2月前
|
安全 网络协议 IDE
使用Python编写网络扫描程序
使用Python编写网络扫描程序
52 0
|
4月前
|
存储 网络协议 安全
|
4月前
|
机器学习/深度学习
【机器学习】面试题:LSTM长短期记忆网络的理解?LSTM是怎么解决梯度消失的问题的?还有哪些其它的解决梯度消失或梯度爆炸的方法?
长短时记忆网络(LSTM)的基本概念、解决梯度消失问题的机制,以及介绍了包括梯度裁剪、改变激活函数、残差结构和Batch Normalization在内的其他方法来解决梯度消失或梯度爆炸问题。
187 2
|
5月前
|
机器学习/深度学习 数据采集 自然语言处理
Python实现循环神经网络SimpleRNN、LSTM进行淘宝商品评论情感分析(含爬虫程序)
Python实现循环神经网络SimpleRNN、LSTM进行淘宝商品评论情感分析(含爬虫程序)
Python实现循环神经网络SimpleRNN、LSTM进行淘宝商品评论情感分析(含爬虫程序)
|
6月前
程序技术好文:计算机网络(九)——STP原理
程序技术好文:计算机网络(九)——STP原理
104 1
|
5月前
|
Windows
【计算机网络】已解决:“‘ping‘ 不是内部或外部命令,也不是可运行的程序或批处理文件”报错
【计算机网络】已解决:“‘ping‘ 不是内部或外部命令,也不是可运行的程序或批处理文件”报错
493 0
|
5月前
|
机器学习/深度学习 安全 网络安全
利用深度学习优化网络安全:技术分享与实践指南数字时代的守护者:网络安全漏洞、加密技术与安全意识的深度剖析
随着信息技术的飞速发展,网络安全问题日益凸显。传统防护措施面对复杂多变的网络攻击手段逐渐显得力不从心。本文将深入探讨如何通过深度学习技术提升网络安全防护能力,分析其在识别和预防潜在网络威胁方面的有效性,并结合实际案例,为读者提供一套可行的技术实施方案。 在数字化浪潮中,网络安全成为维护信息完整性、保密性和可用性的关键。本文深入探讨了网络安全的三大支柱:网络漏洞的识别与防护、加密技术的演进与应用、以及安全意识的培养与提升。通过分析最新的研究数据和案例,揭示这些要素如何共同构建起防御网络威胁的坚固堡垒。