LSTM入门学习——结合《LSTM模型》文章看-阿里云开发者社区

LSTM入门学习——结合《LSTM模型》文章看

2017-11-08 880

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

摘自：https://zybuluo.com/hanbingtao/note/581764 写得非常好见原文

长短时记忆网络的思路比较简单。原始RNN的隐藏层只有一个状态，即h，它对于短期的输入非常敏感。那么，假如我们再增加一个状态，即c，让它来保存长期的状态，那么问题不就解决了么？如下图所示：

新增加的状态c，称为单元状态(cell state)。我们把上图按照时间维度展开：

上图仅仅是一个示意图，我们可以看出，在t时刻，LSTM的输入有三个：当前时刻网络的输入值

LSTM的关键，就是怎样控制长期状态c。在这里，LSTM的思路是使用三个控制开关。第一个开关，负责控制继续保存长期状态c；第二个开关，负责控制把即时状态输入到长期状态c；第三个开关，负责控制是否把长期状态c作为当前的LSTM的输出。三个开关的作用如下图所示：

接下来，我们要描述一下，输出h和单元状态c的具体计算方法。

长短时记忆网络的前向计算

下图显示了遗忘门的计算：

接下来看看输入门，下图表示了输入门的计算：

接下来，我们计算用于描述当前输入的单元状态下图是

现在，我们计算当前时刻的单元状态下图是

这样，我们就把LSTM关于当前的记忆

下图表示输出门的计算：

LSTM最终的输出，是由输出门和单元状态共同确定的。

下图表示LSTM最终输出的计算：

式1到式6就是LSTM前向计算的全部公式。至此，我们就把LSTM前向计算讲完了。

本文转自张昺华-sky博客园博客，原文链接：http://www.cnblogs.com/bonelee/p/7715131.html，如需转载请自行联系原作者