一颗赛艇！上海交大搞出SRNN，比普通RNN也就快135倍-阿里云开发者社区

一颗赛艇！上海交大搞出SRNN，比普通RNN也就快135倍

2018-07-11 1732

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 近日，上海交大的研究人员提出了切片循环神经网络（Sliced recurrent neural networks，SRNN）的结构，在不改变循环单元的情况下，比RNN结构快135倍。

快了135倍。

近日，上海交大的研究人员提出了切片循环神经网络（Sliced recurrent neural networks，SRNN）的结构，在不改变循环单元的情况下，比RNN结构快135倍。

这种如同脚踩风火轮一般的操作，究竟是怎样实现的？

在论文《Sliced Recurrent Neural Networks》中，研究人员给出了具体介绍。我们先来看看“全是重点其他免谈”的论文重点——

“曲线救国”的SRNN

传统RNN结构中最流行的循环单元是LSTM和GRU，二者都能在隐藏层中通过门控机制（Gating Mechanism）存储近期信息，然后决定这些信息将以怎样的程度和输入结合。这种结构的缺点也很明显，RNN很难实现并行化处理。

△ 传统RNN结构，A代表循环单元 | 每一步都需要等待上一步的输出结果

因此，很多学者选在在NLP任务中用CNN来代替，但CNN无法有效获取重要的顺序信息，效果并不理想。

SRNN的结构基于RNN结构进行改良，将输入的序列切成最小的等长子序列。在这种结构中，无需等待上一步的输出结果，循环单元可在每一层的每一个子序列中同时开工，并且信息可通过多层神经网络进行传送。

△ SRNN结构图，A代表循环单元

最后，研究人员比较了SRNN和RNN在不同序列长度时的训练时间和与速度。

结果显示，序列越长，SRNN的优势越明显，当序列长度为32768时，SRNN的速度达到了RNN的136倍。

论文摘要

在NLP（自然语言处理）的很多任务中，循环神经网络已经取得了成功。然而这种循环的结构让并行化变得很困难，所以，训练RNN的时间通常较长。

在这篇文章中，我们提出了一种切片循环神经网络的结构，能够将序列切割成很多子序列，从而实现并行。这种结构可以在额外参数较少的情况下，通过神经网络的多个层次获取高级信息。

我们已经证明，我们可以将标准的RNN结构理解为是SRNN在使用线性激活函数时的特殊情况。

在不改变循环单元的情况下，SRNN能够比标准RNN快135倍，在训练长序列时甚至更快。我们也在大型情感分析数据集上用实验证实，SRNN的表现优于RNN。

论文传送门

关于这项研究的更具体的细节，可以移步上海交大电气信息与电气工程学院的Zeping Yu和Gongshen Liu的论文《Sliced Recurrent Neural Networks》，地址如下——

https://arxiv.org/abs/1807.02291

原文发布时间为：2018-07-10
本文来自云栖社区合作伙伴“量子位”，了解相关信息可以关注“量子位”。

一颗赛艇！上海交大搞出SRNN，比普通RNN也就快135倍

量子位

热门文章

最新文章

相关课程

相关电子书

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

一颗赛艇！上海交大搞出SRNN，比普通RNN也就快135倍

量子位

热门文章

最新文章

相关课程

相关电子书