如何为LSTM重新构建输入数据(Keras)-阿里云开发者社区

开发者社区> 【方向】> 正文

如何为LSTM重新构建输入数据(Keras)

简介: 对于初入门的开发人员,如何为LSTM准备数据一直是一个问题。在为LSTM准备数据的过程中的确有很多需要注意的问题,阅读本文可能会帮助你解决更多的问题。
+关注继续查看

更多深度文章,请关注:https://yq.aliyun.com/cloud


对于初入门的开发人员来说,这可能是非常困难的事情为LSTM模型准备序列数据。通常入门的开发者会在有关如何定义LSTM模型的输入层这件事情上感到困惑。还有关于如何将可能是1D2D数字矩阵的序列数据转换可以输入到LSTM输入层所需的3D格式的困难。

ce0b6e9908098ed2a7549567962228006192e65f

在本文中,你将了解如何将输入层定义为LSTM模型,以及如何重新构建可以输入到LSTM模型的输入数据。

看完本文后,你将知道:

如何定义LSTM的输入层。

如何重塑LSTM模型的一维序列数据并定义输入层。

如何重塑LSTM模型的多并行系列数据并定义输入层。

教程概述

本文分为4部分:

1.LSTM输入层。

2.具有单输入样本的LSTM示例。

3.具有多个输入特征的LSTM示例。

4.LSTM输入提示。

LSTM输入层

LSTM输入层是由神经网络第一个隐藏层上的“ input_shape ”参数指定的。这可能会让初学者感到困惑。例如,以下是具有一个隐藏的LSTM层和一个密集输出层组成的神经网络示例。

model = Sequential()
model.add(LSTM(32))
model.add(Dense(1))

在这个例子中,我们可以看到LSTM()层必须指定输入的形状。而且每个LSTM层的输入必须是三维的。这输入的三个维度是:

样品。一个序列是一个样本。批次由一个或多个样本组成。

时间步。一个时间步代表样本中的一个观察点。

特征。一个特征是在一个时间步长的观察得到的。

这意味着输入层在拟合模型时以及在做出预测时,对数据的要求必须是3D数组,即使数组的特定维度仅包含单个值。

当定义LSTM网络的输入层时,网络假设你有一个或多个样本,并会给你指定时间步长和特征数量。你可以通过修改“ input_shape ”的参数修改时间步长和特征数量。例如,下面的模型定义了包含一个或多个样本,50个时间步长和2个特征的输入层。

model = Sequential()
model.add(LSTM(32, input_shape=(50, 2)))
model.add(Dense(1))

现在我们知道如何定义LSTM输入层,接下来我们来看一些我们如何为LSTM准备数据的例子。

具有单输入样本的LSTM示例

考虑到你可能会有多个时间步骤和一个特征序列的情况,所以我们先从这种情况讲起。例如,这是一个包含10个数字的序列:

0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1.0

我们可以将这个数字序列定义为NumPy数组。

from numpy import array
data = array([0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1.0])

然后,我们可以使用NumPy数组中的reshape()函数将这个一维数组重构为三维数组,每个时间步长为1个样本,那么我们需要10个时间步长和1个特征。

在数组上调用的reshape()函数需要一个参数,它是定义数组新形状的元组。我们不能干涉数据的重塑,重塑必须均匀地重组数组中的数据。

data = data.reshape((1, 10, 1))

一旦重塑,我们可以打印阵列的新形状。

print(data.shape)

完整的例子如下:

from numpy import array
data = array([0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1.0])
data = data.reshape((1, 10, 1))
print(data.shape)

运行示例打印单个样本的新3D形状:

(1, 10, 1)
该数据现在可以为input_shape101)的LSTM的输入(X)。
model = Sequential()
model.add(LSTM(32, input_shape=(10, 1)))
model.add(Dense(1))

具有多个输入功能的LSTM示例

你的模型可能有多个并行数据作为输入的情况,接下来我们来看看这种情况。

例如,这可以是两个并行的10个值:

series 1: 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1.0

series 2: 1.0, 0.9, 0.8, 0.7, 0.6, 0.5, 0.4, 0.3, 0.2, 0.1

我们可以将这些数据定义为具有10行的2列的矩阵:

from numpy import array
data = array([
	[0.1, 1.0],
	[0.2, 0.9],
	[0.3, 0.8],
	[0.4, 0.7],
	[0.5, 0.6],
	[0.6, 0.5],
	[0.7, 0.4],
	[0.8, 0.3],
	[0.9, 0.2],
	[1.0, 0.1]])

该数据可以被设置为1个样本,具有10个时间步长和2个特征。

它可以重新整形为3D阵列,如下所示:

data = data.reshape(1, 10, 2)

完整的例子如下:

from numpy import array
data = array([
	[0.1, 1.0],
	[0.2, 0.9],
	[0.3, 0.8],
	[0.4, 0.7],
	[0.5, 0.6],
	[0.6, 0.5],
	[0.7, 0.4],
	[0.8, 0.3],
	[0.9, 0.2],
	[1.0, 0.1]])
data = data.reshape(1, 10, 2)
print(data.shape)

运行示例打印单个样本的新3D形状。

(1, 10, 2)

该数据现在可以为input_shape10,2)作为LSTM的输入(X)使用。

model = Sequential()
model.add(LSTM(32, input_shape=(10, 2)))
model.add(Dense(1))

LSTM输入提示

接下来我列出了在为LSTM准备输入数据时可以帮助你的一些提示。

1.LSTM输入层必须是3D

2.3个输入尺寸的含义是:样本,时间步长和特征。

3.LSTM输入层由第一个隐藏层上的input_shape参数定义。

4.所述input_shape参数是限定的时间的步骤和特征数量的两个值的元组。

5.样本数默认假定为大于1

6.NumPy数组中的reshape()函数可用于将你的1D2D数据重塑为3D

7.reshape()函数会将一个元组作为新定义的形状的参数。

进一步阅读

如果你进一步了解,本部分将提供有关该主题的更多资源。

Recurrent Layers Keras API

Numpy reshape()函数API

如何将时间序列转换为Python中的监督学习问题

时间序列预测作为监督学习


如果你在LSTM上有任何问题,可以去原文作者博客与之交流。

本文由本文由北邮@爱可可-爱生活老师推荐,@阿里云云栖社区组织翻译。

文章原标题《How to Reshape Input Data for Long Short-Term Memory Networks in Keras

作者:Jason Brownlee    

作者博客地址:http://machinelearningmastery.com/blog/

译者:袁虎 审阅:主题曲哥哥

文章为简译,更为详细的内容,请查看原文








版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
大数据分布式架构单点故障详解(Hdfs+Yarn+HBase+Spark+Storm)构建HA高可用架构
本文梳理了常见的hadoop生态圈中的组件:Hdfs+Yarn+HBase+Spark+Storm的单点故障问题,出现原因以及单点故障的原理和解决方案(构建HA(High Available)高可用架构)。阅读本文之前,最好了解清楚各组件的架构原理。
19623 0
独家 | ARIMA/Sarima与LSTM的时间序列数据集成学习(附链接)
本文探讨了简单的ARIMA/Sarima与LSTM的时间序列数据集成学习方面的问题。
1533 0
【Web API系列教程】3.8 — 实战:处理数据(显示条目细节)
在本节,你将添加查看每本书的详细信息的功能。在app.js中,添加以下代码到视图模型: self.detail = ko.
527 0
使用 Kafka + Spark Streaming + Cassandra 构建数据实时处理引擎
Apache Kafka 是一个可扩展,高性能,低延迟的平台,允许我们像消息系统一样读取和写入数据。我们可以很容易地在 Java 中使用 Kafka。 Spark Streaming 是 Apache Spark 的一部分,是一个可扩展、高吞吐、容错的实时流处理引擎。
2727 0
+关注
【方向】
欢迎各位对内容方向及质量提需求,我们尽量满足,将国外优质的内容呈现给大家!
696
文章
5
问答
文章排行榜
最热
最新
相关电子书
更多
文娱运维技术
立即下载
《SaaS模式云原生数据仓库应用场景实践》
立即下载
《看见新力量:二》电子书
立即下载