10分钟看懂深度学习的基本数据类型——张量-阿里云开发者社区

10分钟看懂深度学习的基本数据类型——张量

2022-06-10 1379

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 10分钟看懂深度学习的基本数据类型——张量

张量的属性

轴数（阶）：Numpy 中用 ndim 表示，例如，3D 张量有 3 个轴(ndim == 3)。
形状：Numpy 中用 shape 表示。它是张量沿每个轴的维度大小（元素个数）。
数据类型：Numpy 中用 dtype 表示。这是张量中所包含数据的类型。

常见的几种张量

标量（0D 张量）

仅包含一个数值的张量叫作标量（0D 张量）。标量有 0 个轴（ndim == 0）。看个例子。

>>> import numpy as np
>>> a = np.array(2)
>>> a
array(2)
>>> a.ndim
0
>>> a.shape
()
>>> a.dtype
dtype('int32')
复制代码

标量的形状为空。

向量（1D 张量）

数值组成的数组叫作向量（vector）或一维张量（1D 张量）。一维张量只有一个轴。看个例子。

>>> a = np.array([1, 2, 3, 4])
>>> a
array([1, 2, 3, 4])
>>> a.ndim
1
>>> a.shape
(4,)
复制代码

上面的例子，创建了一个 1D 张量，这里的 1 指的是有一个轴；也可以叫做 4D 向量，这里的 4 表示的是沿着轴有 4 个维度。不要混淆！

矩阵（2D 张量）

向量组成的数组叫作矩阵（matrix）或二维张量（2D 张量）。看个例子。

>>> a = np.array([[1, 2, 3],
                  [2, 3, 4]])
>>> a
array([[1, 2, 3],
       [2, 3, 4]])
>>> a.ndim
2
>>> a.shape
(2, 3)
复制代码

在上面的例子中， [1, 2, 3]是矩阵的第一行，[1, 2]是第一列。

3D 张量

将多个矩阵组合成一个新的数组，可以得到一个 3D 张量，可以看成是一个立方体。看个例子。

>>> a = np.array([[[1, 2, 3],
                   [2, 3, 4]],
                  [[1, 2, 3],
                   [2, 3, 4]],
                  [[1, 2, 3],
                   [2, 3, 4]]])
>>> a
array([[[1, 2, 3],
        [2, 3, 4]],
       [[1, 2, 3],
        [2, 3, 4]],
       [[1, 2, 3],
        [2, 3, 4]]])
>>> a.ndim
3
>>> a.shape
(3, 2, 3)
复制代码

更高为张量

将多个 3D 张量组合成一个数组即是 4D 张量，以此类推，一般机器学习处理的都是 0D~5D 张量。

数据批量

在上一篇文章中手写数字分类训练网络时，我们用到了 batch_size。

network.fit(train_images, train_labels, epochs=5, batch_size=128)
复制代码

深度学习模型不会同时处理整个数据集，而是将数据拆分成小批量，每次训练在训练集中取 128 个样本进行训练。

# 第1个批量
batch = train_images[:128]
# 第2个批量
batch = train_images[128:256]
# 第n个批量
batch = train_images[128 * n: 128 * (n + 1)]
复制代码

每一个批量的形状都是相同的。

>>> batch.shape
(128, 784)
复制代码

对于这种批量张量，第一个轴（0轴）叫作批量轴或批量维度，此处的批量维度为 128。

现实世界中的数据张量

向量数组(2D 张量)

这是最常见的数据。它是由向量组成的数组，第一个轴是样本轴，第二个轴是特征轴。

案例

人口统计数据集，包括三个特征：年龄、电话和收入。因此可以存储在形状为 (x, 3) 的 2D 张量中，x 为统计人数。

时间序列数据(3D 张量)

当数据集中时间（或序列顺序）对于数据很重要时，应该将数据存储在带有时间轴的 3D 张量中。每个样本可以被编码为一个向量序列（即 2D 张量），而一个数据批量就是一个 3D 张量。

案例

股票价格数据集。每一分钟，我们记录股票的当前价格、上一分钟的最高价格和上一分钟的最低价格。整个交易日保存在形状为 (x, 3) 的 2D 张量（x 统计时长）中，而 300 天的数据则可以保存在形状为(300, x, 3)的 3D 张量中。这里每个样本是一天的股票数据。

图像数据(4D 张量)

图像通常具有三个维度：高度、宽度和颜色深度。虽然灰度图像（比如 MNIST 数字图像）只有一个颜色通道，因此可以保存在 2D 张量中。

如果图像大小为 256×256，

128 张灰度图像组成的批量可以保存在一个形状为(128, 256, 256, 1)的张量中
128 张彩色图像组成的批量则可以保存在一个形状为(128, 256, 256, 3)的张量中。

图像张量的形状有两种约定：

TensorFlow 将颜色深度轴放在最后：(samples, height, width, color_depth)。
Theano 将图像深度轴放在批量轴之后：(samples, color_depth, height, width)。

按照 Theano 的约定，前面的两个例子将变成(128, 1, 256, 256)与(128, 3, 256, 256)。

Keras 框架同时支持这两种格式。

下一篇我们学习张量的运算特点。

10分钟看懂深度学习的基本数据类型——张量

张量的属性

常见的几种张量

标量（0D 张量）

向量（1D 张量）

矩阵（2D 张量）

3D 张量

更高为张量

数据批量

现实世界中的数据张量

热门文章

最新文章

相关课程

相关电子书

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

10分钟看懂深度学习的基本数据类型——张量

张量的属性

常见的几种张量

标量（0D 张量）

向量（1D 张量）

矩阵（2D 张量）

3D 张量

更高为张量

数据批量

现实世界中的数据张量

热门文章

最新文章

相关课程

相关电子书