TensorFlow 卷积神经网络手写数字识别数据集介绍-阿里云开发者社区

TensorFlow 卷积神经网络手写数字识别数据集介绍

2018-04-03 1895

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 欢迎大家关注我们的网站和系列教程：http://www.tensorflownews.com/，学习更多的机器学习、深度学习的知识！手写数字识别接下来将会以 MNIST 数据集为例，使用卷积层和池化层，实现一个卷积神经网络来进行手写数字识别，并输出卷积和池化效果。

欢迎大家关注我们的网站和系列教程：http://www.tensorflownews.com/，学习更多的机器学习、深度学习的知识！

手写数字识别

接下来将会以 MNIST 数据集为例，使用卷积层和池化层，实现一个卷积神经网络来进行手写数字识别，并输出卷积和池化效果。

数据准备

MNIST 数据集下载

MNIST 数据集可以从 THE MNIST DATABASE of handwritten digits 的网站直接下载。
网址：http://yann.lecun.com/exdb/mnist/

train-images-idx3-ubyte.gz: 训练集图片
train-labels-idx1-ubyte.gz: 训练集列标
t10k-images-idx3-ubyte.gz: 测试集图片
t10k-labels-idx1-ubyte.gz: 测试集列标

TensorFlow 有加载 MNIST 数据库相关的模块，可以在程序运行时直接加载。

代码如下：

from tensorflow.examples.tutorials.mnist import input_data
import matplotlib.pyplot as pyplot

#引入 MNIST 数据集
mnist = input_data.read_data_sets("/tmp/data/", one_hot=False)

#选取训练集中的第 1 个图像的矩阵
mnist_one=mnist.train.images[0]

#输出图片的维度，结果是：(784,)
print(mnist_one.shape)

#因为原始的数据是长度是 784 向量，需要转换成 28*28 的矩阵。
mnist_one_image=mnist_one.reshape((28,28))

#输出矩阵的维度
print(mnist_one_image.shape)

#使用 matplotlib 输出为图片
pyplot.imshow(mnist_one_image)

pyplot.show()

代码的输出依次是：
1.单个手写数字图片的维度：
(784,)

2.转化为二维矩阵之后的打印结果：
(28, 28)

3.使用 matplotlib 输出为图片

模型实现

TensorFlow conv2d 函数介绍：

tf.nn.conv2d(x, W, strides, padding=’SAME’)
针对输入的 4 维数据 x 计算 2 维卷积。

参数 x：
4 维张量，每一个维度分别是 batch,in_height,in_height,in_channels。
[batch, in_height, in_width, in_channels]

灰度图像只有 2 维来表示每一个像素的值，彩色图像每一个像素点有 3 通道的 RGB 值，所以一个彩色图片转化成张量后是 3 维的，分别是长度，宽度，颜色通道数。又因为每一次训练都是训练都是输入很多张图片，所以，多个 3 维张量组合在一起变成了 4 维张量。

参数 w：
过滤器，因为是二维卷积，所以它的维度是：

[filter_height, filter_width, in_channels, out_channels]

与参数 x 对应，前 3 个参数分别是对应 x 的 filter_height, filter_width, in_channels，最后一个参数是过滤器的输出通道数量。

参数 strides：
1 维长度为 4 的张量，对应参数 x 的 4 个维度上的步长。

参数 padding：
边缘填充方式，主要是 “SAME”, “VALID”，一般使用 “SAME”。

卷积层简单封装

# 池化操作
def conv2d(x, W, b, strides=1):
# Conv2D wrapper, with bias and relu activation
x = tf.nn.conv2d(x, W, strides=[1, strides, strides, 1], padding='SAME')
x = tf.nn.bias_add(x, b)
return tf.nn.relu(x)

TensorFlow max_pool 函数介绍：

tf.nn.max_pool(x, ksize, strides ,padding)

参数 x:
和 conv2d 的参数 x 相同，是一个 4 维张量，每一个维度分别代表 batch,in_height,in_height,in_channels。

参数 ksize：
池化核的大小，是一个 1 维长度为 4 的张量，对应参数 x 的 4 个维度上的池化大小。

参数 strides：
1 维长度为 4 的张量，对应参数 x 的 4 个维度上的步长。

参数 padding：
边缘填充方式，主要是 “SAME”, “VALID”，一般使用 “SAME”。

接下来将会使用 TensorFlow 实现以下结构的卷积神经网络：

下一篇文章，将会用 TensorFlow 实现这个卷积神经网络。

本篇文章出自http://www.tensorflownews.com，对深度学习感兴趣，热爱Tensorflow的小伙伴，欢迎关注我们的网站！

TensorFlow 卷积神经网络手写数字识别数据集介绍

手写数字识别

数据准备

模型实现

TensorFlow conv2d 函数介绍：

卷积层简单封装

TensorFlow max_pool 函数介绍：

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

TensorFlow 卷积神经网络手写数字识别数据集介绍

手写数字识别

数据准备

模型实现

TensorFlow conv2d 函数介绍：

卷积层简单封装

TensorFlow max_pool 函数介绍：

热门文章

最新文章

相关课程

相关电子书

相关实验场景