从零开始学keras(六)

简介: 从零开始学keras(六)

      【导读】Keras是一个由Python编写的开源人工神经网络库,可以作为Tensorflow、和Theano的高阶应用程序接口,进行深度学习模型的设计、调试、评估、应用和可视化。本系列将教你如何从零开始学Keras,从搭建神经网络到项目实战,手把手教你精通Keras。相关内容参考《Python深度学习》这本书。                    

卷积神经网络简介


  我们将深入讲解卷积神经网络的原理,以及它在计算机视觉任务上为什么如此成功。但在此之前,我们先来看一个简单的卷积神经网络示例,即使用卷积神经网络对 MNIST 数字进行分类,这个任务我们以前用密集连接网络做过(当时的测试精度为 97.8%)。虽然本例中的卷积神经网络很简单,但其精度肯定会超过先前的密集连接网络。

  下列代码将会展示一个简单的卷积神经网络。它是 Conv2D 层和MaxPooling2D层的堆叠。很快你就会知道这些层的作用。

  重要的是,卷积神经网络接收形状为 (image_height, image_width, image_channels)的输入张量(不包括批量维度)。本例中设置卷积神经网络处理大小为 (28, 28, 1) 的输入张量,这正是 MNIST 图像的格式。我们向第一层传入参数 input_shape=(28, 28, 1) 来完成此设置。

from keras import layers
from keras import models
model = models.Sequential()
model.add(layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))

我们来看一下目前卷积神经网络的架构。

model.summary()

70c07ab34c0c921266276b1bc9970615.png

  可以看到,每个 Conv2D 层和 MaxPooling2D 层的输出都是一个形状为 (height, width,channels) 的 3D 张量。宽度和高度两个维度的尺寸通常会随着网络加深而变小。通道数量由传入 Conv2D 层的第一个参数所控制(32 或 64)。

  下一步是将最后的输出张量[大小为 (3, 3, 64)]输入到一个密集连接分类器网络中, 即 Dense 层的堆叠,你已经很熟悉了。这些分类器可以处理 1D 向量,而当前的输出是 3D 张量。首先,我们需要将 3D 输出展平为 1D,然后在上面添加几个 Dense 层。

model.add(layers.Flatten())
model.add(layers.Dense(64, activation='relu'))
model.add(layers.Dense(10, activation='softmax'))

  我们将进行 10 类别分类,最后一层使用带 10 个输出的 softmax 激活。现在网络的架构如下。

model.summary()

49ece12cf494c91838e9aae07dc562cb.jpg

 如你所见,在进入两个 Dense 层之前,形状 (3, 3, 64) 的输出被展平为形状 (576,) 的 向量。

  下面我们在 MNIST 数字图像上训练这个卷积神经网络。我们将复用前面讲的

MNIST 示例中的很多代码。
from keras.datasets import mnist
from keras.utils import to_categorical
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()
train_images = train_images.reshape((60000, 28, 28, 1))
train_images = train_images.astype('float32') / 255
test_images = test_images.reshape((10000, 28, 28, 1))
test_images = test_images.astype('float32') / 255
train_labels = to_categorical(train_labels)
test_labels = to_categorical(test_labels)
model.compile(optimizer='rmsprop',
              loss='categorical_crossentropy',
              metrics=['accuracy'])
model.fit(train_images, train_labels, epochs=5, batch_size=64)
输出结果如下:
Epoch 1/5
60000/60000 [==============================] - 10s 172us/step - loss: 0.1694 - acc: 0.9472
Epoch 2/5
60000/60000 [==============================] - 6s 107us/step - loss: 0.0477 - acc: 0.9854
Epoch 3/5
60000/60000 [==============================] - 6s 108us/step - loss: 0.0330 - acc: 0.9897
Epoch 4/5
60000/60000 [==============================] - 6s 105us/step - loss: 0.0246 - acc: 0.9929
Epoch 5/5
60000/60000 [==============================] - 6s 107us/step - loss: 0.0190 - acc: 0.9943
我们在测试数据上对模型进行评估:
test_loss, test_acc = model.evaluate(test_images, test_labels)
print(test_acc)
输出为:0.99150000000000005

集连接网络的测试精度为 97.8%,但这个简单卷积神经网络的测试精度达到了99.3%,我们将错误率降低了 68%(相对比例)。相当不错!

Reference


[1]《Python深度学习》François Chollet[美]著[2]https://github.com/fengdu78/machine_learning_beginner/tree/master/deep-learning-with-python-notebooks


相关文章
|
机器学习/深度学习 TensorFlow API
tensorflow从头再学1
tensorflow从头再学1
51 1
|
机器学习/深度学习 TensorFlow API
TensorFlow2.0学习使用笔记
TensorFlow2.0学习使用笔记
|
机器学习/深度学习 数据可视化 数据挖掘
从零开始学Keras(三)
从零开始学Keras(三)
从零开始学Keras(三)
|
机器学习/深度学习 监控 算法
从零开始学keras(四)
从零开始学keras(四)
从零开始学keras(四)
|
机器学习/深度学习 监控 数据可视化
从零开始学Keras(二)
从零开始学Keras(二)
从零开始学Keras(二)
|
机器学习/深度学习 算法框架/工具 计算机视觉
从零开始学keras(八)
从零开始学keras(八)
从零开始学keras(八)
|
机器学习/深度学习 存储 数据可视化
从零开始学keras(五)
从零开始学keras(五)
从零开始学keras(五)
|
机器学习/深度学习 存储 监控
从零开始学Keras(一)
从零开始学Keras(一)
从零开始学Keras(一)
|
机器学习/深度学习 算法 PyTorch
从零开始学Pytorch(四)softmax及其实现
从零开始学Pytorch(四)softmax及其实现
从零开始学Pytorch(四)softmax及其实现
|
机器学习/深度学习 PyTorch 算法框架/工具
从零开始学Pytorch(三)之多层感知机的实现
从零开始学Pytorch(三)之多层感知机的实现
从零开始学Pytorch(三)之多层感知机的实现