基于Tensorflow的Quick Draw图像分类

简介: Google的“Quick Draw”数据集是一个开源的数据集。该数据集共有345个类别,共5000万张图片,所有这些图片都是由参与挑战的1500万名用户在20s或者更短的时间内绘制完成。

1、数据集介绍

  Google的“Quick Draw”数据集是一个开源的数据集。该数据集共有345个类别,共5000万张图片,所有这些图片都是由参与挑战的1500万名用户在20s或者更短的时间内绘制完成。

  这里将在10个类别的100万张图片上进行学习,为了测试模型的辨别力,特意选择了一些比较相似的图像

2、Quick Draw图像分类

2.1 数据获取

  从Google 下载数据,并将其保存至名为"data_files"的空目录下面。

  具体操作如下:访问地址https://console.cloud.goole.com/storage/browser/quickdraw_dataset/full/numpy_bitmap?pli=1,下载10个数据集,保存到"data_files"目录下面。

  下载之后重命名文件,去掉文件前缀,修改之后如下所示:

image-20220709212549298

2.2 设置环境

  首先,导入依赖项:

import tensorflow as tf
from tensorflow.keras.datasets import mnist
import numpy as np
import h5py
from sklearn.model_selection import train_test_split
import os
from os import walk

  新建一些常量,以便后续使用

batch_size = 128
img_rows, img_cols = 28, 28       # image dims

  用os.walk方法从"data_files"文件夹中提取数据集的文件名。

注意:文件名保存在列表变量filenames中
data_path = "data_files/" # folder for image files
for (dirpath, dirnames, filenames) in walk(data_path):
    pass # file names accumulate in list  'filenames'
print(filenames)

image-20220709212932614

  要使用不同的图像运行此示例,只需将10个不同的文件下载到data_files文件夹中。

  下一步,定义模型所需的其他值。图像总数可在此处更改。

#图像总数num_images
num_images = 1000000 ### 如果出现内存问题,可减少此数字
num_files = len(filenames) # *** 共包含10个文件 ***
images_per_category = num_images//num_files
seed = np.random.randint(1, 10e7)
i=0
print(images_per_category)

image-20220709213406526

2.3 数据预处理

  接着将图像加载到内存中。

  遍历所有文件,在获得文件路径后,加载该文件或图像集(x)。然后,将x转换为浮点数,除以255,令其值在0-1范围内。之后,为这组图像x创建一个标签y。

  第一组图像,标签为0;下一组图像,标签为1;以知道最后一组图像,标签为9,标签y由变量i控制递增。

  接下来,对集合x和y进行切片,将图像和标签还原给x和y。之后,将x和y累加到x_all和y_all中。如果是第一次循环(即i>0),则将x和y拼接到x_all和y_all上。当该循环终止时,x_all和y_all将分别包含图像和图像的标签。

for file in filenames:
    file_path = data_path + file
    x = np.load(file_path)
    x = x.astype('float32')    ##图片标准化
    x /= 255.0
    y = [i] * len(x) # 为图片创建数字标签

    x = x[:images_per_category] # 获取图像岩本
    y = y[:images_per_category] # 获取标签样本

    if i == 0:  #第一次循环时创建两个新列表
        x_all = x
        y_all = y
    else:  #将x和y拼接到x_all和y_all两个列表当中
        x_all = np.concatenate((x,x_all), axis=0)
        y_all = np.concatenate((y,y_all), axis=0)
    i += 1
#x_all和y_all将分别包含图像和图像的标签
print(len(x_all))
print(len(y_all))

image-20220709213425349

  用sklearn.model.selection中的train_test_split方法,将训练集和测试集以8:2的比例进行分割,x_train和x_test分别代表训练集和测试集。

#将数据数组拆分为训练集和测试集 8:2
x_train, x_test, y_train, y_test = train_test_split(x_all, y_all, test_size=0.2, random_state=42)

  由于需要使用卷积神经网络进行图像分类,需将x_train和y_train变形为原来的图像大小28*28*1,前两个维度是图像的高度和宽度(单位为像素),第三个维度表示每个像素的灰度

#由于需要使用卷积神经网络进行图像分类,需将x_train和y_train变形为原来的图像大小
# 28*28*1,前两个维度是图像的高度和宽度(单位为像素),第三个维度表示每个像素的灰度
x_train = x_train.reshape(x_train.shape[0], img_rows, img_cols, 1)
x_test = x_test.reshape(x_test.shape[0], img_rows, img_cols, 1)
# 创建input_shape,该参数将用于convNet的第一层
input_shape = (img_rows, img_cols, 1)
print(x_train.shape)
print(x_test.shape)

image-20220709213633405

  对y_train和y_test标签进行独热编码

#对y_train和y_test标签进行独热编码
y_train = tf.keras.utils.to_categorical(y_train, num_files)
y_test = tf.keras.utils.to_categorical(y_test, num_files)

  进一步以9:1的比例分割为训练集和验证集

print('分割前:')
print('x_train shape:', x_train.shape)
print(x_train.shape[0], 'train samples')
print(x_test.shape[0], 'test samples')
#进一步以9:1的比例分割为训练集和验证集
x_train, x_valid, y_train, y_valid = train_test_split(x_train, y_train, test_size=0.1, random_state=42)
print('分割后:')
print('x_train shape:', x_train.shape)
print(x_train.shape[0], 'train samples')
print(x_test.shape[0], 'test samples')
print(x_valid.shape[0],'valid samples')

image-20220709213702533

2.4 模型创建

  该模型共有两个卷积层(均使用ReLU激活函数),卷积层之后均插入了最大池化层和dropout层;后接一个Flatten层将卷积层的输出展平为一维向量;之后是一个一维全连接层(同样使用ReLU激活函数);最后是一个dropout层和一个10单元的softmax层。softmax层输出单元的激活给出了该图像属于各图像类别的概率。该人工神经网络有足够的实验空间。

#模型定义
model = tf.keras.Sequential()

model.add(tf.keras.layers.Conv2D(32, kernel_size=(3, 3), activation='relu', input_shape=input_shape))
model.add(tf.keras.layers.MaxPooling2D(pool_size=(2, 2)))
model.add(tf.keras.layers.Dropout(0.25))

model.add(tf.keras.layers.Conv2D(64, (3, 3), activation='relu'))
model.add(tf.keras.layers.MaxPooling2D(pool_size=(2, 2)))
model.add(tf.keras.layers.Dropout(0.25))

model.add(tf.keras.layers.Flatten())

model.add(tf.keras.layers.Dense(128, activation='relu'))
model.add(tf.keras.layers.Dropout(0.5))

#softmax层输出单元的激活给出了该图像属于各图像类别的概率
model.add(tf.keras.layers.Dense(num_files, activation='softmax'))#num_files=10
print("Compiling...........")

image-20220709213733519

2.5 模型训练和测试

  现在可以使用fit方法来训练模型。要注意验证机的使用方法与训练集不同。callbacks列表可用于保存最佳模型或在学习停止时(前提是所有更新轮次尚未完成)。

epochs=10 # for testing, for training use 25
callbacks=[tf.keras.callbacks.TensorBoard(log_dir = os.path.join('tb_log_dir'), histogram_freq = 0)]
model.fit(x_train, y_train,
          batch_size=batch_size,
          epochs=epochs,
          callbacks=callbacks,
          verbose=1,
          validation_data=(x_valid, y_valid))
这里由于硬件跟不上,我只设置epochs=10,显卡好的就设置25或更大。

image-20220709214447028

  为确定模型的准确度,可采用evaluate方法。需要注意的是,此次评估使用了测试集。

#评估模型
score = model.evaluate(x_test, y_test, verbose=1)

print('Test loss:', score[0])
print('Test accuracy:', score[1])

image-20220709214510334

  还可以对测试图像进行随机采样,可通过以下代码查看模型效果。从文件名中提取标签,输出该标签以供参照,随后成对输出预测标签与实际标签。

#对测试图像随机采样
import os
labels = [os.path.splitext(file)[0] for file in filenames]
print(labels)
print("\nFor each pair in the following, the first label is predicted, second is actual\n")
for i in range(20):
    t = np.random.randint(len(x_test) )
    x1= x_test[t]
    x1 = x1.reshape(1,28,28,1)
    p = model.predict(x1)
    print("-------------------------")
    print(labels[np.argmax(p)])
    print(labels[np.argmax(y_test[t])])
    print("-------------------------")

image-20220709214700081

image-20220709214710070

2.6 模型保存、加载和重新测试

  保存模型

#保存模型
model.save("./QDrawModel.h5")

  删除模型

del model

  重新加载模型

from tensorflow.keras.models import load_model
import numpy as np
#加载保存的模型
model = load_model('./QDrawModel.h5')
model.summary()

image-20220709214954260

  打印出20个时装的测试样本,确认神经网络工作正常。

#打印出20个时装的测试样本,验证神经网络是否正常工作
print("For each pair, first is predicted, second is actual")
for i in range(20):
    t = np.random.randint(len(x_test))
    x1= x_test[t]
    x1 = x1.reshape(1,28,28,1)
    p = model.predict(x1)
    print("-------------------------")
    print(labels[np.argmax(p)])
    print(labels[np.argmax(y_test[t])])
    print("-------------------------")

image-20220709215033808

目录
相关文章
|
机器学习/深度学习 算法 TensorFlow
树叶识别系统python+Django网页界面+TensorFlow+算法模型+数据集+图像识别分类
树叶识别系统python+Django网页界面+TensorFlow+算法模型+数据集+图像识别分类
211 1
|
7月前
|
机器学习/深度学习 TensorFlow 算法框架/工具
PYTHON TENSORFLOW 2二维卷积神经网络CNN对图像物体识别混淆矩阵评估|数据分享
PYTHON TENSORFLOW 2二维卷积神经网络CNN对图像物体识别混淆矩阵评估|数据分享
|
2月前
|
数据采集 TensorFlow 算法框架/工具
【大作业-03】手把手教你用tensorflow2.3训练自己的分类数据集
本教程详细介绍了如何使用TensorFlow 2.3训练自定义图像分类数据集,涵盖数据集收集、整理、划分及模型训练与测试全过程。提供完整代码示例及图形界面应用开发指导,适合初学者快速上手。[教程链接](https://www.bilibili.com/video/BV1rX4y1A7N8/),配套视频更易理解。
50 0
【大作业-03】手把手教你用tensorflow2.3训练自己的分类数据集
|
1月前
|
机器学习/深度学习 TensorFlow 算法框架/工具
利用Python和TensorFlow构建简单神经网络进行图像分类
利用Python和TensorFlow构建简单神经网络进行图像分类
56 3
|
25天前
|
机器学习/深度学习 数据采集 TensorFlow
利用TensorFlow实现简单的图像分类模型
利用TensorFlow实现简单的图像分类模型
25 0
|
2月前
|
机器学习/深度学习 数据可视化 TensorFlow
使用TensorFlow构建一个简单的图像分类模型
【10月更文挑战第18天】使用TensorFlow构建一个简单的图像分类模型
69 1
|
2月前
|
机器学习/深度学习 TensorFlow API
使用 TensorFlow 和 Keras 构建图像分类器
【10月更文挑战第2天】使用 TensorFlow 和 Keras 构建图像分类器
|
4月前
|
机器学习/深度学习 监控 数据可视化
|
5月前
|
机器学习/深度学习 PyTorch TensorFlow
在深度学习中,数据增强是一种常用的技术,用于通过增加训练数据的多样性来提高模型的泛化能力。`albumentations`是一个强大的Python库,用于图像增强,支持多种图像变换操作,并且可以与深度学习框架(如PyTorch、TensorFlow等)无缝集成。
在深度学习中,数据增强是一种常用的技术,用于通过增加训练数据的多样性来提高模型的泛化能力。`albumentations`是一个强大的Python库,用于图像增强,支持多种图像变换操作,并且可以与深度学习框架(如PyTorch、TensorFlow等)无缝集成。
|
7月前
|
机器学习/深度学习 数据可视化 TensorFlow
基于tensorflow深度学习的猫狗分类识别
基于tensorflow深度学习的猫狗分类识别
246 1