探索用卷积神经网络实现MNIST数据集分类

简介: 探索用卷积神经网络实现MNIST数据集分类

问题

对比单个全连接网络,在卷积神经网络层的加持下,初始时,整个神经网络模型的性能是否会更好。

方法

模型设计

两层卷积神经网络(包含池化层),一层全连接网络。

  1. 选择 5 x 5 的卷积核,输入通道为 1,输出通道为 10:
    此时图像矩阵经过 5 x 5 的卷积核后会小两圈,也就是4个数位,变成 24 x 24,输出通道为10;
  2. 选择 2 x 2 的最大池化层:
    此时图像大小缩短一半,变成 12 x 12,通道数不变;
  3. 再次经过5 x 5的卷积核,输入通道为 10,输出通道为 20:
    此时图像再小两圈,变成 8*8,输出通道为20;
  4. 再次经过2 x 2的最大池化层:
    此时图像大小缩短一半,变成 4 x 4,通道数不变;
  5. 最后将图像整型变换成向量,输入到全连接层中:
    输入一共有 4 x 4 x 20 = 320个元素,输出为 10.


代码


准备数据集

# 准备数据集

batch_size = 64

transform = transforms.Compose([

  transforms.ToTensor(),

  transforms.Normalize((0.1307,), (0.3081,))

])

train_dataset = datasets.MNIST(root='data’,

                             train=True,

                             download=True,

                             transform=transform)

train_loader = DataLoader(train_dataset,

                        shuffle=True,

                        batch_size=batch_size)

test_dataset = datasets.MNIST(root='data',

                            train=False,

                            download=True,

                            transform=transform)

test_loader = DataLoader(test_dataset,

                       shuffle=False,

                       batch_size=batch_size)


建立模型

class Net(torch.nn.Module):

  def __init__(self):

      super(Net, self).__init__()

      self.conv1 = torch.nn.Conv2d(1, 10, kernel_size=5)

      self.conv2 = torch.nn.Conv2d(10, 20, kernel_size=5)

      self.pooling = torch.nn.MaxPool2d(2)

      self.fc = torch.nn.Linear(320, 10)

  def forward(self, x):

      batch_size = x.size(0)

      x = F.relu(self.pooling(self.conv1(x)))

      x = F.relu(self.pooling(self.conv2(x)))

      x = x.view(batch_size, -1)

      x = self.fc(x)

      return x

model = Net()

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

model.to(device)


构造损失函数+优化器

criterion = torch.nn.CrossEntropyLoss()

optimizer = optim.SGD(model.parameters(), lr=0.01, momentum=0.5)


训练+测试

def train(epoch):

  running_loss = 0.0

  for batch_idx, data in enumerate(train_loader, 0):

      inputs, target = data

      inputs,target=inputs.to(device),target.to(device)

      optimizer.zero_grad()

      outputs = model(inputs)

      loss = criterion(outputs, target)

      loss.backward()

      optimizer.step()

      running_loss += loss.item()

      if batch_idx % 300 == 299:

          print('[%d,%.5d] loss:%.3f' % (epoch + 1, batch_idx + 1, running_loss / 2000))

          running_loss = 0.0

def test():

  correct=0

  total=0

  with torch.no_grad():

      for data in test_loader:

          inputs,target=data

          inputs,target=inputs.to(device),target.to(device)

          outputs=model(inputs)

          _,predicted=torch.max(outputs.data,dim=1)

          total+=target.size(0)

          correct+=(predicted==target).sum().item()

  print('Accuracy on test set:%d %% [%d%d]' %(100*correct/total,correct,total))

if __name__ =='__main__':

  for epoch in range(10):

      train(epoch)

      test()


运行结果


(1)batch_size:64,训练次数:10


(2)batch_size:128,训练次数:10

(3)batch_size:128,训练次数:10


结语

对比单个全连接网络,在卷积神经网络层的加持下,初始时,整个神经网络模型的性能显著提升,准确率最低为96%。在batch_size:64,训练次数:100情况下,准确率达到99%。下一阶在平均池化,3*3卷积核,以及不同通道数的情况下,探索对模型性能的影响。                                    

目录
相关文章
|
7月前
|
机器学习/深度学习 PyTorch TensorFlow
卷积神经网络深度解析:从基础原理到实战应用的完整指南
蒋星熠Jaxonic,深度学习探索者。深耕TensorFlow与PyTorch,分享框架对比、性能优化与实战经验,助力技术进阶。
|
8月前
|
机器学习/深度学习 算法 调度
14种智能算法优化BP神经网络(14种方法)实现数据预测分类研究(Matlab代码实现)
14种智能算法优化BP神经网络(14种方法)实现数据预测分类研究(Matlab代码实现)
585 0
|
8月前
|
机器学习/深度学习 人工智能 算法
卷积神经网络深度解析:从基础原理到实战应用的完整指南
蒋星熠Jaxonic带你深入卷积神经网络(CNN)核心技术,从生物启发到数学原理,详解ResNet、注意力机制与模型优化,探索视觉智能的演进之路。
701 11
|
7月前
|
机器学习/深度学习 数据采集 存储
概率神经网络的分类预测--基于PNN的变压器故障诊断(Matlab代码实现)
概率神经网络的分类预测--基于PNN的变压器故障诊断(Matlab代码实现)
1029 0
|
8月前
|
机器学习/深度学习 传感器 数据采集
【故障识别】基于CNN-SVM卷积神经网络结合支持向量机的数据分类预测研究(Matlab代码实现)
【故障识别】基于CNN-SVM卷积神经网络结合支持向量机的数据分类预测研究(Matlab代码实现)
497 0
|
10月前
|
机器学习/深度学习 人工智能 PyTorch
零基础入门CNN:聚AI卷积神经网络核心原理与工业级实战指南
卷积神经网络(CNN)通过局部感知和权值共享两大特性,成为计算机视觉的核心技术。本文详解CNN的卷积操作、架构设计、超参数调优及感受野计算,结合代码示例展示其在图像分类、目标检测等领域的应用价值。
547 7
|
11月前
|
机器学习/深度学习 数据采集 监控
基于CNN卷积神经网络和GEI步态能量提取的步态识别算法matlab仿真,对比不同角度下的步态识别性能
本项目基于CNN卷积神经网络与GEI步态能量提取技术,实现高效步态识别。算法使用不同角度(0°、45°、90°)的步态数据库进行训练与测试,评估模型在多角度下的识别性能。核心流程包括步态图像采集、GEI特征提取、数据预处理及CNN模型训练与评估。通过ReLU等激活函数引入非线性,提升模型表达能力。项目代码兼容Matlab2022a/2024b,提供完整中文注释与操作视频,助力研究与应用开发。
|
11月前
|
机器学习/深度学习 算法 数据安全/隐私保护
基于WOA鲸鱼优化的TCN-GRU时间卷积神经网络时间序列预测算法matlab仿真
本内容包含时间序列预测算法的相关资料,涵盖以下几个方面:1. 算法运行效果预览(无水印);2. 运行环境为Matlab 2022a/2024b;3. 提供部分核心程序,完整版含中文注释及操作视频;4. 理论概述:结合时间卷积神经网络(TCN)与鲸鱼优化算法(WOA),优化TCN超参数以提升非线性时间序列预测性能。通过因果卷积层与残差连接构建TCN模型,并用WOA调整卷积核大小、层数等参数,实现精准预测。适用于金融、气象等领域决策支持。
|
SQL 安全 网络安全
网络安全与信息安全:知识分享####
【10月更文挑战第21天】 随着数字化时代的快速发展,网络安全和信息安全已成为个人和企业不可忽视的关键问题。本文将探讨网络安全漏洞、加密技术以及安全意识的重要性,并提供一些实用的建议,帮助读者提高自身的网络安全防护能力。 ####
423 17
|
SQL 安全 网络安全
网络安全与信息安全:关于网络安全漏洞、加密技术、安全意识等方面的知识分享
随着互联网的普及,网络安全问题日益突出。本文将从网络安全漏洞、加密技术和安全意识三个方面进行探讨,旨在提高读者对网络安全的认识和防范能力。通过分析常见的网络安全漏洞,介绍加密技术的基本原理和应用,以及强调安全意识的重要性,帮助读者更好地保护自己的网络信息安全。
333 10

热门文章

最新文章