探索图片的真相--卷积神经网络

简介: 探索图片的真相--卷积神经网络

今天给大家带来的是卷积神经网络,听上去是不是挺高大上的?它还有个更响亮的名字CNN,谈到CNN应该好多同学都略知一二吧,CNN在做图像识别上有着很出色的效果,那我们今天对卷积神经网络一探究竟吧!


卷积神经网络,CNN(Convolutional Neural Network),属于深度学习技术的一种算法,主要是进行特征学习,通过分层网络获取分层次的特征信息去解决人工设计特征的这个难题。

(TIPS:深度学习包含多种技术,CNN只是其中的一种,还包括:自动编码器AutoEncoder,稀疏编码Sparse Coding,限制玻尔兹曼机RBM,深信度网络Deep Belief Networks,多层反馈循环神经网络RNN)


卷积神经网络


关于卷积神经网络我们如何使用通俗易懂的语言来解释它呢?

首先我们需要了解:它就是多层神经网络,善于解决图像识别问题。那如何去理解神经网络呢,我们可以简单的想象一下那密密麻麻的渔网,网上的那些节组成的就是网络,节点和节点之间有线连接着,可以想象成每个神经元(节点)之间都产生连接。


那卷积神经网络为什么对于图像识别分类有着更好的效果呢?

图片数据对于机器来说是交大的数据,尤其是对于高清图片,机器读取和学习的时间也就越长,难度可以说指数级上升。但是卷积神经网络它可以将数据庞大的图片识别问题去不断降维(就是从图像中不断去抽取细节特征,从小的慢慢看),使得该图像最终能够被训练。


那么卷积神经网络是怎样工作的呢?

卷积神经网络是由三个层组成的,分别是:卷积层,池化层全连接层

卷积层与池化层联合工作,形成卷积组,一层一层的去提取特征,最终通过数个全连接层完成分类。

卷积层的原理其实就是局部视野的原理,有一张30*30的图片,我每次只看3*3的大小(步长为3,不重复看),看100次全部看完,这就是卷积(看下图去理解卷积)。池化层呢,就是降低维度,学术上又叫下采样,就是从原图片中进行采样,对于一张720*1080的照片,池化层进行采样,每次采30*30的大小,这就是池化了(看下图去理解池化)。总的来说,CNN是通过卷积来区分特征,并且通过卷积产生的权值共享和池化来降低网络参数的数量级,最后的工作就和普通神经网络的工作一样了。

卷积神经网络在图像数据非常多的适合会有出乎意料的效果,但是数据集过少的时候往往效果不是很好,容易出现过拟合。


640.gif

卷积


640.gif



池化




LeNet介绍

640.jpg


我们来看看这一张图,从原始图片不断提取,卷积。

先进入一个卷积层C1,由6个5x5的卷积核组成,卷积出28x28的图像,然后下采样到14x14(S2),再进一个卷积层C3,由16个5x5的卷积核组成,之后再下采样到5x5(S4)。我们可以看出,C3-0跟S2-0,1,2连接,C3-1跟S2-1,2,3连接,后面依次类推。最后,通过全连接层C5、F6得到10个输出,对应10个数字的概率。



训练

卷积神经网络的训练分为两个阶段:

阶段一:

正向传播

A、从样本集中取一个样本(X,Yp),将X输入网络;

B、计算相应的实际输出Op。

     在此阶段,信息从输入层经过逐级的变换,传送到输出层。这个过程也是网络在完成训练后正常运行时执行的过程。在此过程中,网络执行的是计算(实际上就是输入与每层的权值矩阵相点乘,得到最后的输出结果):

         Op=Fn(…(F2(F1(XpW(1))W(2))…)W(n))

阶段二:

反向传播

A、算实际输出Op与相应的理想输出Yp的差;

B、按极小化误差的方法反向传播调整权矩阵。



下面我们看看在TensorFlow中我们是怎么去做的吧!


前方代码过于简单,及时带好眼睛!!!


数据准备


教程的图片从Cifar数据集中获取,download_cifar.py从Keras自带的Cifar数据集中获取了部分Cifar数据集,并将其转换为jpg图片。

默认从Cifar数据集中选取了3类图片,每类50张图,分别是

0 => 飞机   1 => 汽车   2 => 鸟


导入相关库


import os#图像读取库
from PIL import Image#矩阵运算库
import numpy as np
import tensorflow as tf


配置信息

设置了一些变量增加程序的灵活性。图片文件存放在data_dir文件夹中,train表示当前执行是训练还是测试,model-path约定了模型存放的路径。


# 数据文件夹
data_dir = "data"
# 训练还是测试
train = True
# 模型文件路径
model_path = "model/image_model"


数据读取


  • pillow读取的图像像素值在0-255之间,需要归一化。
  • 在读取图像数据、Label信息的同时,记录图像的路径,方便后期调试。


640.jpg



定义placeholder(容器)


640.png



定义卷积网络(Conv和Pooling部分)

640.png


定义全连接部分


640.png

定义损失函数和优化器


640.png


定义模型保存器/载入器

640.png



训练阶段执行

640.jpg

如果trian为True,进行训练。训练需要使用sess.run(tf.global_variables_initializer())初始化参数,训练完成后,需要使用saver.save(sess, model_path)保存模型参数。


测试阶段执行

640.jpg


如果train为False,进行测试,测试需要使用saver.restore(sess, model_path)读取参数。



今天就到这里了,其实细心的同学你们会发现代码大部分都是配置数据读写数据,真正花在训练上的代码也不是很多,其实对于深度学习也就是这个意思,主要工作并不是敲代码,而是如何调参。TensorFlow在算法的封装上确实是做的很好的,我们可以直接拿过来用。大家也快去试试吧!



代码地址:

https://www.bytelang.com/o/s/c/uEOz1asEK6s=

相关文章
|
9天前
|
机器学习/深度学习 编解码 自动驾驶
RT-DETR改进策略【模型轻量化】| 替换骨干网络为MoblieNetV1,用于移动视觉应用的高效卷积神经网络
RT-DETR改进策略【模型轻量化】| 替换骨干网络为MoblieNetV1,用于移动视觉应用的高效卷积神经网络
32 3
RT-DETR改进策略【模型轻量化】| 替换骨干网络为MoblieNetV1,用于移动视觉应用的高效卷积神经网络
|
7天前
|
机器学习/深度学习 人工智能 算法
基于Python深度学习的【蘑菇识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能
蘑菇识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了9种常见的蘑菇种类数据集【"香菇(Agaricus)", "毒鹅膏菌(Amanita)", "牛肝菌(Boletus)", "网状菌(Cortinarius)", "毒镰孢(Entoloma)", "湿孢菌(Hygrocybe)", "乳菇(Lactarius)", "红菇(Russula)", "松茸(Suillus)"】 再使用通过搭建的算法模型对数据集进行训练得到一个识别精度较高的模型,然后保存为为本地h5格式文件。最后使用Django框架搭建了一个Web网页平台可视化操作界面,
51 11
基于Python深度学习的【蘑菇识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能
|
13天前
|
机器学习/深度学习 编解码 自动驾驶
YOLOv11改进策略【模型轻量化】| 替换骨干网络为MoblieNetV1,用于移动视觉应用的高效卷积神经网络
YOLOv11改进策略【模型轻量化】| 替换骨干网络为MoblieNetV1,用于移动视觉应用的高效卷积神经网络
41 16
YOLOv11改进策略【模型轻量化】| 替换骨干网络为MoblieNetV1,用于移动视觉应用的高效卷积神经网络
|
13天前
|
机器学习/深度学习 存储
YOLOv11改进策略【模型轻量化】| PP-LCNet:轻量级的CPU卷积神经网络
YOLOv11改进策略【模型轻量化】| PP-LCNet:轻量级的CPU卷积神经网络
38 15
YOLOv11改进策略【模型轻量化】| PP-LCNet:轻量级的CPU卷积神经网络
|
11天前
|
机器学习/深度学习
YOLOv11改进策略【Neck】| GSConv+Slim Neck:混合深度可分离卷积和标准卷积的轻量化网络设计
YOLOv11改进策略【Neck】| GSConv+Slim Neck:混合深度可分离卷积和标准卷积的轻量化网络设计
42 8
YOLOv11改进策略【Neck】| GSConv+Slim Neck:混合深度可分离卷积和标准卷积的轻量化网络设计
|
9天前
|
机器学习/深度学习 编解码 移动开发
RT-DETR改进策略【Conv和Transformer】| TPAMI-2024 Conv2Former 利用卷积调制操作和大核卷积简化自注意力机制,提高网络性能
RT-DETR改进策略【Conv和Transformer】| TPAMI-2024 Conv2Former 利用卷积调制操作和大核卷积简化自注意力机制,提高网络性能
28 5
RT-DETR改进策略【Conv和Transformer】| TPAMI-2024 Conv2Former 利用卷积调制操作和大核卷积简化自注意力机制,提高网络性能
|
13天前
|
机器学习/深度学习 编解码 移动开发
YOLOv11改进策略【Conv和Transformer】| TPAMI-2024 Conv2Former 利用卷积调制操作和大核卷积简化自注意力机制,提高网络性能
YOLOv11改进策略【Conv和Transformer】| TPAMI-2024 Conv2Former 利用卷积调制操作和大核卷积简化自注意力机制,提高网络性能
23 7
YOLOv11改进策略【Conv和Transformer】| TPAMI-2024 Conv2Former 利用卷积调制操作和大核卷积简化自注意力机制,提高网络性能
|
9天前
|
机器学习/深度学习
RT-DETR改进策略【Neck】| GSConv+Slim Neck:混合深度可分离卷积和标准卷积的轻量化网络设计
RT-DETR改进策略【Neck】| GSConv+Slim Neck:混合深度可分离卷积和标准卷积的轻量化网络设计
39 11
|
9天前
|
机器学习/深度学习 存储
RT-DETR改进策略【模型轻量化】| PP-LCNet:轻量级的CPU卷积神经网络
RT-DETR改进策略【模型轻量化】| PP-LCNet:轻量级的CPU卷积神经网络
30 0
RT-DETR改进策略【模型轻量化】| PP-LCNet:轻量级的CPU卷积神经网络
|
1月前
|
机器学习/深度学习 算法 计算机视觉
基于CNN卷积神经网络的金融数据预测matlab仿真,对比BP,RBF,LSTM
本项目基于MATLAB2022A,利用CNN卷积神经网络对金融数据进行预测,并与BP、RBF和LSTM网络对比。核心程序通过处理历史价格数据,训练并测试各模型,展示预测结果及误差分析。CNN通过卷积层捕捉局部特征,BP网络学习非线性映射,RBF网络进行局部逼近,LSTM解决长序列预测中的梯度问题。实验结果表明各模型在金融数据预测中的表现差异。
125 10

热门文章

最新文章