VGG16详细原理(含tensorflow版源码)

简介: VGG16详细原理(含tensorflow版源码)

VGG16原理
VGG16是一个经典的卷积神经网络模型,由牛津大学计算机视觉组(Visual Geometry Group)提出,用于参加2014年的ImageNet图像分类比赛。VGG16的名称来源于网络中包含的16个卷积层,其基本结构如下:

输入层:接收大小为224x224的RGB图像。
卷积层:共13个卷积层,每个卷积层使用3x3的卷积核和ReLU激活函数,提取图像的局部特征。
池化层:共5个池化层,每个池化层使用2x2的池化核和步长2,减小特征图的大小。
全连接层:包含2个全连接层,每个全连接层包含4096个神经元,用于分类输出。
输出层:包含一个大小为1000的全连接层,使用softmax激活函数,生成1000个类别的概率分布。
image.png
image.png
VGG16的主要特点是网络结构比较深,且卷积层和池化层的数量都比较多,使得网络可以学习到更加高层次的抽象特征。此外,VGG16的卷积层都采用3x3的卷积核,这样可以保证在不增加计算量的情况下,增加了网络的深度和宽度,提高了特征提取的效率和准确性。

    在训练过程中,VGG16一般采用基于随机梯度下降(Stochastic Gradient Descent,SGD)的反向传播算法,通过最小化交叉熵损失函数来优化模型参数。在训练过程中,可以使用数据增强、正则化、dropout等技术来提高模型的泛化能力和鲁棒性。

    总的来说,VGG16是一个非常经典和有效的卷积神经网络模型,具有良好的特征提取和分类能力,可以应用于图像分类、目标检测等计算机视觉任务。

VGG16源码(tensorflow版)

import tensorflow as tf
from tensorflow.keras import optimizers,losses,models,datasets,Sequential
from tensorflow.keras.layers import Dense,Conv2D,BatchNormalization,MaxPooling2D,Flatten


class vgg16(models.Model):
    def __init__(self):
        super(vgg16, self).__init__()
        self.model = models.Sequential([
            Conv2D(filters=64,kernel_size=(3,3),padding='same',activation='relu'),
            Conv2D(filters=64,kernel_size=(3,3),padding='same',activation='relu'),
            BatchNormalization(),
            MaxPooling2D(),
            Conv2D(filters=128,kernel_size = (3,3),padding='same',activation='relu'),
            Conv2D(filters=128,kernel_size = (3,3),padding='same',activation='relu'),
            BatchNormalization(),
            MaxPooling2D(),
            Conv2D(filters=256, kernel_size=(3, 3),padding='same', activation='relu'),
            Conv2D(filters=256, kernel_size=(3, 3),padding='same', activation='relu'),
            Conv2D(filters=256, kernel_size=(3, 3),padding='same', activation='relu'),
            BatchNormalization(),
            MaxPooling2D(),
            Conv2D(filters=512, kernel_size=(3, 3),padding='same', activation='relu'),
            Conv2D(filters=512, kernel_size=(3, 3), padding='same',activation='relu'),
            Conv2D(filters=512, kernel_size=(3, 3), padding='same',activation='relu'),
            BatchNormalization(),
            MaxPooling2D(),
            Conv2D(filters=512, kernel_size=(3, 3), padding='same',activation='relu'),
            Conv2D(filters=512, kernel_size=(3, 3),padding='same', activation='relu'),
            Conv2D(filters=512, kernel_size=(3, 3), padding='same',activation='relu'),
            BatchNormalization(),
            MaxPooling2D(),
            Flatten(),
            Dense(512,activation='relu'),
            Dense(256,activation='relu'),
            Dense(10,activation='softmax')
        ])

    def call(self, x, training=None, mask=None):
        x = self.model(x)
        return x


def main():
    (train_x,train_y),(test_x,test_y) = datasets.cifar10.load_data()
    train_x = train_x.reshape(-1,32,32,3) / 255.0
    test_x = test_x.reshape(-1,32,32,3) / 255.0

    model = vgg16()

    # model.build((None,32,32,3))
    # model.summary() 不使用类写VGG的话,就不报错,使用了类写VGG就报错,我也很无奈

    model.compile(optimizer=optimizers.Adam(0.01),
                  loss = losses.SparseCategoricalCrossentropy(),
                  metrics=['accuracy'])
    model.fit(train_x,train_y,epochs=10,batch_size=128)

    score = model.evaluate(test_x,test_y,batch_size=50)

    print('loss:',score[0])
    print('acc:',score[1])
    pass


if __name__ == '__main__':
    main()

训练10个epoch的效果
image.png

目录
相关文章
|
6月前
|
机器学习/深度学习 算法 TensorFlow
【Python深度学习】Tensorflow对半环形数据分类、手写数字识别、猫狗识别实战(附源码)
【Python深度学习】Tensorflow对半环形数据分类、手写数字识别、猫狗识别实战(附源码)
123 0
|
6月前
|
机器学习/深度学习 算法 TensorFlow
【Python机器学习】梯度下降法的讲解和求解方程、线性回归实战(Tensorflow、MindSpore平台 附源码)
【Python机器学习】梯度下降法的讲解和求解方程、线性回归实战(Tensorflow、MindSpore平台 附源码)
174 0
|
5月前
|
机器学习/深度学习 人工智能 算法
TensorFlow 的基本原理和使用方法
TensorFlow 的基本原理和使用方法
|
6月前
|
机器学习/深度学习 TensorFlow 算法框架/工具
【Python深度学习】Tensorflow+CNN进行人脸识别实战(附源码和数据集)
【Python深度学习】Tensorflow+CNN进行人脸识别实战(附源码和数据集)
652 4
|
6月前
|
文字识别 算法 TensorFlow
【Keras+计算机视觉+Tensorflow】OCR文字识别实战(附源码和数据集 超详细必看)
【Keras+计算机视觉+Tensorflow】OCR文字识别实战(附源码和数据集 超详细必看)
167 2
|
6月前
|
机器学习/深度学习 算法 TensorFlow
【Keras+计算机视觉+Tensorflow】实现基于YOLO和Deep Sort的目标检测与跟踪实战(附源码和数据集)
【Keras+计算机视觉+Tensorflow】实现基于YOLO和Deep Sort的目标检测与跟踪实战(附源码和数据集)
94 1
|
6月前
|
机器学习/深度学习 自然语言处理 机器人
【Tensorflow+自然语言处理+RNN】实现中文译英文的智能聊天机器人实战(附源码和数据集 超详细)
【Tensorflow+自然语言处理+RNN】实现中文译英文的智能聊天机器人实战(附源码和数据集 超详细)
81 1
|
6月前
|
机器学习/深度学习 TensorFlow 算法框架/工具
【Python机器学习】神经网络中全连接层与线性回归的讲解及实战(Tensorflow、MindSpore平台 附源码)
【Python机器学习】神经网络中全连接层与线性回归的讲解及实战(Tensorflow、MindSpore平台 附源码)
168 0
|
6月前
|
机器学习/深度学习 TensorFlow 算法框架/工具
【深度学习】Tensorflow、MindSpore框架介绍及张量算子操作实战(超详细 附源码)
【深度学习】Tensorflow、MindSpore框架介绍及张量算子操作实战(超详细 附源码)
201 0
|
6月前
|
机器学习/深度学习 TensorFlow 算法框架/工具
【Keras+计算机视觉+Tensorflow】DCGAN对抗生成网络在MNIST手写数据集上实战(附源码和数据集 超详细)
【Keras+计算机视觉+Tensorflow】DCGAN对抗生成网络在MNIST手写数据集上实战(附源码和数据集 超详细)
121 0