DeepLearning-L5-AlexNet

简介: DeepLearning-L5-AlexNet

1. 简介


2012年,Alex Krizhevsky, Ilya Sutskever和Geoffrey E. Hinton在论文《ImageNet Classification with Deep Convolutional Neural Networks》中提出AlexNet,夺得ILSVRC 2012的冠军。

AlexNet是最早的现代神经网络,AlexNet证明了CNN在复杂模型下的有效性,使用GPU使得训练在可接受的时间范围内得到结果,推动了有监督深度学习的发展。



20200526164747815.png

主要特点:


采用GPU实现:两个GPU并行化计算,采用交叉验证,提高了准确率(第二、三层卷积层之间用了两个GPU的“串联”)

采用ReLU激活函数:克服了梯度消失问题且收敛速度较快,优于tanh与sigmoid函数

采用数据增强:数据增强采用图像平移和翻转来生成更多的训练图像,提升了模型的泛化能力

采用Dropout:降低了神经元之间互适应关系,迫使神经元不会过度依赖某个神经元或特征,可学习更为鲁棒的特征,防止过拟合


2. 网络结构


20200526164801520.png


CONV

输入:227 × 227 × 3

卷积核:11 × 11 ,深度48,步长4

输出:55 × 55 × 96

Relu激活函数

POOL

输入:55 × 55 × 96

池化核:最大池化,3 × 3,步长2

输出:27 × 27 × 96

LRN(局部响应归一化)

Layer 2 :CONV + POOL


CONV

输入:27 × 27 × 96 (SAME Padding)

卷积核:5 × 5 ,深度128 ,步长1

输出:27 × 27 × 256

Relu激活函数

POOL

输入:27 × 27 × 256

池化核:最大池化,3 × 3,步长2

输出:13 × 13 × 256

LRN(局部响应归一化)

Layer 3: CONV


CONV

输入:13 × 13 × 256 (SAME Padding)

卷积核:3 × 3 ,深度192 ,步长1

输出:13 × 13 × 384

Relu激活函数

Layer 4: CONV


CONV

输入:13 × 13 × 384 (SAME Padding)

卷积核:3 × 3 ,深度192 ,步长1

输出:13 × 13 × 384

Relu激活函数

Layer 5: CONV-POOL


CONV

输入:13 × 13 × 384 (SAME Padding)

卷积核:3 × 3 ,深度128,步长1

输出:13 × 13 × 256

Relu激活函数

POOL

输入:13 × 13 × 256

池化核:最大池化,3 × 3,步长2

输出:6 × 6 × 256

Layer 6: FC1


输入:9216

输出:4096

Relu激活函数

Layer 7: FC2


输入:4096

输出:4096

Relu激活函数

Layer 8: FC3


输入:4096

输出:1000

Sigmoid激活函数

说明:


原始图像大小256 × 256 × 3,经过随机裁剪、旋转等预处理,形成227 × 227 × 3

Layer 1中卷积核深度为48 ,由于是分在2个GPU上训练,所以总数为96;其他层同理。


相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
相关文章
|
PyTorch 算法框架/工具 异构计算
Pytorch实现经典模型AlexNet模型
Pytorch实现经典模型AlexNet模型
118 0
|
机器学习/深度学习
DeepLearning-L4-LeNet5
DeepLearning-L4-LeNet5
DeepLearning-L4-LeNet5
|
机器学习/深度学习
DeepLearning-L6-VGG16
DeepLearning-L6-VGG16
DeepLearning-L6-VGG16
|
机器学习/深度学习 数据挖掘
DeepLearning-L7-GoogLeNet
DeepLearning-L7-GoogLeNet
DeepLearning-L7-GoogLeNet
|
机器学习/深度学习 人工智能 PyTorch
Pytorch 基于LeNet的手写数字识别
Pytorch 基于LeNet的手写数字识别
176 0
Pytorch 基于LeNet的手写数字识别
|
机器学习/深度学习 人工智能 自然语言处理
深度学习与CV教程(9) | 典型CNN架构 (Alexnet,VGG,Googlenet,Resnet等)
本文讲解最广泛使用的卷积神经网络,包括经典结构(AlexNet、VGG、GoogLeNet、ResNet)和一些新的结构(Network in Network、Resnet改进、FractalNet、DenseNet)等【对应 CS231n Lecture 9】
1708 3
深度学习与CV教程(9) | 典型CNN架构 (Alexnet,VGG,Googlenet,Resnet等)
|
机器学习/深度学习 计算机视觉 异构计算
从AlexNet到MobileNet,带你入门深度神经网络
在2018年3月13日云栖社区,来自哈尔滨工业大学的沈俊楠分享了典型模式-深度神经网络入门。本文详细介绍了关于深度神经网络的发展历程,并详细介绍了各个阶段模型的结构及特点。
4431 0
|
机器学习/深度学习 人工智能 并行计算
【图像分类】一文带你玩转LeNet(pytorch)
【图像分类】一文带你玩转LeNet(pytorch)
270 0
【图像分类】一文带你玩转LeNet(pytorch)
|
TensorFlow 算法框架/工具 计算机视觉
DenseNet实战:tensorflow2.0以上版本,使用DenseNet121实现图像分类任务
DenseNet实战:tensorflow2.0以上版本,使用DenseNet121实现图像分类任务
695 0
下一篇
DataWorks