DeepLearning-L5-AlexNet

简介: DeepLearning-L5-AlexNet

1. 简介


2012年,Alex Krizhevsky, Ilya Sutskever和Geoffrey E. Hinton在论文《ImageNet Classification with Deep Convolutional Neural Networks》中提出AlexNet,夺得ILSVRC 2012的冠军。

AlexNet是最早的现代神经网络,AlexNet证明了CNN在复杂模型下的有效性,使用GPU使得训练在可接受的时间范围内得到结果,推动了有监督深度学习的发展。



20200526164747815.png

主要特点:


采用GPU实现:两个GPU并行化计算,采用交叉验证,提高了准确率(第二、三层卷积层之间用了两个GPU的“串联”)

采用ReLU激活函数:克服了梯度消失问题且收敛速度较快,优于tanh与sigmoid函数

采用数据增强:数据增强采用图像平移和翻转来生成更多的训练图像,提升了模型的泛化能力

采用Dropout:降低了神经元之间互适应关系,迫使神经元不会过度依赖某个神经元或特征,可学习更为鲁棒的特征,防止过拟合


2. 网络结构


20200526164801520.png


CONV

输入:227 × 227 × 3

卷积核:11 × 11 ,深度48,步长4

输出:55 × 55 × 96

Relu激活函数

POOL

输入:55 × 55 × 96

池化核:最大池化,3 × 3,步长2

输出:27 × 27 × 96

LRN(局部响应归一化)

Layer 2 :CONV + POOL


CONV

输入:27 × 27 × 96 (SAME Padding)

卷积核:5 × 5 ,深度128 ,步长1

输出:27 × 27 × 256

Relu激活函数

POOL

输入:27 × 27 × 256

池化核:最大池化,3 × 3,步长2

输出:13 × 13 × 256

LRN(局部响应归一化)

Layer 3: CONV


CONV

输入:13 × 13 × 256 (SAME Padding)

卷积核:3 × 3 ,深度192 ,步长1

输出:13 × 13 × 384

Relu激活函数

Layer 4: CONV


CONV

输入:13 × 13 × 384 (SAME Padding)

卷积核:3 × 3 ,深度192 ,步长1

输出:13 × 13 × 384

Relu激活函数

Layer 5: CONV-POOL


CONV

输入:13 × 13 × 384 (SAME Padding)

卷积核:3 × 3 ,深度128,步长1

输出:13 × 13 × 256

Relu激活函数

POOL

输入:13 × 13 × 256

池化核:最大池化,3 × 3,步长2

输出:6 × 6 × 256

Layer 6: FC1


输入:9216

输出:4096

Relu激活函数

Layer 7: FC2


输入:4096

输出:4096

Relu激活函数

Layer 8: FC3


输入:4096

输出:1000

Sigmoid激活函数

说明:


原始图像大小256 × 256 × 3,经过随机裁剪、旋转等预处理,形成227 × 227 × 3

Layer 1中卷积核深度为48 ,由于是分在2个GPU上训练,所以总数为96;其他层同理。


相关实践学习
基于阿里云DeepGPU实例,用AI画唯美国风少女
本实验基于阿里云DeepGPU实例,使用aiacctorch加速stable-diffusion-webui,用AI画唯美国风少女,可提升性能至高至原性能的2.6倍。
相关文章
|
机器学习/深度学习 人工智能 并行计算
深度学习应用篇-计算机视觉-图像分类[2]:LeNet、AlexNet、VGG、GoogleNet、DarkNet模型结构、实现、模型特点详细介绍
深度学习应用篇-计算机视觉-图像分类[2]:LeNet、AlexNet、VGG、GoogleNet、DarkNet模型结构、实现、模型特点详细介绍
深度学习应用篇-计算机视觉-图像分类[2]:LeNet、AlexNet、VGG、GoogleNet、DarkNet模型结构、实现、模型特点详细介绍
|
机器学习/深度学习 人工智能 数据挖掘
【Deep Learning B图像分类实战】2023 Pytorch搭建AlexNet、VGG16、GoogleNet等共5个模型实现COIL20数据集图像20分类完整项目(项目已开源)
亮点:代码开源+结构清晰规范+准确率高+保姆级解析+易适配自己数据集+附原始论文+适合新手
310 0
|
机器学习/深度学习 PyTorch 算法框架/工具
计算机视觉PyTorch实现图像分类(二) - AlexNet
计算机视觉PyTorch实现图像分类(二) - AlexNet
137 0
|
PyTorch 算法框架/工具 异构计算
Pytorch实现经典模型AlexNet模型
Pytorch实现经典模型AlexNet模型
87 0
|
数据采集 机器学习/深度学习 PyTorch
深度学习实战(一):LeNet实现CIFAR-10图像分类
利用torchvision.datasets函数可以在线导入pytorch中的数据集,包含一些常见的数据集如MNIST、CIFAR-10等。本次使用的是CIFAR10数据集,也是一个很经典的图像分类数据集,由 Hinton 的学生 Alex Krizhevsky 和 Ilya Sutskever 整理的一个用于识别普适物体的小型数据集,一共包含 10 个类别的 RGB 彩色图片。
297 0
|
Web App开发 机器学习/深度学习 数据挖掘
深度学习论文阅读图像分类篇(六):SENet《Squeeze-and-Excitation Networks》
卷积神经网络建立在卷积运算的基础上,通过融合局部感受野内 的空间信息和通道信息来提取信息特征。为了提高网络的表示能力, 许多现有的工作已经表明增强空间编码的好处。
318 0
|
机器学习/深度学习 PyTorch 算法框架/工具
深度学习:VGG(Vision Geometrical Group)论文详细讲解
深度学习:VGG(Vision Geometrical Group)论文详细讲解
339 0
深度学习:VGG(Vision Geometrical Group)论文详细讲解
|
机器学习/深度学习
DeepLearning-L4-LeNet5
DeepLearning-L4-LeNet5
DeepLearning-L4-LeNet5
|
机器学习/深度学习
DeepLearning-L6-VGG16
DeepLearning-L6-VGG16
DeepLearning-L6-VGG16

相关实验场景

更多