VGG全称是Visual Geometry Group(视觉几何组)

简介: VGG全称是Visual Geometry Group(视觉几何组)

一、背景介绍 VGG全称是Visual Geometry Group(视觉几何组),因为是由Oxford的Visual Geometry Group提出的。AlexNet问世之后,很多学者通过改进AlexNet的网络结构来提高自己的准确率,主要有两个方向:小卷积核和多尺度。而VGG的作者们则选择了另外一个方向,即加深网络深度。


二、网络架构 卷积网络的输入是224 * 224的RGB图像,整个网络的组成是非常格式化的,基本上都用的是3 * 3的卷积核以及 2 * 2的max pooling,少部分网络加入了1 * 1的卷积核。因为想要体现出“上下左右中”的概念,3*3的卷积核已经是最小的尺寸了。


vgg16 是哪16层



13+3 全连接

去除池化层


image.png

输入层: 224 * 224 * 3


Conv-64: 224 * 224 * 64

Conv-64: 224 * 224 * 64

Pool2: 112 * 112 * 64 //MAX POOL

Conv-128: 112 * 112 * 128

Conv-128: 112 * 112 * 128

Pool2: 56 * 56 * 128

Conv3-256: 56 * 56 * 256

Conv3-256: 56 * 56 * 256

Conv3-256: 56 * 56 * 256

Pool2: 28 * 28 * 256

Conv3-512: 28 * 28 * 512

Conv3-512: 28 * 28 * 512

Conv3-512: 28 * 28 * 512

Pool2: 14 * 14 * 512

Conv3-512: 14 * 14 * 512

Conv3-512: 14 * 14 * 512

Conv3-512: 14 * 14 * 512

Pool2: 7 * 7 * 512

FC: 1 * 1 * 4096 //DROPOUT

FC: 1 * 1 * 4096

FC: 1 * 1 * 4096


SOFTMAX:*


VGG相比于Alex-net:参数更多 层次更深 但所需的迭代次数更少(更小的滤波器)

1*1卷积核:


  1. 网络更深;降低维度
  2. 增加更多的非线性变换
  3. 可以设置更大的步长,能在降低维度的时候尽可能的保留信息
    4.(取代FC层)


VGG16与VGG19性能基本接近,所以常用VGG16.


对比实验的六组网络



image.png



目录
相关文章
|
数据可视化 前端开发
Google Earth Engine(GEE)——特征和特征集合可视化FeatureCollection
Google Earth Engine(GEE)——特征和特征集合可视化FeatureCollection
613 0
Google Earth Engine(GEE)——特征和特征集合可视化FeatureCollection
|
人工智能 算法 自动驾驶
使用OpenCV实现Halcon算法(2)形状匹配开源项目,shape_based_matching
使用OpenCV实现Halcon算法(2)形状匹配开源项目,shape_based_matching
4094 0
使用OpenCV实现Halcon算法(2)形状匹配开源项目,shape_based_matching
|
2月前
|
机器学习/深度学习 算法 计算机视觉
超越YOLOv10/11、RT-DETRv2/3!中科大D-FINE重新定义边界框回归任务
中科大研究团队提出了一种新型目标检测器D-FINE,通过重新定义边界框回归任务,实现超越YOLOv10/11和RT-DETRv2/3的性能。D-FINE采用细粒度分布细化(FDR)和全局最优定位自蒸馏(GO-LSD)技术,显著提高了定位精度和检测速度。在COCO数据集上,D-FINE-L/X分别达到54.0%/55.8%的AP,并在NVIDIA T4 GPU上以124/78 FPS运行。
92 13
|
传感器 机器学习/深度学习 编解码
一文尽览 | 基于点云、多模态的3D目标检测算法综述!(Point/Voxel/Point-Voxel)(下)
目前3D目标检测领域方案主要包括基于单目、双目、激光雷达点云、多模态数据融合等方式,本文主要介绍基于激光雷达雷达点云、多模态数据的相关算法,下面展开讨论下~
一文尽览 | 基于点云、多模态的3D目标检测算法综述!(Point/Voxel/Point-Voxel)(下)
|
7月前
|
机器学习/深度学习 前端开发 计算机视觉
【YOLOv10改进-特征融合篇】EVC(Explicit Visual Center): 中心化特征金字塔模块 | 小目标
YOLO目标检测专栏探讨了对YOLO框架的创新改进,如中心化特征金字塔(CFP)。CFP引入了空间显式视觉中心方案和全局集中特征规范,通过轻量级MLP与并行视觉中心机制强化特征表示,尤其利于小目标检测。在YOLOv5和YOLOX基础上,CFP实现性能提升。相关代码示例展示了EVCBlock的结构,整合了LVCBlock和LightMLPBlock。更多详情和配置参见[YOLO基础解析+创新改进+实战案例](https://blog.csdn.net/shangyanaf/category_12303415.html)。
|
8月前
|
机器学习/深度学习 前端开发 计算机视觉
【YOLOv8改进】Explicit Visual Center: 中心化特征金字塔模块(论文笔记+引入代码)
YOLO目标检测专栏介绍了YOLO的有效改进和实战案例,包括卷积、主干网络、注意力机制和检测头的创新。提出中心化特征金字塔(CFP)解决特征交互和局部区域忽视问题。CFP通过空间显式视觉中心方案和全局集中特征规范增强模型表现,尤其在YOLOv5和YOLOX上表现提升。创新点包括轻量级MLP和并行视觉中心机制,以捕获全局和局部信息。YOLOv8引入EVCBlock整合这些改进。详细代码和配置见链接。
|
8月前
|
机器学习/深度学习 计算机视觉 网络架构
VGG(Visual Geometry Group)介绍
VGG(Visual Geometry Group)介绍
319 0
|
9月前
|
机器学习/深度学习 编解码 人工智能
Flexible Vision Transformer开源,可生成任意分辨率图片
【2月更文挑战第16天】Flexible Vision Transformer开源,可生成任意分辨率图片
149 1
Flexible Vision Transformer开源,可生成任意分辨率图片
|
9月前
|
编解码 定位技术
Google Earth Engine谷歌地球引擎GEE图层投影信息与参考坐标系及其空间转换参数获取
Google Earth Engine谷歌地球引擎GEE图层投影信息与参考坐标系及其空间转换参数获取
174 1
|
9月前
Google Earth Engine(GEE)——Segmentation.seedGrid和SNIC (Simple Non-Iterative Clustering)案例和错误缺少特征错误分析
Google Earth Engine(GEE)——Segmentation.seedGrid和SNIC (Simple Non-Iterative Clustering)案例和错误缺少特征错误分析
118 0