【经典网络模型】1、基于GUI实践AlexNet图像识别与分类(二)

简介: 【经典网络模型】1、基于GUI实践AlexNet图像识别与分类(二)

4、Reducing Overfitting实践技术应用


由于神经网络的结构存在6千万个参数 尽管ILSVRC的1000类使每个训练样本从图像到标签的映射上强加了10比特的约束,但这不足以学习这么多的参数而没有相当大的过拟合。它使用了两种方式来避免过拟合。


4.1、Data Augmentation数据增强

第一种数据增强方式包括产生图像平移和水平翻转。我们从256× 256图像上通过随机提取224 × 224的图像块(以及这些图像块的水平翻转)实现了这种方式,然后在这些提取的图像块上进行训练,最终的训练样本是高度相关的。没有这个方案,我们的网络会有大量的过拟合,这会迫使我们使用更小的网络。在测试时,网络会提取5个224 × 224的图像块(四个角上的图像块和中心的图像块)和它们的水平翻转(因此总共10个图像块)进行预测,然后对网络在10个图像块上的softmax层的预测结果进行平均。


第二种数据增强方式包括改变训练图像的RGB通道的强度。具体地,我们在整个ImageNet训练集上对RGB像素值集合(一个pixel有三个值RGB也就是(224 * 224)* 3 这么大的矩阵,224 * 224是行数,3是列数),执行主成分分析(PCA)。对于每幅训练图像,我们这个大矩阵的主成分,大小成正比的对应特征值乘以一个随机变量,随机变量通过均值为0,标准差为0.1的高斯分布得到。


4.2、Dropout

Dropout,它会以0.5的概率对每个隐层神经元的输出设为0。那些用这种方式“丢弃”的神经元不再进行前向传播并且不参与反向传播。因此每次输入时,神经网络会采样一个不同的架构,但所有架构共享权重。这个技术减少了复杂的神经元互适应,因为一个神经元不能依赖特定的其它神经元的存在。

079077f736dd98953d795036ec7ca09c.jpg

因此,神经元被强迫学习更鲁棒的特征,这让它在与许多不同层的神经元的连接时更为有效。在测试时,我们使用所有的神经元但它们的输出乘以0.5,这是对指数级的dropout网络的预测分布的几何平均一种合理的估计。


5、基于GUI界面的AlexNet图像分类实践


该项目目的是为了验证AlexNet对于图像分类的效果,以及基于不同阈值设定的结果对比,同时为了方便大家看到好的呈现效果,使用了GUI可视化的功能。


5.1、项目目录

ffe6b28ac2ae572d8002f52b7d58a7ff.png


5.2、 网络结构搭建

735c4e61e92b9cbaa9bae610dc703840.png


5.3、数据预处理

caf0a3d5758b2083acaa90d836d9cc10.png


5.4、训练结果展示

10894814a6602ba08bffa264d59db8ee.png

369627f975b9bc7ecb226047f4f144ee.png


5.5、基于GUI测试部分

cb751ca483e9613aa0feb0b098046a5a.jpg

0926e67a7c529400bebea7ccf854be4e.jpg

通过以上GUI显示结果可以看出,整个网络结构对于整体的预测算是正确的,但是还是不够全面,也会出现错误,这个能也是AlexNet选择大卷积核的局限。

相关文章
|
9月前
|
人工智能 监控 安全
紧急!!慎用Cursor V1.5.7版本!!!存在恶意大规模攻击用户项目文件行为
Cursor v1.5.7 利用DeepSeek 3.1的架构感知和代码能力,对用户项目文件进行多批次恶意攻击
1156 12
|
人工智能 Java 大数据
17张图揭密支付宝系统架构
支付宝的系统架构图,仅供参考。不管是不是支付行业,都值得我们参考,学习。 image image image image image image image ...
1873 0
|
存储 前端开发 安全
基于Springboot实现健身房管理系统
基于Springboot实现健身房管理系统
443 0
基于Springboot实现健身房管理系统
|
运维 Kubernetes Go
"解锁K8s二开新姿势!client-go:你不可不知的Go语言神器,让Kubernetes集群管理如虎添翼,秒变运维大神!"
【8月更文挑战第14天】随着云原生技术的发展,Kubernetes (K8s) 成为容器编排的首选。client-go作为K8s的官方Go语言客户端库,通过封装RESTful API,使开发者能便捷地管理集群资源,如Pods和服务。本文介绍client-go基本概念、使用方法及自定义操作。涵盖ClientSet、DynamicClient等客户端实现,以及lister、informer等组件,通过示例展示如何列出集群中的所有Pods。client-go的强大功能助力高效开发和运维。
1324 1
|
存储 缓存 JavaScript
国内开源规则引擎牛起来
国内开源规则引擎牛起来
1738 0
|
机器学习/深度学习 Ubuntu Linux
计算机视觉+深度学习+机器学习+opencv+目标检测跟踪+一站式学习(代码+视频+PPT)-1
计算机视觉+深度学习+机器学习+opencv+目标检测跟踪+一站式学习(代码+视频+PPT)
|
机器学习/深度学习 计算机视觉
CV:基于深度学习实现目标检测之GUI界面产品设计并实现图片识别、视频识别、摄像头识别(准确度非常高)
CV:基于深度学习实现目标检测之GUI界面产品设计并实现图片识别、视频识别、摄像头识别(准确度非常高)
CV:基于深度学习实现目标检测之GUI界面产品设计并实现图片识别、视频识别、摄像头识别(准确度非常高)
|
人工智能 文字识别 自然语言处理
探索古彝文AI识别技术:助力中国传统文化的传承与发扬
随着科技的不断发展,OCR(Optical Character Recognition,光学字符识别)技术在各个领域得到了广泛应用。 近年来,古彝文作为一种具有悠久历史和独特魅力的文字,逐渐受到了学者们的关注。探索古彝文识别OCR技术,不仅有助于挖掘、整理和传承中国传统文化,还能为现代科技与文化的交流搭建桥梁。
1258 0
|
机器学习/深度学习 监控 算法
【opencv】计算机视觉:停车场车位实时识别
【opencv】计算机视觉:停车场车位实时识别
741 0
|
机器学习/深度学习 决策智能 计算机视觉
计算机视觉实战(十三)停车场车位识别(附完整代码)
计算机视觉实战(十三)停车场车位识别(附完整代码)
695 0

热门文章

最新文章