对比不同的损失函数对模型输出结果的影响

简介: 对比不同的损失函数对模型输出结果的影响

前言


在这里我们为了保障实验具备可比性,我们采用控制变量法进行比较损失函数:sgdm、rmsprop和adam对图像分类的影响,为了简便实验,我们采用LeNet-5网络结构做母版这样大家也都熟悉,同样我们的数据集也为同一个。


我们可以参考我在上篇博客实验中学习率为0.01的情况下,loss曲线收敛且并未出现过拟合现象和欠拟合现象,我们选择该网络结构(3乘3卷积核,LeNet-5为模板的网络结构)更改损失函数进行实验。



一.比对之前


明确不变量如下所示:


1.1 数据集不变(总类别为10,手写数字数据集,单类别数为500)


1.2 训练集和验证集的划分不变(训练:验证=7:3)


1.3 网络结构除卷积核相同


1.4 训练轮数相同


1.5 学习率相同


1.6 验证频率


1.7 硬件设备相同


为了避免意外现象,我们对这3种损失函数(sgdm、rmsprop和adam)各自进行三次训练,分别取均值为最后统计值。


这里为了方便,我们省去sgdm的实验截图,直接放结论。



二.adam


综合下图中可得如下结论: 由下图可得如下信息:


2.1 验证准确度:91.7333%


2.2 训练历时39.333s


2.2 loss曲线收敛(正常未出现过拟合和欠拟合)


image.png


image.png

image.png



三.rmsprop


由下图可得如下信息:


3.1 验证准确度:90.4666%


3.2 训练历时39.333s


3.2 loss曲线收敛(正常未出现过拟合和欠拟合)

image.png


image.png

image.png


四.sgdm


由下图可得如下信息:


4.1 验证准确度:91.91%


4.2 训练历时39s


4.2 loss曲线收敛(正常未出现过拟合和欠拟合)\



比对结论


除损失函数改变,对于一个正常收敛且未出现过拟合和欠拟合的网络结构的输出结构来看: 验证准确度由大到小排序: sgmd>adam>rmsprop 训练时间由多到少排序:


adam=rmsprop>sgmd



相关文章
|
自然语言处理 数据可视化 Java
NLP6:stanford Parser中文分词
NLP6:stanford Parser中文分词
464 0
|
Ubuntu Linux Python
【服务器部署】让程序在服务器后台持续运行
在服务器后台运行项目不方便管理?不会在后台运行项目?快来试试Screen吧
1313 0
|
机器学习/深度学习 Python
深度学习篇之数据集划分方法-附代码python详细注释
深度学习篇之数据集划分方法-附代码python详细注释
深度学习篇之数据集划分方法-附代码python详细注释
|
机器学习/深度学习 编解码 监控
目标检测实战(六): 使用YOLOv8完成对图像的目标检测任务(从数据准备到训练测试部署的完整流程)
这篇文章详细介绍了如何使用YOLOv8进行目标检测任务,包括环境搭建、数据准备、模型训练、验证测试以及模型转换等完整流程。
20663 59
目标检测实战(六): 使用YOLOv8完成对图像的目标检测任务(从数据准备到训练测试部署的完整流程)
|
Linux 数据库
Linux下DM达梦数据库导入导出dmp文件实战演示,dexp和dimp命令详细使用方法
Linux下DM达梦数据库导入导出dmp文件实战演示,dexp和dimp命令详细使用方法
2253 0
Linux下DM达梦数据库导入导出dmp文件实战演示,dexp和dimp命令详细使用方法
|
7月前
|
存储 缓存 固态存储
C盘清理终极指南:释放宝贵空间的有效技巧
C盘空间不足?别担心!本文《C盘清理终极指南》为你提供从基础到深度的全方位清理技巧。通过系统自带工具、手动删除无用文件、专业软件分析,再到系统设置优化与应用程序管理,助你高效释放磁盘空间,提升电脑性能。特别提示:清理前请备份重要数据,避免误删。按此指南操作,轻松解决C盘臃肿问题,让电脑重焕活力!
3527 0
|
10月前
|
数据采集 JavaScript 前端开发
京东商品详情 API 接口指南(Python 篇)
本简介介绍如何使用Python抓取京东商品详情数据。首先,需搭建开发环境并安装必要的库(如requests、BeautifulSoup和lxml),了解京东反爬虫机制,确定商品ID获取方式。通过发送HTTP请求并解析HTML,可提取价格、优惠券、视频链接等信息。此方法适用于电商数据分析、竞品分析、购物助手及内容创作等场景,帮助用户做出更明智的购买决策,优化营销策略。
|
机器学习/深度学习 计算机视觉 文件存储
【轻量化网络系列(3)】MobileNetV3论文超详细解读(翻译 +学习笔记+代码实现)
【轻量化网络系列(3)】MobileNetV3论文超详细解读(翻译 +学习笔记+代码实现)
6207 0
【轻量化网络系列(3)】MobileNetV3论文超详细解读(翻译 +学习笔记+代码实现)
|
存储 监控 测试技术
Agent Workflow
【6月更文挑战第25天】
826 3

热门文章

最新文章