对比不同的损失函数对模型输出结果的影响

简介: 对比不同的损失函数对模型输出结果的影响

前言


在这里我们为了保障实验具备可比性,我们采用控制变量法进行比较损失函数:sgdm、rmsprop和adam对图像分类的影响,为了简便实验,我们采用LeNet-5网络结构做母版这样大家也都熟悉,同样我们的数据集也为同一个。


我们可以参考我在上篇博客实验中学习率为0.01的情况下,loss曲线收敛且并未出现过拟合现象和欠拟合现象,我们选择该网络结构(3乘3卷积核,LeNet-5为模板的网络结构)更改损失函数进行实验。



一.比对之前


明确不变量如下所示:


1.1 数据集不变(总类别为10,手写数字数据集,单类别数为500)


1.2 训练集和验证集的划分不变(训练:验证=7:3)


1.3 网络结构除卷积核相同


1.4 训练轮数相同


1.5 学习率相同


1.6 验证频率


1.7 硬件设备相同


为了避免意外现象,我们对这3种损失函数(sgdm、rmsprop和adam)各自进行三次训练,分别取均值为最后统计值。


这里为了方便,我们省去sgdm的实验截图,直接放结论。



二.adam


综合下图中可得如下结论: 由下图可得如下信息:


2.1 验证准确度:91.7333%


2.2 训练历时39.333s


2.2 loss曲线收敛(正常未出现过拟合和欠拟合)


image.png


image.png

image.png



三.rmsprop


由下图可得如下信息:


3.1 验证准确度:90.4666%


3.2 训练历时39.333s


3.2 loss曲线收敛(正常未出现过拟合和欠拟合)

image.png


image.png

image.png


四.sgdm


由下图可得如下信息:


4.1 验证准确度:91.91%


4.2 训练历时39s


4.2 loss曲线收敛(正常未出现过拟合和欠拟合)\



比对结论


除损失函数改变,对于一个正常收敛且未出现过拟合和欠拟合的网络结构的输出结构来看: 验证准确度由大到小排序: sgmd>adam>rmsprop 训练时间由多到少排序:


adam=rmsprop>sgmd



相关文章
|
存储
【C盘瘦身】如何清理Wechat Files,经常使用电脑微信用户必知的常识!
【C盘瘦身】如何清理Wechat Files,经常使用电脑微信用户必知的常识!
4161 0
【C盘瘦身】如何清理Wechat Files,经常使用电脑微信用户必知的常识!
|
Ubuntu Linux Python
【服务器部署】让程序在服务器后台持续运行
在服务器后台运行项目不方便管理?不会在后台运行项目?快来试试Screen吧
1523 0
|
计算机视觉
RT-DETR改进策略【损失函数篇】| 利用MPDIoU,加强边界框回归的准确性
RT-DETR改进策略【损失函数篇】| 利用MPDIoU,加强边界框回归的准确性
482 2
|
计算机视觉
YOLOv11改进策略【Neck】| PRCV 2023,SBA(Selective Boundary Aggregation):特征融合模块,描绘物体轮廓重新校准物体位置,解决边界模糊问题
YOLOv11改进策略【Neck】| PRCV 2023,SBA(Selective Boundary Aggregation):特征融合模块,描绘物体轮廓重新校准物体位置,解决边界模糊问题
645 11
|
机器学习/深度学习 算法 计算机视觉
超越YOLOv10/11、RT-DETRv2/3!中科大D-FINE重新定义边界框回归任务
中科大研究团队提出了一种新型目标检测器D-FINE,通过重新定义边界框回归任务,实现超越YOLOv10/11和RT-DETRv2/3的性能。D-FINE采用细粒度分布细化(FDR)和全局最优定位自蒸馏(GO-LSD)技术,显著提高了定位精度和检测速度。在COCO数据集上,D-FINE-L/X分别达到54.0%/55.8%的AP,并在NVIDIA T4 GPU上以124/78 FPS运行。
707 13
|
机器学习/深度学习 人工智能 自然语言处理
AI驱动的个性化学习路径优化
在当前教育领域,个性化学习正逐渐成为一种趋势。本文探讨了如何利用人工智能技术来优化个性化学习路径,提高学习效率和质量。通过分析学生的学习行为、偏好和表现,AI可以动态调整学习内容和难度,实现真正的因材施教。文章还讨论了实施这种技术所面临的挑战和潜在的解决方案。
1120 7
|
数据采集 JavaScript 前端开发
京东商品详情 API 接口指南(Python 篇)
本简介介绍如何使用Python抓取京东商品详情数据。首先,需搭建开发环境并安装必要的库(如requests、BeautifulSoup和lxml),了解京东反爬虫机制,确定商品ID获取方式。通过发送HTTP请求并解析HTML,可提取价格、优惠券、视频链接等信息。此方法适用于电商数据分析、竞品分析、购物助手及内容创作等场景,帮助用户做出更明智的购买决策,优化营销策略。
1450 0
|
人工智能 算法 数据可视化
DBSCAN密度聚类算法(理论+图解+python代码)
DBSCAN密度聚类算法(理论+图解+python代码)
9601 1
|
关系型数据库 MySQL 数据库连接
Django(四):Django项目部署数据库及服务器配置详解(MySQL)
Django(四):Django项目部署数据库及服务器配置详解(MySQL)
2076 11
|
机器学习/深度学习 人工智能 算法
【坚果识别】果实识别+图像识别系统+Python+计算机课设+人工智能课设+卷积算法
坚果识别系统,使用Python语言进行开发,通过TensorFlow搭建卷积神经网络算法模型,对10种坚果果实('杏仁', '巴西坚果', '腰果', '椰子', '榛子', '夏威夷果', '山核桃', '松子', '开心果', '核桃')等图片数据集进行训练,得到一个识别精度较高的模型文件,让后使用Django搭建Web网页端界面操作平台,实现用户上传一张坚果图片 识别其名称。
375 0