文档备案控制台

开发者社区大数据文章正文

不同的batch_size对训练集和验证集的影响

2023-06-23 655

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 不同的batch_size对训练集和验证集的影响

1 问题

我们知道，不同的batch_size对我们的训练集和验证集得出结果的精度和loss都会产生影响,是设置batch_size越大我们得到的精度越好，loss越好。还是batch_size越小我们得到的精度越好，loss越好呢？

2 方法

我们使用的是python的可视化技术进行问题的探究，我们需要在图像中看到当batch_size由小到大的过程中对训练集精度和loss以及验证集的精度和loss值的变化曲线。

利用python画出的batch_size对训练集精度的影响，我们可以在下图中看见并不是batch_size越大，我们的训练集精度就越好，在我给出的这几个batch_size中8才是最好的。

下图就是不同的batch_size对训练集loss的变化

下图是不同的batch_size对验证集精度的变化

下图是不同的batch_size对验证集loss的变化

其中画图的工具就是用python中matplotlib.pyplot模块，该模块中也有很多的画图的函数，可以画各种各样的可视化图形。

3 结语

在本次的博客中，我们通过实验证明了我们设置的batch_size并不是越大越好，也不是越小越好，做这样的验证，而是其中有一些值会趋近很好，这样我们就需要通过大量的实验来证明，在实验的过程中，我们使用的程序就需要执行很久，这也是需要占用我们时间资源。

文章标签：

Python

数据可视化

greework

目录

相关文章

其名美曰

|

机器学习/深度学习计算机视觉网络架构

RT-DETR改进策略【模型轻量化】| 替换骨干网络 CVPR-2024 StarNet，超级精简高效的轻量化模块

RT-DETR改进策略【模型轻量化】| 替换骨干网络 CVPR-2024 StarNet，超级精简高效的轻量化模块

其名美曰

924 63 63

RT-DETR改进策略【模型轻量化】| 替换骨干网络 CVPR-2024 StarNet，超级精简高效的轻量化模块

蚝油菜花

|

机器学习/深度学习人工智能 PyTorch

DeepSeek开源周第四弹之一！DualPipe：训练V3/R1的双向流水线并行技术，计算与训练完全重叠，训练效率提升200%

DeepSeek 开源的 DualPipe 技术通过双向流水线并行设计，显著提升大规模深度学习模型的训练效率，优化计算与通信重叠，降低内存峰值需求，适用于推理加速、多模态数据处理等场景。

蚝油菜花

882 1 1

DeepSeek开源周第四弹之一！DualPipe：训练V3/R1的双向流水线并行技术，计算与训练完全重叠，训练效率提升200%

sunrr

|

缓存

选择合适的CPU

【10月更文挑战第30天】选择合适的CPU

sunrr

349 3 3

TsingtaoAI

|

机器学习/深度学习传感器人工智能

2024.11｜全球具身智能的端到端AI和具身Agent技术发展到哪里了

2024年，具身智能领域取得显著进展，特别是在端到端AI控制系统和多模态感知技术方面。这些技术不仅推动了学术研究的深入，也为科技公司在实际应用中带来了突破。文章详细介绍了端到端AI的演化、自监督学习的应用、多模态感知技术的突破、基于强化学习的策略优化、模拟环境与现实环境的迁移学习、长程任务规划与任务分解、人机协作与社会交互能力，以及伦理与安全问题。未来几年，具身智能将在多模态感知、自监督学习、任务规划和人机协作等方面继续取得重要突破。

TsingtaoAI

916 2 2

路人贾jia

|

机器学习/深度学习计算机视觉 Python

YOLOv5改进系列（2）——添加CBAM注意力机制

YOLOv5改进系列（2）——添加CBAM注意力机制

路人贾jia

11604 1 4

YOLOv5改进系列（2）——添加CBAM注意力机制

阿里云存储

|

存储缓存文件存储

如何保证分布式文件系统的数据一致性

分布式文件系统需要向上层应用提供透明的客户端缓存，从而缓解网络延时现象，更好地支持客户端性能水平扩展，同时也降低对文件服务器的访问压力。当考虑客户端缓存的时候，由于在客户端上引入了多个本地数据副本（Replica)，就相应地需要提供客户端对数据访问的全局数据一致性。

阿里云存储

32551 78 142

如何保证分布式文件系统的数据一致性

软件求生

|

消息中间件存储运维

轻量级分布式事务实现：掌握最大努力通知方案

本文介绍了分布式事务的重要概念，特别是最大努力通知方案。最大努力通知是一种基于消息通知的分布式事务处理方式，通过异步通知确保最终一致性。方案包括事务消息发送、消息中间件持久化和最大努力通知三个步骤。虽然它实现简单、性能高且灵活，但可能无法保证强一致性，且存在重试和人工干预的成本。文中还提供了一个电商订单与库存系统同步的案例，并分析了该方案的优缺点。

软件求生

477 1 1

八百标兵奔北坡

|

数据采集 JavaScript 前端开发

如何判断一个网站是否采取了反爬虫措施

通过观察请求响应、分析请求频率限制和检测JavaScript动态加载来初步判断网站是否使用反爬虫措施。使用Python `requests` 发送请求并检查响应头和内容，寻找验证码、限制信息。尝试短时间内多次请求，看是否被限制。使用Selenium模拟浏览器行为，获取动态加载内容。注意，这些方法仅为初步判断，实际可能需更深入分析，并确保爬取行为合法合规。

八百标兵奔北坡

3156 2 2

阿旭算法与机器学习

|

人工智能并行计算数据可视化

即插即用 | YOLOv8热力图可视化方法详解，揭秘AI如何「看」世界！【附完整源码】

即插即用 | YOLOv8热力图可视化方法详解，揭秘AI如何「看」世界！【附完整源码】

阿旭算法与机器学习

3170 0 0

亚丁号

|

SQL 定位技术 Android开发

分享119个Android手机应用源代码总有一个是你想要的

分享119个Android手机应用源代码总有一个是你想要的

亚丁号

1328 2 2

热门文章

最新文章

使用阿里云容器服务Kubernetes实现蓝绿发布功能

【云周刊】第161期：阿里云ET城市大脑入驻国家博物馆“复兴之路”，再获“人工智能国家队”认可

redis4.0之MEMORY命令详解

技术赋能无止境 Kubernetes Meetup 北京站完美闭幕

iOS 调试：通过 Safari/Chrome 调试 WebView

超大坑！springboot + vue + element-ui，运行前端项目报these dependencies were not found的问题

Hadoop配置LDAP集成Kerberos

RAM与ROM的区别及应用

Docker Hub 镜像仓库

csv格式文件最大行数最大列数（各个excel版本）

保姆级教学：OpenClaw(Clawdbot)阿里云及本地部署接入伟达免费API全指南

阿里云1分钟或本地部署OpenClaw+AIOps高效运维实战：Prometheus+夜莺MCP，轻量化监控分析指南

友情链接的代码自写原创

C++ IO流详解：标准IO、文件IO与字符串IO实战

保姆级指南：OpenClaw阿里云及本地部署最佳实践：抓取行业调研资料+三维提效法，7天吃透陌生赛道

[大模型实战 07] 基于 LlamaIndex ReAct 框架手搓全自动博客监控 Agent

OpenClaw(Clawdbot)云端及本地部署保姆级教程，这些提示词skills构建“第二大脑”（智能知识数据库）

2026年阿里云一键部署OpenClaw保姆级教程，快速拥有专属AI助理！

突破封装之困：AI时代编程新范式——面向意图编程（Intent-Oriented Programming, IOP）

OpenClaw 用户部署和使用指南汇总

相关电子书

更多

低代码开发师（初级）实战教程

冬季实战营第三期：MySQL数据库进阶实战

阿里巴巴DevOps 最佳实践手册

下一篇

ECS账号安全防护最佳实践