如何使用 YOLOv5 获得最佳 mAP 和最佳训练结果

简介: 如何使用 YOLOv5 获得最佳 mAP 和最佳训练结果

前言

最好的教程就是官网,对于yolov5初学者,详细对于如何进行更好的数据标注,如何提高模型准确性一定很头疼吧,那么官方文档的这段解释一定要看看,本文就将官方文档中对于如何使用YOLOV5获得最佳训练结果这篇文章翻译过来,一起共同学习下数据集的初始前置准备。

本指南解释了如何使用 YOLOv5 🚀 生成最佳 mAP 和训练结果。

大多数情况下,无需更改模型或训练设置即可获得良好的结果,前提是数据集足够大且标记良好。如果一开始没有得到好的结果,你可以采取一些步骤来改进,但我们始终建议用户在考虑任何更改之前先使用所有默认设置进行训练。这有助于建立性能基线baseline并发现需要改进的领域。

如果您对训练结果有疑问,我们建议您提供尽可能多的信息(如果您希望得到有用的响应),包括结果图(列车损失、价值损失、P、R、mAP)、PR 曲线、混淆矩阵、训练镶嵌、测试结果和数据集统计图像,例如标签.png。所有这些都位于您的目录中,通常为 .project/nameyolov5/runs/train/exp

我们为在下面的 YOLOv5 训练中获得最佳结果的用户整理了一份完整的指南。

数据集

  • 每个类的图像。建议每类≥ 1500 张图像
  • 每个类的实例数。建议每个类≥ 10000 个实例(标记对象)
  • 图像多样性。必须代表已部署的环境。对于现实世界的用例,我们建议使用一天中不同时间、不同季节、不同天气、不同照明、不同角度、不同来源(在线抓取、本地收集、不同相机)等的图像。
  • 标签一致性。必须标记所有映像中所有类的所有实例。部分标记将不起作用。
  • 标签准确性。标签必须紧紧包围每个对象。对象与其边界框之间不应存在空格。任何对象都不应缺少标签。
  • 标签验证。在训练开始前查看以验证您的标签是否正确显示,即参见示例 mosaic。train_batch*.jpg
  • 背景图像。背景图像是没有对象的图像,这些对象被添加到数据集以减少误报 (FP)。我们建议大约 0-10% 的背景图像来帮助降低 FP(COCO 有 1000 张背景图像供参考,占总数的 1%)。背景图像不需要标签。

模型选择

YOLOv5xYOLOv5x6 这样的较大模型在几乎所有情况下都会产生更好的结果,但有更多的参数,需要更多的 CUDA 内存来训练,并且运行速度更慢。对于移动部署,我们建议使用 YOLOv5s/m,对于云部署,我们建议使用 YOLOv5l/x。请参阅我们的自述文件表,了解所有型号的完整比较。

  • 从预训练权重开始。推荐用于中小型数据集(即VOCVisDroneGlobalWheat)。将模型的名称传递给参数。模型从最新的 YOLOv5 版本自动下载。--weights
python train.py --data custom.yaml --weights yolov5s.pt
                                             yolov5m.pt
                                             yolov5l.pt
                                             yolov5x.pt
                                             custom_pretrained.pt
  • 从头开始。推荐用于大型数据集(即 COCO、Objects365、OIv6)。传递您感兴趣的模型体系结构 yaml 以及一个空参数:--weights ‘’
python train.py --data custom.yaml --weights '' --cfg yolov5s.yaml
                                                      yolov5m.yaml
                                                      yolov5l.yaml
                                                      yolov5x.yaml

训练设置

在修改任何内容之前,请先使用默认设置进行训练,以建立性能基线。train.py 设置的完整列表可以在 train.py 参数解析器中找到。

  • Epochs。从 300 个Epochs开始。如果这在早期过度拟合,那么您可以减少 epoch。如果在 300 个 epoch 之后没有发生过拟合,则训练更长时间,即 600、1200 等 epoch。
  • Image size。COCO 以原始分辨率进行训练,但由于数据集中存在大量小对象,因此它可以从更高分辨率的训练中受益,例如 。如果有许多小对象,则自定义数据集将受益于本机或更高分辨率的训练。最佳推理结果是在运行训练时获得的,即,如果您训练,您还应该在 进行测试和检测。--img 640--img 1280--img--img 1280--img 1280
  • Image size。使用硬件允许的最大容量。小批量会产生较差的批次规范统计,应避免使用。--batch-size
  • Hyperparameters :超参数。默认超参数位于 hyp.scratch-low.yaml 中。建议先使用默认超参数进行训练,然后再考虑修改任何超参数。通常,增加增强超参数将减少和延迟过拟合,从而实现更长的训练和更高的最终 mAP。减少损耗分量增益超参数将有助于减少这些特定损耗分量的过拟合。有关优化这些超参数的自动化方法,请参阅我们的超参数演化教程。hyp[‘obj’]

延伸阅读

如果你想了解更多,请参考:http://karpathy.github.io/2019/04/25/recipe/

祝您好运🍀

目录
相关文章
|
6月前
|
算法 数据可视化 PyTorch
YOLOv5性能评估指标->mAP、Precision、Recall、FPS、Confienc (讲解论文关注的主要指标)
YOLOv5性能评估指标->mAP、Precision、Recall、FPS、Confienc (讲解论文关注的主要指标)
1952 0
|
机器学习/深度学习 计算机视觉 数据可视化
YOLOv5改进系列(0)——重要性能指标、训练结果评价及分析、影响mAP指标的因素、优化mAP的方法
YOLOv5改进系列(0)——重要性能指标、训练结果评价及分析、影响mAP指标的因素、优化mAP的方法
6984 0
YOLOv5改进系列(0)——重要性能指标、训练结果评价及分析、影响mAP指标的因素、优化mAP的方法
|
5月前
|
Dart
Dart之集合详解(List、Set、Map)
Dart之集合详解(List、Set、Map)
|
2月前
|
Go 定位技术 索引
Go 语言Map(集合) | 19
Go 语言Map(集合) | 19
|
2月前
|
存储 前端开发 API
ES6的Set和Map你都知道吗?一文了解集合和字典在前端中的应用
该文章详细介绍了ES6中Set和Map数据结构的特性和使用方法,并探讨了它们在前端开发中的具体应用,包括如何利用这些数据结构来解决常见的编程问题。
ES6的Set和Map你都知道吗?一文了解集合和字典在前端中的应用
|
1月前
|
存储 分布式计算 Java
Stream很好,Map很酷,但答应我别用toMap():Java开发中的高效集合操作
在Java的世界里,Stream API和Map集合无疑是两大强大的工具,它们极大地简化了数据处理和集合操作的复杂度。然而,在享受这些便利的同时,我们也应当警惕一些潜在的陷阱,尤其是当Stream与Map结合使用时。本文将深入探讨Stream与Map的优雅用法,并特别指出在使用toMap()方法时需要注意的问题,旨在帮助大家在工作中更高效、更安全地使用这些技术。
40 0
|
3月前
|
存储 安全 Java
java集合框架复习----(4)Map、List、set
这篇文章是Java集合框架的复习总结,重点介绍了Map集合的特点和HashMap的使用,以及Collections工具类的使用示例,同时回顾了List、Set和Map集合的概念和特点,以及Collection工具类的作用。
java集合框架复习----(4)Map、List、set
|
3月前
|
Java
【Java集合类面试二十二】、Map和Set有什么区别?
该CSDN博客文章讨论了Map和Set的区别,但提供的内容摘要并未直接解释这两种集合类型的差异。通常,Map是一种键值对集合,提供通过键快速检索值的能力,而Set是一个不允许重复元素的集合。
|
3月前
|
算法 Java 索引
【Java集合类面试四】、 描述一下Map put的过程
这篇文章详细描述了HashMap中put操作的过程,包括首次扩容、计算索引、插入数据以及链表转红黑树和可能的再次扩容。
【Java集合类面试四】、 描述一下Map put的过程
|
3月前
|
存储