YOLO(You Only Look Once)系列算法是目标检测领域的重要进展,以其速度快和性能优异而著称。以下是YOLO系列的版本及进阶历史的概述:
1. YOLOv1:由Joseph Redmon等人在2016年提出,是YOLO系列的开山之作。它通过单次前向传播完成图像中所有目标的检测,将图像划分为网格,每个网格预测边界框和类别。YOLOv1在PASCAL VOC2007数据集上实现了63.4的mAP。
2. YOLOv2 (YOLO9000):在2016年提出,引入了锚点(anchor boxes)和批量归一化,提高了小目标的检测精度。同时,YOLOv2采用了全卷积的网络结构,并在高分辨率图像上进行了微调。
3. YOLOv3:于2018年发布,YOLOv3采用了多尺度特征提取,改进了网络结构,使用Darknet-53作为骨干网络,并且引入了特征金字塔网络(FPN)的概念,进一步提升了对不同尺度目标的检测能力。
4. YOLOv4:虽然Joseph Redmon离开了计算机视觉领域,但YOLOv4在2020年由Alexey Bochkovskiy等人发布。它通过实验多种技术,如CBN、PAN、SAM等,寻找到了训练策略和推理成本之间的最佳平衡点。
5. YOLOv5:在2020年6月由Glenn Jocher发布,是YOLOv4的后续版本,主要区别在于使用PyTorch而不是DarkNet进行开发,由Ultralytics维护。
6. YOLOv6:由美团视觉人工智能部在2022年发布,YOLOv6采用了无锚点的检测器,并对Backbone和Neck进行了重新设计,以提高GPU等硬件的效率。
7. YOLOv7:在2022年7月由YOLOv4和YOLOR的同一作者发布,提出了模型结构重参化和动态标签分配问题的优化,进一步减少了参数量和计算量。
8. YOLOv8:由Ultralytics在2023年1月发布,YOLOv8是无锚的,具有更快的NMS过程,提供了不同大小的模型选择,以适应不同的性能和精度需求。
9. YOLOv9:在2024年由原YOLOv7团队打造,提出了可编程梯度信息(PGI)的概念,并设计了基于梯度路径规划的通用高效层聚合网络(GELAN)。
YOLO系列算法的演进体现了目标检测领域对速度和准确性平衡的追求,以及对硬件适配和应用场景扩展的不断优化。每个版本的YOLO都在前一版本的基础上进行了改进和增强,以应对更复杂的目标检测任务。