AI虫子种类识别数据集(近3000张图片已划分、已标注)|适用于YOLO系列深度学习分类检测任务【数据集分享】
数据集已划分为 train
、test
、val
三个子集,共计近 3000张高清图像,每张图像都包含清晰的目标注释文件(YOLO格式),非常适合用于深度学习模型中的目标检测与分类任务,特别是YOLOv5、YOLOv8、YOLOv11等模型的训练与测试。
背景
在农业智能化与生态研究中,虫害识别一直是计算机视觉中的重要应用方向。不同种类的昆虫对作物、林木等有着截然不同的影响,及时准确识别虫子种类对于灾害预警、防治投放具有实际意义。
然而,公开可用的虫子图像数据集较为稀缺,尤其是面向小样本、边缘设备部署场景下的高质量虫子目标检测数据集更是凤毛麟角。因此,我们整理并清洗了一个近3000张图片的虫子识别数据集,涵盖多种常见虫子种类,标注标准规范,便于训练YOLO类目标检测算法。
数据集概述
数据集中每张图像都配有YOLO格式标注文件,标注内容包括虫子在图像中的类别编号和边界框(bounding box)坐标信息,适合用于目标检测训练任务。
dataset/
├── images/
│ ├── train/
│ ├── val/
│ └── test/
├── labels/
│ ├── train/
│ ├── val/
│ └── test/
AI 代码解读
该结构简单明晰,开箱即用,便于接入各种深度学习训练流程。
数据集详情
- 图像总数:近3000张
- 图像格式:JPG(部分为PNG)
- 分辨率:大多在720p以上
- 注释格式:YOLO格式
.txt
,与图像同名 - 类别数量:共计 7类常见虫子
- 数据划分:
train
: 2089张val
: 447张test
: 448张
数据来源包括实地拍摄图像、公开虫子图像资源、手工清洗处理后的标注数据。所有标注均由专业人员完成,确保了高准确性和实用性。
所有类别均有丰富的样本图像,部分小样本类别适合用于数据增强、Few-shot等研究场景。
每个样本图像均包含虫体在图像中的 边界框(bounding box)坐标,并指明具体类别编号,完全遵循YOLO格式。例如某张图像的标注文件内容为:
3 0.512 0.439 0.187 0.274
AI 代码解读
表示第4类虫子在图像中的相对位置与大小。
适用场景
本数据集适用于多种计算机视觉研究与实际应用场景:
- ✅ YOLOv5 / YOLOv8 / YOLOv11等目标检测模型训练
- ✅ 多类虫子识别分类研究
- ✅ 数据增强/迁移学习实验
- ✅ 小样本学习 / 农业害虫识别模型开发
- ✅ AIoT边缘设备部署测试
同时该数据集也适合用作学生科研课题、AI竞赛、学术研究中的标准基准测试集。
结语
本数据集的发布旨在推动AI在生态虫害识别领域的落地应用,为模型提供高质量、结构清晰的数据资源。我们鼓励大家在遵守开源协议的前提下进行使用、训练与改进,也欢迎反馈优化建议。
后续我们也将提供基于该数据集的YOLO训练脚本、PyTorch使用示例、轻量化部署方案等配套资源,助力各类AI虫害识别项目高效落地。
数据集分享
通过网盘分享的文件:AI虫子种类识别数据集
链接: https://pan.baidu.com/s/1HC7vzPCHxr_WiYpt9sVgqQ?pwd=ru4c