工业粉尘检测数据集:从数据采集到模型训练(4000 张图片已划分、已标注)| 适用与目标检测

简介: 本数据集包含4000张已标注、已划分的粉尘图像,训练集与验证集按3:1比例分布,支持YOLO、COCO等格式,适用于目标检测、环境监测及AIoT应用,助力工业安全与智能感知研究。

粉尘检测数据集(4000 张图片已划分、已标注)

一、背景

随着工业智能化与安全生产要求的不断提升,粉尘检测逐渐成为环境监测与安全防护领域的重要研究方向。在矿山、工厂、建筑工地等高粉尘场景中,粉尘浓度过高不仅影响生产效率,更会对人体健康和设备安全造成严重威胁。
传统的粉尘检测方式通常依赖物理传感器,如激光粉尘仪、光散射式传感器等,但这些设备成本高、布设复杂、实时性不足。近年来,基于计算机视觉的粉尘识别与检测技术逐渐崛起,通过图像识别模型(如YOLO、EfficientNet、Vision Transformer等),可以实现对粉尘状态的实时检测与自动判断。

为推动粉尘检测的智能化研究,我们构建并公开了一个标准化、结构清晰、标注完备的 粉尘检测数据集(Dust Detection Dataset),为研究者与开发者提供高质量的训练与验证样本。


数据集下载

链接:https://pan.baidu.com/s/1LHce_fyo7slzQHtXGIBhZA?pwd=2nmk 提取码:2nmk 复制这段内容后打开百度网盘手机App,操作更方便哦

数据集说明

样本分类输出(中文):粉尘
样本分类输出(英文):dust
样本分类输出数量:1

训练集train: 2910个样本
验证集valid: 923个样本

训练集和验证集样本比例:约3:1

二、数据集概述

该数据集包含 4000 张高质量粉尘图像样本,并按照 3:1 比例划分为训练集与验证集,适用于目标检测、图像分类及环境监测等多种计算机视觉任务。

数据集组成 数量(张) 占比
训练集(train) 2910 约 72.8%
验证集(valid) 923 约 23.1%
合计(total) 4000 100%
  • 样本分类输出(中文):粉尘
  • 样本分类输出(英文):dust
  • 类别数量:1(单类别检测任务)

该数据集经过人工精确标注,标注格式兼容 YOLO 格式(.txt)COCO 格式(.json),用户可根据自身训练框架(如Ultralytics YOLOv8、MMDetection、Detectron2)直接加载。

image-20251016102748662


三、数据集详情

1. 图像来源与采集环境

数据样本主要采集自以下几类典型场景:

  • 工业生产环境(机械加工、焊接车间)
  • 矿区与隧道环境(煤尘、石粉)
  • 建筑施工现场(扬尘、混凝土粉末)
  • 实验室人工模拟场景(受控光照与粉尘浓度)

图像采集设备覆盖:

  • 高清工业相机(1080p、60fps)
  • 手机终端摄像头(多光照场景)
  • 监控系统截帧(固定视角、低帧率)

所有图像经过去噪、尺寸统一(640×640)、曝光补偿与颜色标准化处理,确保模型训练的稳定性与通用性。

image-20251016102820335


2. 标注规范

采用半自动标注 + 人工复核方式完成。标注工具使用 LabelImgRoboflow Annotator,标注格式如下:

class_id  x_center  y_center  width  height

例如(YOLO 格式):

0 0.531 0.478 0.612 0.532

其中 class_id = 0 对应 “dust” 类别。
所有标注文件与图片文件同名,方便直接载入模型训练框架。


3. 文件结构示例

Dust_Dataset/
│
├── train/
│   ├── images/
│   │   ├── 0001.jpg
│   │   ├── 0002.jpg
│   │   └── ...
│   └── labels/
│       ├── 0001.txt
│       ├── 0002.txt
│       └── ...
│
├── valid/
│   ├── images/
│   └── labels/
│
└── data.yaml

其中 data.yaml 文件包含以下内容:

train: ./train/images
val: ./valid/images
nc: 1
names: ['dust']

四、适用场景

该数据集可广泛应用于以下研究与工程场景:

  1. 环境监测系统开发
    可用于训练工业粉尘检测模型,实现实时监控与报警。
  2. YOLO 系列算法研究
    可作为单类检测任务的标准测试集,用于验证模型在小目标、模糊目标下的检测能力。
  3. 图像增强与去雾算法评估
    粉尘环境通常伴随模糊与光照不均,可用于验证图像去模糊或增强算法的有效性。
  4. AIoT 智能终端应用
    可结合边缘计算,实现嵌入式终端上的粉尘检测,如安全摄像头或无人巡检车。
  5. 模型轻量化与迁移学习实验
    因类别单一且样本量充足,适合作为迁移学习微调实验集。

image-20250907222940921

image-20250907223638624


五、结语

粉尘检测不仅关乎工业安全,更代表着AI 环境智能感知的重要方向。通过本数据集,研究者可以快速开展从数据预处理、模型训练到实际部署的全流程实验,推动智能监测系统的发展。
未来,我们计划在此基础上扩展更多类别(如烟雾、蒸汽、雾气等),构建多环境融合感知数据集,为智能视觉检测提供更全面的支持。

image-20250907223750289


推荐使用框架

  • YOLO
  • MMDetection
  • PaddleDetection

📦 数据格式兼容:YOLO、COCO、VOC

📘 关键词:粉尘检测 / 目标检测 / YOLO / 计算机视觉 / 数据集构建

在本文中,我们详细介绍了一个粉尘检测数据集,该数据集包含4000张图像,已按3:1比例划分为训练集与验证集,专门用于粉尘识别与检测任务。数据集具有以下几个特点:

  1. 数据集概述:包括训练集和验证集,训练集有2910张图片,验证集有923张图片,标注格式兼容YOLO和COCO,适合用于目标检测、图像分类等任务。
  2. 数据集详情:样本采集自多种工业、矿区及施工现场,图像经过去噪、标准化处理,确保高质量的数据输入。标注通过半自动方式完成,精度高。
  3. 适用场景:该数据集适用于环境监测系统开发、YOLO系列算法研究、图像增强评估、AIoT智能终端应用等领域,可以助力各种粉尘检测应用。
  4. 结语:粉尘检测数据集为工业智能化和环境安全提供了强有力的数据支持,为推动AI环境感知技术的发展提供了有价值的实验素材。未来,数据集将进一步扩展类别,构建更多元的智能感知系统。

通过该数据集,研究者可以在粉尘检测领域进行更为深入的探索,不仅提高了粉尘监测的效率,还促进了相关领域算法的不断优化与突破。

相关文章
|
9月前
|
机器学习/深度学习 数据采集 数据可视化
基于YOLOv8的粉尘污染检测识别|完整源码数据集+PyQt5界面+完整训练流程+开箱即用!
随着工业化的快速发展,粉尘污染成为了环境监测和工业安全中必须关注的问题。传统的粉尘检测方法往往依赖人工采样和实验室分析,周期长、成本高。基于计算机视觉的自动化粉尘检测系统能够实时、准确地监控环境,从而极大提高安全和管理效率。本项目基于最新的YOLOv8算法,实现了粉尘污染检测与识别,并提供完整源码、数据集和可视化界面,实现开箱即用。
基于YOLOv8的粉尘污染检测识别|完整源码数据集+PyQt5界面+完整训练流程+开箱即用!
|
并行计算 Linux 计算机视觉
还在手工标注数据集?快来试一试自动化多模型标注大模型-gui交互式标注(部署运行教程-高效生产力)
还在手工标注数据集?快来试一试自动化多模型标注大模型-gui交互式标注(部署运行教程-高效生产力)
|
机器学习/深度学习 人工智能 数据库
【表面缺陷检测】表面缺陷检测数据集汇总
本文收集整理了16个表面缺陷检测相关的数据集,并对每个数据集的特点进行了简单的介绍。
【表面缺陷检测】表面缺陷检测数据集汇总
|
4月前
|
机器学习/深度学习 人工智能 编解码
工业织物缺陷目标检测数据集(1000+高精度标注样本)| AI训练适用于目标检测任务
工业织物瑕疵检测并非简单的目标检测问题,而是一个融合了弱特征感知、噪声抑制与细粒度识别的综合挑战。本文介绍的数据集,正是围绕这一核心难点构建,具备较高的工程与研究价值。 无论是用于工业落地,还是作为算法验证基准,该数据集都为复杂弱纹理场景下的智能视觉检测研究提供了可靠支撑。 随着更先进的模型结构与训练策略不断涌现,基于此类真实工业数据集的探索,将持续推动智能制造向更高精度、更高可靠性方向发展。
工业织物缺陷目标检测数据集(1000+高精度标注样本)| AI训练适用于目标检测任务
|
7月前
|
数据采集 人工智能 监控
[数据集]作弊行为检测数据集(1100张图片已划分)[目标检测]
基于视觉 AI 的作弊行为检测正逐渐走向成熟,从简单的屏幕监控、人工复查逐步迈向自动化、实时化与精准识别。本数据集的构建,旨在为研究者与开发者提供一套轻量但高价值的训练数据,使智能监考系统能更好地识别作弊动作,尤其是使用手机等严重违规行为。
593 49
[数据集]作弊行为检测数据集(1100张图片已划分)[目标检测]
|
6月前
|
机器学习/深度学习 人工智能 运维
金属外表多种生锈检测数据集(1200张图片已划分)|面向工业巡检的目标检测数据集
本数据集包含1202张已标注划分的金属表面锈蚀图像,涵盖缝隙腐蚀、点蚀、均匀腐蚀和一般性腐蚀四类,适用于YOLO等目标检测模型训练。广泛用于工业设备、桥梁管道、建筑钢结构的智能巡检与安全评估,助力实现锈蚀自动识别与全生命周期管理。
|
2月前
|
机器学习/深度学习 人工智能 安全
工业粉尘检测数据集分享(适用于YOLO系列深度学习分类检测任务)
本数据集含4000张工业场景粉尘图像(训练集2910张、验证集923张),人工精标YOLO/COCO格式,覆盖矿山、工厂、工地等多场景,适配YOLO系列目标检测与分类任务,助力智能粉尘监测研发。(239字)
203 2
|
机器学习/深度学习 人工智能 测试技术
YOLO26如何训练自己的obb数据集(原理介绍+代码详见+结构框图) | (无人机航拍船舶为案列)
YOLO26全新发布!本文详解其核心创新:移除DFL、端到端无NMS推理、ProgLoss+STAL小目标优化、MuSGD优化器,并附无人机航拍船舶OBB数据集训练全流程与结构框图。
543 1
|
5月前
|
传感器 人工智能 边缘计算
无人机行人精准检测数据集(7000张图片已划分、已标注)|AI训练适用于目标检测任务
本数据集包含6990张无人机航拍图像,已标注并划分训练集与验证集,聚焦单一类别“person”,适用于YOLO系列模型,助力公共安全、城市治理等场景下的行人精准检测与实时监控。