文档备案控制台

开发者社区人工智能文章正文

口罩数据集整理：maskSet4k 带标签高质量面罩数据集

2022-02-18 5850

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 口罩数据集

❤️ 【专栏：数据集整理】❤️ 之【有效拒绝假数据】

👋 Follow me 👋，一起 Get 更多有趣 AI、冲冲冲 🚀 🚀

面罩数据集 | 下载自荐| 感谢支持

面罩数据集：
为什么是面罩：因为国内口罩类型种类繁多，因此这里把凡是类似口罩形状能够完全掩面的图片均标注为带了口罩（mask）。
原始数据主要来源：
SCUT-FBP5500_v2.1--亚洲人脸；
明星工作照片（机场、发布会、运动场地）多为爬虫所得；
整合其他一些没有 labels 的口罩数据集；

我所做的主要工作（数据打标+精选）如下：

   一：使用pytorch 版本 yolov5 进行二分类 mask 检测，首次模型训练15天，对数据打标；

   二：数据+标签，人工筛选
   

   三：打标数据更新数据集再次训练，提升模型精度

   四：二三步骤反复迭代 三次，最终得到 准确率（accuracy）高达 0.995 ，召回率 0.99 的检测模型；

   五：对数据标签的再次人工筛选，整理得到 **maskSet4k** 数据集；

   六：有偿发布该数据集（因为成果已经沉淀下去，该数据集属个人之前阶段学习兴趣总结所得，研究方向已换，后续价值有限）

基础分享如下：

小的目标检测数据集下载链接：

目标检测coco128官方下载链接

当前最好的开源口罩数据集：

武汉大学开源口罩人脸识别数据集：Real-World Masked Face Dataset

面罩数据集样本--带标签（口罩数据 100 + 人脸数据 100）

带标签口罩数据集--maskSet4k Sample

本次 maskSet4k 口罩数据集，主要包含内容如下：

下载压缩包之后，解压内容如下：

不带口罩数据，示例如下：

带面罩数据，示例如下：

该数据集主要特点如下：

训练数据量 4k, mask 和 unmak 比例 1:1；
标注准确率极高，因为模型迭代训练一个月的过程中，自己做人工检测和数据标签修正花费2个周末；
对于一个图片中存在多张人脸，会有部分人脸没有标签，因为模型检测不到（或者无法判断），那这样的人脸就是没有标签的；但是对于模型训练而言，这样的数据是没有影响的；
现有公开口罩数据集特点：数据量小，不带标签或者标签很不准确，本数据集有质量保证
网上下载的口罩数据集，通常需要花费精力整理和筛选才能够真正使用
该数据为真实场景佩戴的口罩（非模拟）
仅适用于二分类（戴口罩 0 与不戴 1），口罩检测
非免费提供

声明：该资源下载所得数据集，可自行研究使用、学术、工业皆可，请勿在互联网途径传播；

📙 博主 AI 领域八大干货专栏、诚不我欺

🍊 计算机视觉： Yolo专栏、一文读懂
🍊 计算机视觉：图像风格转换--论文--代码测试
🍊 计算机视觉：图像修复-代码环境搭建-知识总结
🍊 计算机视觉：超分重建-代码环境搭建-知识总结
🍊 深度学习：环境搭建，一文读懂
🍊 深度学习：趣学深度学习
🍊 落地部署应用：模型部署之转换-加速-封装
🍊 CV 和语音数据集：数据集整理

📙 预祝各位 2022 前途似锦、可摘星辰

🎉 作为全网 AI 领域干货最多的博主之一，❤️ 不负光阴不负卿 ❤️
❤️ 过去的一年、大家都经历了太多太多、祝你披荆斩棘、未来可期

🍊 我的C站万粉成长之路、2021 笔耕不辍、C站成长轨迹、有兴趣可查阅
🍊 深度学习模型训练推理——基础环境搭建推荐博文查阅顺序【基础安装—认真帮大家整理了】
📆 最近更新：2022年1月30日
🍊 点赞 👍 收藏 ⭐留言 📝 都是博主坚持写作、更新高质量博文的最大动力！

9-9

文章标签：

计算机视觉

机器学习/深度学习

人工智能

数据采集

数据处理

墨理学AI

目录

相关文章

a15723093529-22168

|

机器学习/深度学习算法计算机视觉

yolov8人脸识别-脸部关键点检测（代码+原理）

yolov8人脸识别-脸部关键点检测（代码+原理）

a15723093529-22168

2623 0 0

AI研究者手札

|

3月前

|

机器学习/深度学习人工智能监控

翻墙、攀爬、跨越围栏等违规行为检测数据集（10,000 张图片已划分）—安全检测实践

本数据集含10,000张标注图像（9030训练+1130验证），专用于翻墙、攀爬等违规行为检测，支持YOLOv8/v9等模型。含no_climb/climb二分类，YOLO格式标注，覆盖工地、校园、围栏等多场景，光照/角度/遮挡多样，开箱即用，助力智能安防系统快速落地。

AI研究者手札

571 2 2

AI研究者手札

|

5月前

|

机器学习/深度学习监控算法

驾驶员行为数据集（14000张高清标注）| YOLO训练实战危险驾驶行为识别

本项目开源高质量驾驶员危险行为数据集，含14000张高清标注图像，覆盖饮食、玩手机、睡觉三类行为，严格按YOLO格式划分训练/验证/测试集，支持YOLOv5/v8/v11直接训练，兼顾精度与泛化性，助力DMS研发与智能座舱落地。

AI研究者手札

1175 12 12

AI研究者手札

|

5月前

|

机器学习/深度学习人工智能监控

火焰与烟雾目标检测数据集（13,500张图片已划分、已标注）| AI训练适用于目标检测任务

本数据集含13,500张高质量火焰与烟雾图像，已精准标注（fire/smoke两类）、划分训练/验证/测试集，覆盖室内外多场景、多光照及复杂干扰环境，兼容YOLOv5/v8/v10等主流框架，专为火灾早期预警与智能安防检测任务设计。

AI研究者手札

1315 1 1

zzy的aly

|

机器学习/深度学习人工智能算法

基于YOLOV8的口罩佩戴实时检测系统【训练和系统源码+Pyside6+数据集+包运行】

本文介绍了基于YOLOv8算法的口罩佩戴实时检测系统，该系统通过7959张训练图片训练出有效识别模型，开发了带GUI界面的系统，支持图片、视频和摄像头实时检测口罩佩戴情况，提高疫情防控效率。

zzy的aly

1404 3 3

基于YOLOV8的口罩佩戴实时检测系统【训练和系统源码+Pyside6+数据集+包运行】

AI研究者手札

|

10月前

|

人工智能监控算法

睡岗检测/睡觉检测数据集（2000张图片已划分、已标注）轻松上手目标检测训练

本数据集包含2000张已标注睡岗行为图片，涵盖多种真实场景，适用于YOLO等目标检测模型训练。专为安防、工业值守、交通监控等智能识别场景设计，助力快速构建睡岗检测系统，推动AI在安全领域的落地应用。

AI研究者手札

1778 12 12

睡岗检测/睡觉检测数据集（2000张图片已划分、已标注）轻松上手目标检测训练

AI研究者手札

|

10月前

|

人工智能监控并行计算

厨房食品卫生与安全检测14类数据集（18万张图片，已划分、已标注）——AI智能检测的行业实践基石

本数据集包含18万张标注图像，覆盖蟑螂、老鼠、口罩佩戴等14类厨房安全目标，专为YOLO等目标检测模型设计，助力AI实现厨房卫生智能监控，推动食品安全数字化升级。

AI研究者手札

1169 1 3

厨房食品卫生与安全检测14类数据集（18万张图片，已划分、已标注）——AI智能检测的行业实践基石

AI研究者手札

|

11月前

|

机器学习/深度学习数据采集数据可视化

基于YOLOv8的粉尘污染检测识别｜完整源码数据集+PyQt5界面+完整训练流程+开箱即用！

随着工业化的快速发展，粉尘污染成为了环境监测和工业安全中必须关注的问题。传统的粉尘检测方法往往依赖人工采样和实验室分析，周期长、成本高。基于计算机视觉的自动化粉尘检测系统能够实时、准确地监控环境，从而极大提高安全和管理效率。本项目基于最新的YOLOv8算法，实现了粉尘污染检测与识别，并提供完整源码、数据集和可视化界面，实现开箱即用。

AI研究者手札

420 4 4

基于YOLOv8的粉尘污染检测识别｜完整源码数据集+PyQt5界面+完整训练流程+开箱即用！

AI研究者手札

|

12月前

|

机器学习/深度学习传感器人工智能

火灾火焰识别数据集（2200张图片已划分、已标注）｜适用于YOLO系列深度学习分类检测任务【数据集分享】

在人工智能和计算机视觉的快速发展中，火灾检测与火焰识别逐渐成为智慧城市、公共安全和智能监控的重要研究方向。一个高质量的数据集往往是推动相关研究的核心基础。本文将详细介绍一个火灾火焰识别数据集，该数据集共包含 2200 张图片，并已按照训练集（train）、验证集（val）、测试集（test）划分，同时配有对应的标注文件，方便研究者快速上手模型训练与评估。

AI研究者手札

4405 10 10

火灾火焰识别数据集（2200张图片已划分、已标注）｜适用于YOLO系列深度学习分类检测任务【数据集分享】

AI研究者手札

|

机器学习/深度学习人工智能监控

高质量人体检测与行人识别数据集-千张标注图片全解析已标注(目标检测任务数据集)分享

在计算机视觉和人工智能的发展浪潮中，人体检测与行人识别是一个极具应用价值和研究意义的方向。从智能监控到自动驾驶，从智慧城市到公共安全，人体检测数据集的质量与规模往往直接决定了算法模型的性能。本文将围绕一个包含上千张图片、已完成划分与标注的人体检测、行人识别数据集展开介绍，帮助研究者和开发者快速了解该数据集的特点、优势及其适用场景。

AI研究者手札

1958 0 0

热门文章

最新文章

Vivado官网获取License

EDAS微服务应用同城容灾最佳实践

掌门1对1微服务体系 Solar | 阿里巴巴 Sentinel 落地实践

System.BadImageFormatException: 试图加载格式不正确的程序。 (异常来自 HRESULT:0x8007000B)

Python的打包工具(setup.py)实战篇

Clion+STM 32Warn : Failed to open device: LIBUSB_ERROR_NOT_SUPPORTED

零基础入门低代码后端开发，只需几行代码就可以操作数据库

Xen-Server带数据重装系统

Facebook被再次曝出涉嫌夸大用户数据

创建响应式布局的10款优秀网格工具集锦

新版通义千问（Qwen3.8-Max-Preview）功能介绍

最新版阿里云通义千问大模型功能介绍

企业级Web访问管理系统架构设计与实践

交易分账系统安全如何评估？结合阿里云三级等保构建资金与系统双重防护体系

【2026最新】PyCharm下载、安装、汉化、配置一篇搞定（附免费版安装包）

【2026最新】Node.js官网下载、安装、环境配置一篇搞定（附安装包）

工业智能闭环：感知-决策-执行如何打通OT与IT的最后一公里？

电商产品页GEO优化：从关键词匹配到任务匹配的四步指南

2026年 | 8月云大使推广奖励规则

钣金加工站AI曝光低：产品语义网络重建复盘

相关电子书

更多

低代码开发师（初级）实战教程

冬季实战营第三期：MySQL数据库进阶实战

阿里巴巴DevOps 最佳实践手册

下一篇

一条命令迁移，帮你实现 OpenClaw 与 Hermes Agent 记忆互通！