❤️ 【专栏:数据集整理】❤️ 之【有效拒绝假数据】
👋 Follow me 👋,一起 Get 更多有趣 AI、冲冲冲 🚀 🚀
面罩数据集 | 下载自荐| 感谢支持
- 面罩数据集:
为什么是面罩:因为国内口罩类型种类繁多,因此这里把凡是类似口罩形状能够完全掩面的图片均标注为带了口罩(mask)。
- 原始数据主要来源:
SCUT-FBP5500_v2.1--亚洲人脸;
明星工作照片(机场、发布会、运动场地)多为爬虫所得;
整合其他一些没有 labels 的口罩数据集; 我所做的主要工作(数据打标+精选)如下:
一:使用pytorch 版本 yolov5 进行二分类 mask 检测,首次模型训练15天,对数据打标; 二:数据+标签,人工筛选 三:打标数据更新数据集再次训练,提升模型精度 四:二三步骤反复迭代 三次,最终得到 准确率(accuracy)高达 0.995 ,召回率 0.99 的检测模型; 五:对数据标签的再次人工筛选,整理得到 **maskSet4k** 数据集; 六:有偿发布该数据集(因为成果已经沉淀下去,该数据集属个人之前阶段学习兴趣总结所得,研究方向已换,后续价值有限)
基础分享如下:
小的目标检测数据集下载链接:
当前最好的开源口罩数据集:
面罩数据集样本--带标签(口罩数据 100 + 人脸数据 100)
本次 maskSet4k 口罩数据集,主要包含内容如下:
下载压缩包之后,解压内容如下:
不带口罩数据,示例如下:
带面罩数据,示例如下:
该数据集主要特点如下:
- 训练数据量 4k, mask 和 unmak 比例 1:1;
- 标注准确率极高,因为模型迭代训练一个月的过程中,自己做人工检测和数据标签修正花费2个周末;
- 对于一个图片中存在多张人脸,会有部分人脸没有标签,因为模型检测不到(或者无法判断),那这样的人脸就是没有标签的;但是对于模型训练而言,这样的数据是没有影响的;
- 现有公开口罩数据集特点:数据量小,不带标签或者标签很不准确,本数据集有质量保证
- 网上下载的口罩数据集,通常需要花费精力整理和筛选才能够真正使用
- 该数据为真实场景佩戴的口罩(非模拟)
- 仅适用于二分类(戴口罩 0 与 不戴 1),口罩检测
- 非免费提供
声明:该资源下载所得数据集,可自行研究使用、学术、工业皆可,请勿在互联网途径传播;
📙 博主 AI 领域八大干货专栏、诚不我欺
- 🍊 计算机视觉: Yolo专栏、一文读懂
- 🍊 计算机视觉:图像风格转换--论文--代码测试
- 🍊 计算机视觉:图像修复-代码环境搭建-知识总结
- 🍊 计算机视觉:超分重建-代码环境搭建-知识总结
- 🍊 深度学习:环境搭建,一文读懂
- 🍊 深度学习:趣学深度学习
- 🍊 落地部署应用:模型部署之转换-加速-封装
- 🍊 CV 和 语音数据集:数据集整理
📙 预祝各位 2022 前途似锦、可摘星辰
🎉 作为全网 AI 领域 干货最多的博主之一,❤️ 不负光阴不负卿 ❤️
❤️ 过去的一年、大家都经历了太多太多、祝你披荆斩棘、未来可期
- 🍊 我的C站万粉成长之路、2021 笔耕不辍、C站成长轨迹、有兴趣可查阅
- 🍊 深度学习模型训练推理——基础环境搭建推荐博文查阅顺序【基础安装—认真帮大家整理了】
- 📆 最近更新:2022年1月30日
- 🍊 点赞 👍 收藏 ⭐留言 📝 都是博主坚持写作、更新高质量博文的最大动力!