Dataset:数据集集合(CV方向数据集)——常见的计算机视觉图像数据集大集合包括表面缺陷检测数据集(建议收藏,持续更新)(三)

简介: Dataset:数据集集合(CV方向数据集)——常见的计算机视觉图像数据集大集合包括表面缺陷检测数据集(建议收藏,持续更新)

6、天池竞赛—铝型材表面瑕疵数据集


数据集下载:https://tianchi.aliyun.com/competition/entrance/231682/information


image.png


      铝型材是佛山南海的支柱性产业。在铝型材的实际生产过程中,由于各方面因素的影响,铝型材表面会产生裂纹、起皮、划伤等瑕疵,这些瑕疵会严重影响铝型材的质量。为保证产品质量,需要人工进行肉眼目测。然而,铝型材的表面自身会含有纹路,与瑕疵的区分度不高。传统人工肉眼检查十分费力,不能及时准确的判断出表面瑕疵,质检的效率难以把控。近年来,深度学习在图像识别等领域取得了突飞猛进的成果。铝型材制造商迫切希望采用最新的AI技术来革新现有质检流程,自动完成质检任务,减少漏检发生率,提高产品的质量,使铝型材产品的生产管理者彻底摆脱了无法全面掌握产品表面质量的状态。本次大赛选择南海铝型材标杆企业的真实痛点作为赛题场景,寻求解决方案,助力企业实现转型升级,提升行业竞争力。

      大赛数据集里有1万份来自实际生产中有瑕疵的铝型材监测影像数据,每个影像包含一个或多种瑕疵。供机器学习的样图会明确标识影像中所包含的瑕疵类型。

使用某企业某一产线某一时间段获取的铝型材图片,训练算法来定位瑕疵所在位置以及判断瑕疵的类型。



7、弱监督学习下的工业光学检测


《Weakly Supervised Learning for Industrial Optical Inspection》

数据集下载:https://hci.iwr.uni-heidelberg.de/content/weakly-supervised-learning-industrial-optical-inspection


image.png


     提出了一个用于统计纹理表面检测的综合基准语料库。我们希望它有助于进一步发展和基准分类算法的应用于工业光学检测。所有数据都是公开的,可以从这个页面下载。2007年DAGM研讨会的比赛,DAGM(德意志Arbeitsgemeinschaft毛皮Mustererkennung汽车集团,德国的章IAPR国际协会(模式识别)和GNSS(德国的欧洲神经网络社会章)提供了一个开放的竞争弱监督学习工业光学检验作为DAGM研讨会的一部分,在2007年举行。该竞赛的灵感来自于自动化光学检测可以显著降低工业质量控制的成本。参赛者必须设计一种分类算法:


检测各种统计纹理背景上的各种缺陷。

学习从弱标记的训练数据自动识别缺陷。

处理在开发时不知道其确切特征的数据。

自动调整所有参数,不需要任何人工干预。

跑步时间适中(本比赛训练时间为24小时,测试阶段为12小时)。

考虑了假阳性和假阴性决策的不对称成本(竞赛使用1:20)。

     这些数据是人工生成的,但类似于现实世界中的问题。10个数据集中的前6个,记为开发数据集,应该用于算法开发。剩下的四个数据集,被称为比赛数据集,可以用来评估表现。研究人员应考虑在开发完成前不使用或分析竞赛数据集作为荣誉准则。在下面我们提供一些关于数据集的细节:


每个开发(竞赛)数据集包含1000 (2000)“无缺陷”及150 (300)“有缺陷的”图像保存在灰度8位PNG格式。

每个数据集由不同的纹理模型和缺陷模型生成。

“无缺陷”的图像显示的是没有缺陷的背景纹理,“有缺陷”的图像恰好在背景纹理上标注了一个缺陷。

所有数据集被随机分割成大小相等的训练和测试子数据集。

弱标签以椭圆的形式提供,粗略地指出缺陷区域。从技术上讲,有缺陷的图像是通过位于文件夹“Label”中的PNG格式的单独的8位灰度图像来增强的。值0和255分别表示背景和缺陷区域。


8、城市路面裂缝图像数据集


数据集下载:https://github.com/cuilimeng/CrackForest-dataset




CrackForest数据集是一个能够反映城市路面状况的标注路面裂缝图像数据库。



9、桥梁裂缝图像数据集


数据集下载:https://github.com/Charmve/Surface-Defect-Detection/tree/master/Bridge_Crack_Image




        该数据集主要用于训练DBCC模型和桥梁裂缝检测。



10、磁瓦表面缺陷数据集


《Saliency of magnetic tile surface defects》

数据集下载:https://github.com/Charmve/Surface-Defect-Detection/tree/master/Magnetic-Tile-Defect




这是论文《Saliency of magnetic tile surface defects》的数据集。采集了6种常见磁瓦表面缺陷的图像,并对其像素级地面真值进行标记。表面缺陷显著性检测工具箱可以在https://github.com/abin24/Saliency-detection-toolbox找到。其中,我们的MCue和其他14个显著性检测模型是可用的。




11、铁轨表面缺陷数据集


数据集下载:http://icn.bjtu.edu.cn/Visint/resources/RSDDs.aspx




      RSDDs数据集包含两种类型的数据集:第一种是从快车道捕获的I型RSDDs数据集,其中包含67个具有挑战性的图像。第二个是从普通/重型运输轨道捕获的II型RSDDs数据集,其中包含128个具有挑战性的图像。  两个数据集的每幅图像至少包含一个缺陷,并且背景复杂且噪声很大。  RSDDs数据集中的这些缺陷已由一些专业的人类观察员在轨道表面检查领域进行了标记。




12、Kylberg纹理数据集


数据集下载:http://www.cb.uu.se/~gustaf/texture/




数据集描述


28个纹理类

每个职业有160个独特的纹理补丁。(Alternative dataset with 12 rotation per original patch, 160*12=1920纹理patch per class)

纹理补丁大小:576x576像素。

文件格式:无损压缩8位PNG格式。

对所有patch进行归一化,均值127,标准差40。

每个纹理类一个目录。

文件命名如下:blanket1-d-p011-r180。png,其中blanket1为类名,d为原始图像样本号(可能值为a、b、c或d), p011为patch号11,r180 patch旋转180度。

 

相关文章
|
3月前
|
JSON 人工智能 数据格式
AI计算机视觉笔记二十六:YOLOV8自训练关键点检测
本文档详细记录了使用YOLOv8训练关键点检测模型的过程。首先通过清华源安装YOLOv8,并验证安装。接着通过示例权重文件与测试图片`bus.jpg`演示预测流程。为准备训练数据,文档介绍了如何使用`labelme`标注工具进行关键点标注,并提供了一个Python脚本`labelme2yolo.py`将标注结果从JSON格式转换为YOLO所需的TXT格式。随后,通过Jupyter Notebook可视化标注结果确保准确性。最后,文档展示了如何组织数据集目录结构,并提供了训练与测试代码示例,包括配置文件`smoke.yaml`及训练脚本`train.py`,帮助读者完成自定义模型的训练与评估。
|
1月前
|
机器学习/深度学习 传感器 算法
行人闯红灯检测:基于计算机视觉与深度学习的智能交通解决方案
随着智能交通系统的发展,传统的人工交通违法判断已难以满足需求。本文介绍了一种基于计算机视觉与深度学习的行人闯红灯自动检测系统,涵盖信号灯状态检测、行人检测与跟踪、行为分析及违规判定与报警四大模块,旨在提升交通管理效率与安全性。
|
7月前
|
机器学习/深度学习 算法 计算机视觉
计算机视觉实战项目3(图像分类+目标检测+目标跟踪+姿态识别+车道线识别+车牌识别+无人机检测+A*路径规划+单目测距与测速+行人车辆计数等)
计算机视觉实战项目3(图像分类+目标检测+目标跟踪+姿态识别+车道线识别+车牌识别+无人机检测+A*路径规划+单目测距与测速+行人车辆计数等)
|
3月前
|
机器学习/深度学习 编解码 自动驾驶
计算机视觉之图像到图像的翻译
图像到图像的翻译(Image-to-Image Translation)是指将一种图像从一种表示转换为另一种表示的过程。该任务的目标是在保证图像语义信息的前提下,将图像风格、颜色或其他视觉特征进行转换。该技术在计算机视觉领域具有广泛应用,例如图像风格迁移、图像修复、图像增强、超分辨率、语义分割等。
87 4
|
3月前
|
存储 人工智能 数据可视化
AI计算机视觉笔记二十一:PaddleOCR训练自定义数据集
在完成PaddleOCR环境搭建与测试后,本文档详细介绍如何训练自定义的车牌检测模型。首先,在`PaddleOCR`目录下创建`train_data`文件夹存放数据集,并下载并解压缩车牌数据集。接着,复制并修改配置文件`ch_det_mv3_db_v2.0.yml`以适应训练需求,包括设置模型存储目录、训练可视化选项及数据集路径。随后,下载预训练权重文件并放置于`pretrain_models`目录下,以便进行预测与训练。最后,通过指定命令行参数执行训练、断点续训、测试及导出推理模型等操作。
|
3月前
|
人工智能 计算机视觉
AI计算机视觉笔记十五:编写检测的yolov5测试代码
该文为原创文章,如需转载,请注明出处。本文作者在成功运行 `detect.py` 后,因代码难以理解而编写了一个简易测试程序,用于加载YOLOv5模型并检测图像中的对象,特别是“人”类目标。代码实现了从摄像头或图片读取帧、进行颜色转换,并利用YOLOv5进行推理,最后将检测框和置信度绘制在输出图像上,并保存为 `result.jpg`。如果缺少某些模块,可使用 `pip install` 安装。如涉及版权问题或需获取完整代码,请联系作者。
|
3月前
|
人工智能 数据处理 计算机视觉
AI计算机视觉笔记十六:yolov5训练自己的数据集
本文介绍了一种利用云服务器AutoDL训练疲劳驾驶行为检测模型的方法。由于使用本地CPU训练效率低下,作者选择了性价比高的AutoDL云服务器。首先,从网络获取了2000多张疲劳驾驶行为图片并使用labelimg软件进行标注。接着,详细介绍了在云服务器上创建实例、上传数据集和YOLOv5模型、修改配置文件以及开始训练的具体步骤。整个训练过程耗时约3小时,最终生成了可用于检测的模型文件。
|
4月前
|
机器学习/深度学习 算法 大数据
【2023年MathorCup高校数学建模挑战赛-大数据竞赛】赛道A:基于计算机视觉的坑洼道路检测和识别 python 代码解析
本文提供了2023年MathorCup高校数学建模挑战赛大数据竞赛赛道A的解决方案,涉及基于计算机视觉的坑洼道路检测和识别任务,包括数据预处理、特征提取、模型建立、训练与评估等步骤的Python代码解析。
92 0
【2023年MathorCup高校数学建模挑战赛-大数据竞赛】赛道A:基于计算机视觉的坑洼道路检测和识别 python 代码解析
|
4月前
|
机器学习/深度学习 人工智能 数据处理
AI计算机视觉笔记一:YOLOV5疲劳驾驶行为检测
如何使用云服务器AutoDL进行深度学习模型的训练,特别是针对YOLOV5疲劳驾驶行为训练检测
|
7月前
|
编解码 边缘计算 自然语言处理
2024年5月计算机视觉论文推荐:包括扩散模型、视觉语言模型、图像编辑和生成、视频处理和生成以及图像识别等各个主题
五月发布的计算机视觉领域重要论文涵盖了扩散模型、视觉语言模型、图像生成与编辑及目标检测。亮点包括:1) Dual3D提出双模式推理策略,实现高效文本到3D图像生成;2) CAT3D利用多视图扩散模型创建3D场景,仅需少量图像;3) Hunyuan-DiT是多分辨率的中文理解扩散Transformer,可用于多模态对话和图像生成;4) 通过潜在扩散模型从EEG数据重建自然主义音乐,展示复杂音频重建潜力。此外,还有关于视觉语言模型和图像编辑的创新工作,如BlobGEN用于合成具有控制性的图像。
290 3

热门文章

最新文章