天池数据集|精品数据集推荐(工业篇)

简介: 数据是人工智能时代重要的生产要素,高质量训练数据对深度学习模型的建立和优化有关键性的作用,建立大规模、高水准的标注数据集,是推动AI科研和技术前进的驱动力。

数据是人工智能时代重要的生产要素,高质量训练数据对深度学习模型的建立和优化有关键性的作用,建立大规模、高水准的标注数据集,是推动AI科研和技术前进的驱动力。

制造业是我国国民经济的主体,推动数字化转型,降本增质提速是当今制造业的发展方向。天池通过举办大数据竞赛,希望通过技术创新的方式来推动了产业的创新发展。AI模型的落地离不开高质量数据集的支撑,天池平台开放出一批高标准严要求下真实业务场景的数据,涵盖纺织、食品饮料、非金属制品等行业,小萌喵今天就带大家一起来看看天池上开放的工业数据集。

布匹瑕疵检测数据集

研究方向:工业质检/目标检测

2016年我国布匹产量超过700亿米且产量一直处于上升趋势。布料与人们日常生活接触密切,纺织行业在我国国民经济中所占的地位不言而喻。工厂生产时,对大量布匹的质检通常都是工人肉眼完成的,这种形式检测速度慢、劳动强度大,而且受到工人主观因素影响,将人工智能和计算机视觉技术应用于纺织行业,可以进一步助力纺织行业的自动化,降低对人工的依赖,提升布匹疵点检验的准确度,提升布样疵点质检的效果和效率。

天池开放布匹疵点数据集,包含瑕疵各异的布匹照片,每张照片含素色布的一个或多种瑕疵。

了解更多详情/下载使用数据集请戳:https://tianchi.aliyun.com/dataset/dataDetail?dataId=79336

截屏2021-12-02 下午8.59.47.png

图1:瑕疵图示(黄色框为瑕疵部分)

瓶装白酒疵品检测数据集

研究方向:工业质检/目标检测

与布匹生产流程类似,在瓶装酒的生产过程中,受到原材料质量(酒瓶)以及加工工艺(灌装)等因素的影响,产品中可能存在各类瑕疵影响产品质量。但跟布匹不同的是,酒瓶上的瑕疵面积较小不容易被发现,并且瑕疵种类多,通常一条产线一般需要有三到五个质检环节分别检测不同类型的瑕疵。目前瓶装酒厂家只能选择投入大量人力用于产品质检。如果可以引进高效、可靠的自动化质检可以降低大量人工成本同时提高质检效,是非常有意义的工作。

天池提供白酒疵品数据集,数据集中白酒瓶身存在的各种瑕疵,包括:瓶盖瑕疵、标贴瑕疵、喷码瑕疵。

如需查看数据集更多详细内容请戳:https://tianchi.aliyun.com/dataset/dataDetail?dataId=110147

截屏2021-12-02 下午8.59.54.png

图2:瓶盖变形、瓶盖坏边示意图

瓷砖表面暇疵检测数据集

研究方向:工业质检/目标检测

以抛釉砖为例的瓷砖生产环节一般经过原材料混合研磨、脱水、压胚、喷墨印花、淋釉、烧制、抛光,最后进行质量检测和包装。得益于产业自动化的发展,目前生产环节已基本实现无人化。而质量检测环节仍大量依赖人工完成。一般来说,一条产线需要配2~6名质检工,这样的质检方式效率低下、质检质量层次不齐、成本又居高不下。瓷砖的表面是用户衡量瓷砖质量的最直观标准,是瓷砖行业生产和质量管理的重要环节,也是困扰行业多年的技术瓶颈,同时长时间肉眼在强光下观察瓷砖表面寻找瑕疵也对工人的视力也会产生影响。如果能在技术上解决上述问题,无疑是有很大的经济价值和社会意义。

为了推动AI技术应用到传统的行业,天池推出瓷砖数据集,该数据集内含的数据覆盖到了瓷砖产线所有常见瑕疵,包括粉团、角裂、滴釉、断墨、滴墨、B孔、落脏、边裂、缺角、 砖渣、白边等。还有一些缺陷只能在特定视角才可以观察,包括低角度光照黑白图、高角度光照黑白图、彩色图,保证覆盖到生产环境中产生的所有瑕疵能被识别,是国内首个聚焦在瓷砖瑕疵质检的数据集。数据集下载请戳:https://tianchi.aliyun.com/dataset/dataDetail?dataId=110088

截屏2021-12-02 下午9.00.04.png

图3:瓷砖瑕疵质检过程

以上所有数据都是在专业人员指导下,通过产线上架设专业拍摄设备、实地采集生产过程真实的数据,保证了数据来源的可靠性和科学性。

在数据标注过程中,达摩院的算法专家们对数据质量进行了全程把关,保证了天池数据集的质量。

关于天池数据集

天池数据集是阿里集团的科研数据集开放平台,数据集覆盖了新零售、文娱、医疗健康、交通、安全、能源、自然科学等十多个行业,涵盖了数据挖掘、机器学习、自然语言处理、计算机视觉、决策优化等前沿的技术领域。小伙伴们可以点击下方阅读原文进入官网https://tianchi.aliyun.com/dataset进行查看,还有更多宝藏数据等你发现。

截屏2021-12-02 下午9.00.13.png

相关文章
|
机器学习/深度学习 人工智能 数据库
【表面缺陷检测】表面缺陷检测数据集汇总
本文收集整理了16个表面缺陷检测相关的数据集,并对每个数据集的特点进行了简单的介绍。
【表面缺陷检测】表面缺陷检测数据集汇总
|
存储 关系型数据库 数据库
阿里云中小企业扶持权益介绍,助力企业轻松上云
在数字化浪潮的推动下,中小企业正面临着转型升级的重要关口。阿里云深知中小企业的挑战与机遇,特别推出了一系列中小企业扶持权益,旨在帮助企业以更低的成本、更高的效率拥抱云计算,开启智能时代创业的新范式。
阿里云中小企业扶持权益介绍,助力企业轻松上云
|
存储 算法 安全
用户密码到底要怎么加密存储?
作为互联网公司的信息安全从业人员经常要处理撞库扫号事件,产生撞库扫号的根本原因是一些企业发生了信息泄露事件,且这些泄露数据未加密或者加密方式比较弱,导致黑客可以还原出原始的用户密码。
1197 0
用户密码到底要怎么加密存储?
|
机器学习/深度学习 数据可视化 算法
【33】t-SNE原理介绍与对手写数字MNIST的可视化结果
【33】t-SNE原理介绍与对手写数字MNIST的可视化结果
1320 0
【33】t-SNE原理介绍与对手写数字MNIST的可视化结果
|
人工智能 算法 大数据
【天池大赛】历届比赛资料
【天池大赛】历届比赛资料
|
供应链 数据挖掘 大数据
【客户案例】洋河股份:一块屏管理8000+ 经销商
江苏洋河酒厂股份有限公司(苏酒集团)是中国白酒行业领军企业。洋河积极进行数字化转型,通过构建数据驱动的管理体系,大幅提升运营效率和精准度,特别是在组织架构、费用管理和经销商评估等方面取得了显著成效。
532 3
|
机器学习/深度学习 人工智能 算法
X-AnyLabeling:开源的 AI 图像标注工具,支持多种标注样式,适于目标检测、图像分割等不同场景
X-AnyLabeling是一款集成了多种深度学习算法的图像标注工具,支持图像和视频的多样化标注样式,适用于多种AI训练场景。本文将详细介绍X-AnyLabeling的功能、技术原理以及如何运行该工具。
3442 2
X-AnyLabeling:开源的 AI 图像标注工具,支持多种标注样式,适于目标检测、图像分割等不同场景
|
XML JSON 数据可视化
数据集学习笔记(二): 转换不同类型的数据集用于模型训练(XML、VOC、YOLO、COCO、JSON、PNG)
本文详细介绍了不同数据集格式之间的转换方法,包括YOLO、VOC、COCO、JSON、TXT和PNG等格式,以及如何可视化验证数据集。
4029 1
数据集学习笔记(二): 转换不同类型的数据集用于模型训练(XML、VOC、YOLO、COCO、JSON、PNG)
|
机器学习/深度学习 存储 并行计算
大数据及其5V特性详解
【8月更文挑战第31天】
2431 0
|
边缘计算 计算机视觉 异构计算
【YOLOv8改进 - 特征融合NECK】Slim-neck:目标检测新范式,既轻量又涨点
YOLO目标检测专栏探讨了模型优化,提出GSConv和Slim-Neck设计,以实现轻量级模型的高效检测。GSConv减小计算复杂度,保持准确性,适合实时任务。Slim-Neck结合GSConv优化架构,提高计算成本效益。在Tesla T4上,改进后的检测器以100FPS处理SODA10M数据集,mAP0.5达70.9%。论文和代码可在提供的链接中获取。文章还介绍了YOLOv8中GSConv的实现细节。更多配置信息见相关链接。