天池工业质检领域常见瑕疵检测数据集汇总-开发者社区-阿里云

天池数据集｜精品数据集推荐（工业篇）

2021-12-02 2747

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 数据是人工智能时代重要的生产要素，高质量训练数据对深度学习模型的建立和优化有关键性的作用，建立大规模、高水准的标注数据集，是推动AI科研和技术前进的驱动力。

数据是人工智能时代重要的生产要素，高质量训练数据对深度学习模型的建立和优化有关键性的作用，建立大规模、高水准的标注数据集，是推动AI科研和技术前进的驱动力。

制造业是我国国民经济的主体，推动数字化转型，降本增质提速是当今制造业的发展方向。天池通过举办大数据竞赛，希望通过技术创新的方式来推动了产业的创新发展。AI模型的落地离不开高质量数据集的支撑，天池平台开放出一批高标准严要求下真实业务场景的数据，涵盖纺织、食品饮料、非金属制品等行业，小萌喵今天就带大家一起来看看天池上开放的工业数据集。

布匹瑕疵检测数据集

研究方向：工业质检/目标检测

2016年我国布匹产量超过700亿米且产量一直处于上升趋势。布料与人们日常生活接触密切，纺织行业在我国国民经济中所占的地位不言而喻。工厂生产时，对大量布匹的质检通常都是工人肉眼完成的，这种形式检测速度慢、劳动强度大，而且受到工人主观因素影响，将人工智能和计算机视觉技术应用于纺织行业，可以进一步助力纺织行业的自动化，降低对人工的依赖，提升布匹疵点检验的准确度，提升布样疵点质检的效果和效率。

天池开放布匹疵点数据集，包含瑕疵各异的布匹照片，每张照片含素色布的一个或多种瑕疵。

了解更多详情/下载使用数据集请戳：https://tianchi.aliyun.com/dataset/dataDetail?dataId=79336

截屏2021-12-02 下午8.59.47.png

图1：瑕疵图示（黄色框为瑕疵部分）

瓶装白酒疵品检测数据集

研究方向：工业质检/目标检测

与布匹生产流程类似，在瓶装酒的生产过程中，受到原材料质量（酒瓶）以及加工工艺（灌装）等因素的影响，产品中可能存在各类瑕疵影响产品质量。但跟布匹不同的是，酒瓶上的瑕疵面积较小不容易被发现，并且瑕疵种类多，通常一条产线一般需要有三到五个质检环节分别检测不同类型的瑕疵。目前瓶装酒厂家只能选择投入大量人力用于产品质检。如果可以引进高效、可靠的自动化质检可以降低大量人工成本同时提高质检效，是非常有意义的工作。

天池提供白酒疵品数据集，数据集中白酒瓶身存在的各种瑕疵，包括：瓶盖瑕疵、标贴瑕疵、喷码瑕疵。

如需查看数据集更多详细内容请戳：https://tianchi.aliyun.com/dataset/dataDetail?dataId=110147

截屏2021-12-02 下午8.59.54.png

图2：瓶盖变形、瓶盖坏边示意图

瓷砖表面暇疵检测数据集

研究方向：工业质检/目标检测

以抛釉砖为例的瓷砖生产环节一般经过原材料混合研磨、脱水、压胚、喷墨印花、淋釉、烧制、抛光，最后进行质量检测和包装。得益于产业自动化的发展，目前生产环节已基本实现无人化。而质量检测环节仍大量依赖人工完成。一般来说，一条产线需要配2～6名质检工，这样的质检方式效率低下、质检质量层次不齐、成本又居高不下。瓷砖的表面是用户衡量瓷砖质量的最直观标准，是瓷砖行业生产和质量管理的重要环节，也是困扰行业多年的技术瓶颈，同时长时间肉眼在强光下观察瓷砖表面寻找瑕疵也对工人的视力也会产生影响。如果能在技术上解决上述问题，无疑是有很大的经济价值和社会意义。

为了推动AI技术应用到传统的行业，天池推出瓷砖数据集，该数据集内含的数据覆盖到了瓷砖产线所有常见瑕疵，包括粉团、角裂、滴釉、断墨、滴墨、B孔、落脏、边裂、缺角、砖渣、白边等。还有一些缺陷只能在特定视角才可以观察，包括低角度光照黑白图、高角度光照黑白图、彩色图，保证覆盖到生产环境中产生的所有瑕疵能被识别，是国内首个聚焦在瓷砖瑕疵质检的数据集。数据集下载请戳：https://tianchi.aliyun.com/dataset/dataDetail?dataId=110088

截屏2021-12-02 下午9.00.04.png

图3：瓷砖瑕疵质检过程

以上所有数据都是在专业人员指导下，通过产线上架设专业拍摄设备、实地采集生产过程真实的数据，保证了数据来源的可靠性和科学性。

在数据标注过程中，达摩院的算法专家们对数据质量进行了全程把关，保证了天池数据集的质量。

关于天池数据集

天池数据集是阿里集团的科研数据集开放平台，数据集覆盖了新零售、文娱、医疗健康、交通、安全、能源、自然科学等十多个行业，涵盖了数据挖掘、机器学习、自然语言处理、计算机视觉、决策优化等前沿的技术领域。小伙伴们可以点击下方阅读原文进入官网https://tianchi.aliyun.com/dataset进行查看，还有更多宝藏数据等你发现。

截屏2021-12-02 下午9.00.13.png

天池数据集｜精品数据集推荐（工业篇）

天池大数据科研平台

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

天池数据集｜精品数据集推荐（工业篇）

天池大数据科研平台

热门文章

最新文章

相关电子书