半导体芯片表面缺陷检测数据集(2500张高质量标注)| YOLO工业视觉数据集 AI质检

简介: 本数据集含2500张真实产线采集的半导体芯片图像,YOLO格式标注,涵盖ZF-scratch、scratch、broken、pinbreak四类表面缺陷,标注精度≥99%,适配YOLOv8等模型,专为工业质检、小目标检测与AI质检系统落地设计。

半导体芯片表面缺陷检测数据集(2500张高质量标注)| YOLO工业视觉数据集 AI质检


引言

在半导体制造领域,芯片质量直接决定产品性能与可靠性,而“表面缺陷检测”则是芯片出厂前最关键的一道质量关卡之一。传统人工检测方式不仅效率低、成本高,而且在面对微小缺陷(如细微划痕、引脚损伤)时,极易出现漏检与误检。

随着计算机视觉与深度学习技术的发展,基于目标检测模型(如 YOLO 系列)的自动化缺陷检测方案,正逐步成为工业质检领域的主流方向。
在这里插入图片描述

本文将围绕一套半导体芯片表面缺陷检测数据集(2500张)进行系统解析,从数据结构、标注规范、缺陷类别到实际应用价值,帮助你快速搭建工业级视觉检测模型。

数据集下载

通过网盘分享的文件:半导体芯片表面缺陷检测
链接: https://pan.baidu.com/s/1oPyVFgQHqNve0J-jxXnUlA?pwd=sapi

提取码: sapi

数据集概述

本数据集专门面向半导体芯片制造环节中的表面缺陷检测任务构建,能够直接支持深度学习模型的训练、验证与评估。

核心信息如下:

  • 数据规模:2500 张高质量芯片图像
  • 数据来源:真实芯片制造产线采集
  • 任务类型:目标检测(缺陷识别)
  • 标注格式:YOLO标准格式
  • 类别数量(nc=4)

    • ZF-scratch(工艺划痕)
    • scratch(通用划痕)
    • broken(破损)
    • pinbreak(引脚断裂)

数据覆盖不同芯片型号、工艺阶段与拍摄条件,具备良好的工业泛化能力。


背景

在芯片制造过程中,缺陷可能出现在多个环节:

  • 晶圆切割
  • 芯片封装
  • 运输与装配
  • 焊接与插拔

常见问题包括:

  • 微小划痕影响电路性能
  • 芯片边缘破损导致失效
  • 引脚断裂影响连接稳定性

传统检测方式存在明显局限:

  • ❌ 人工检测效率低
  • ❌ 检测标准不统一
  • ❌ 易受疲劳影响
  • ❌ 难以检测微小缺陷

因此,引入基于深度学习的视觉检测模型,实现自动化、标准化检测,已成为行业趋势。
在这里插入图片描述


数据集详情

1. 数据结构

数据集采用标准划分方式,便于直接接入训练流程:

dataset/
├── train/
├── test/
└── trainval.txt

说明:

  • train/:训练集,用于模型学习
  • test/:测试集,用于最终评估
  • trainval.txt:验证集路径配置文件

👉 可轻松转换为 YOLO 标准结构:

images/
labels/

2. 标注格式

数据集完全适配 YOLO 系列模型:

<class_id> <x_center> <y_center> <width> <height>

特点:

  • 坐标归一化(0~1)
  • 一张图对应一个标注文件
  • 支持多缺陷检测

3. 缺陷类别定义

类别ID 缺陷名称 缺陷说明
0 ZF-scratch 工艺相关划痕(特定芯片类型)
1 scratch 通用表面划痕
2 broken 芯片破损(边缘/表面)
3 pinbreak 引脚断裂或变形

👉 覆盖芯片表面与结构关键缺陷,具有较强工程实用性。


4. 数据特点

(1)真实产线采集

  • 来源于工业现场
  • 还原真实缺陷分布

(2)多样化采集条件

  • 不同光照(强光/弱光)
  • 不同拍摄角度
  • 多型号芯片

(3)高精度标注

  • 工程师人工标注
  • 像素级精度
  • 准确率 ≥ 99%

(4)缺陷细粒度

  • 微小划痕
  • 细微引脚损伤

👉 对模型精度要求极高。
在这里插入图片描述


适用场景

该数据集在工业视觉领域具有非常高的应用价值:


1. 半导体产线自动检测

结合工业相机与YOLO模型:

  • 实时检测芯片缺陷
  • 自动筛选不良品
  • 提高检测效率

2. 智能质检系统

替代传统人工检测:

  • 标准统一
  • 结果稳定
  • 可追溯

3. AI工业视觉研究

适用于:

  • 小目标检测研究
  • 缺陷检测算法优化
  • 模型轻量化研究

4. 工业AI项目落地

可用于:

  • 工业视觉Demo展示
  • 企业级AI解决方案
  • 智能制造系统开发

使用建议(实战经验)

1. 模型选择

推荐:

  • YOLOv8s(工业场景首选)
  • YOLOv8m(高精度需求)

2. 小目标优化(重点)

芯片缺陷通常较小,建议:

  • 提高分辨率(768 / 1024)
  • 使用多尺度训练
  • 引入FPN / BiFPN

3. 数据增强策略

建议:

  • 随机裁剪(增强局部特征)
  • 对比度增强(提升缺陷可见性)
  • 噪声扰动(模拟工业环境)

4. 训练参数建议

epochs=150~300
imgsz=768
batch=8~16

5. 常见难点

(1)划痕 vs 背景纹理

👉 解决:

  • 增加负样本
  • 使用注意力机制

(2)引脚缺陷识别困难

👉 解决:

  • 局部增强
  • 高分辨率输入

(3)类别不平衡

👉 解决:

  • 数据重采样
  • Focal Loss

心得

在工业视觉项目中,这类数据集有几个关键特点:

1. 精度要求极高

工业场景容错率极低:

👉 漏检 = 质量事故
👉 误检 = 成本增加


2. 小目标检测是核心难点

相比普通目标检测:

👉 更依赖模型细节表达能力


3. 数据质量决定模型上限

  • 标注精度
  • 数据真实性

远比数量更重要。


4. 非常适合做高质量项目

适用于:

  • 工业AI方向毕业设计
  • 企业级视觉检测Demo
  • YOLO改进论文实验

结语

随着智能制造的不断推进,AI视觉检测正在重塑传统工业质检流程。从“人工经验判断”到“模型自动识别”,不仅提升了效率,也极大提高了检测一致性与可靠性。

本次分享的半导体芯片缺陷检测数据集(2500张),具备:

  • 工业级真实数据
  • 高精度标注
  • 多缺陷覆盖
  • 可直接训练

无论你是从事:

  • 工业视觉
  • YOLO目标检测
  • 智能制造研究

该数据集都具有极高的实践价值。

相关文章
|
2月前
|
机器学习/深度学习 边缘计算 算法
金属材料表面六种缺陷类型数据集:工业视觉检测的优质训练资源
本数据集包含1800张640×640金属表面缺陷图像,涵盖裂纹、夹杂、斑块、凹坑、氧化皮、划痕6类典型缺陷,已按7:2:1划分训练/验证/测试集,标注规范(YOLO格式),适配YOLO、Faster R-CNN等模型,助力工业视觉检测研究与落地。
|
23天前
|
机器学习/深度学习 人工智能 监控
猪仔行为检测数据集(3700张高清标注)| YOLO实战 智慧养殖与猪只健康监测
本数据集开源3700张高清标注图像,覆盖猪仔9类核心行为(饮水、进食、撞击、跪地、拱蹭、休息、站立、吮乳、踩踏),严格按YOLO格式划分训练/验证/测试集,适配YOLOv5/v8/v11,助力智慧养殖与健康监测。
|
26天前
|
机器学习/深度学习 人工智能 搜索推荐
学生课堂行为识别数据集(2000张高质量标注)| YOLO训练数据集 AI智慧教育
本数据集含2000张高质量课堂图像,YOLO格式标注6类学生行为(举手、阅读、写作、使用手机、低头、睡觉),覆盖真实教室场景,支持智慧教育中的专注度分析、教学评估与AI模型训练,开箱即用。
|
并行计算 Linux 计算机视觉
还在手工标注数据集?快来试一试自动化多模型标注大模型-gui交互式标注(部署运行教程-高效生产力)
还在手工标注数据集?快来试一试自动化多模型标注大模型-gui交互式标注(部署运行教程-高效生产力)
|
29天前
|
机器学习/深度学习 人工智能 编解码
抽烟行为检测数据集(约3000张图片已标注)| YOLO训练数据集 AI视觉检测
本数据集含约3000张多场景抽烟行为图像,YOLO格式标注(单类“smoke”),覆盖室内外、不同光照与人群姿态,支持YOLOv5/v8直接训练。适用于智慧安防、禁烟监管及AI行为识别研究,助力实时检测与自动告警。
抽烟行为检测数据集(约3000张图片已标注)| YOLO训练数据集 AI视觉检测
|
2月前
|
机器学习/深度学习 人工智能 编解码
工业织物缺陷目标检测数据集(1000+高精度标注样本)| AI训练适用于目标检测任务
工业织物瑕疵检测并非简单的目标检测问题,而是一个融合了弱特征感知、噪声抑制与细粒度识别的综合挑战。本文介绍的数据集,正是围绕这一核心难点构建,具备较高的工程与研究价值。 无论是用于工业落地,还是作为算法验证基准,该数据集都为复杂弱纹理场景下的智能视觉检测研究提供了可靠支撑。 随着更先进的模型结构与训练策略不断涌现,基于此类真实工业数据集的探索,将持续推动智能制造向更高精度、更高可靠性方向发展。
工业织物缺陷目标检测数据集(1000+高精度标注样本)| AI训练适用于目标检测任务
|
2月前
|
机器学习/深度学习 人工智能 算法
水面5种垃圾目标检测数据集(8000+张图片已划分、已标注)| AI训练适用于目标检测任务
计算机视觉和深度学习技术的发展,为水面漂浮垃圾的自动检测与识别提供了新的解决方案。基于图像识别的智能监测系统可以实时检测水面垃圾类型和分布情况,辅助环保管理部门开展科学治理、数据分析和决策支持。因此,构建一份高质量、水面漂浮垃圾标注数据集,对于水域环境监测、智慧河道管理以及环保科研应用具有重要价值。
596 15
|
5月前
|
机器学习/深度学习 监控 数据可视化
基于YOLOv8的水稻病害检测项目|完整源码数据集+PyQt5界面+完整训练流程+开箱即用!
基于YOLOv8的水稻病害检测系统,集成PyQt5可视化界面,支持图片、视频、摄像头实时识别,可检测细菌性叶斑病、褐斑病、叶霉病。提供完整源码、数据集、训练模型及部署教程,开箱即用,适用于智慧农业、科研与教学场景。
基于YOLOv8的水稻病害检测项目|完整源码数据集+PyQt5界面+完整训练流程+开箱即用!
|
1月前
|
机器学习/深度学习 人工智能 监控
电梯内自行车与电动车目标检测数据集(28000张已标注图像)| AI训练适用于目标检测任务
本数据集含28000张电梯内真实监控图像,精准标注“自行车”“电动车”两类目标,专为AI安防场景设计。覆盖多环境、多尺度、强遮挡等复杂情况,标注质量高,已按标准划分train/val/test,可直接用于YOLO、Faster R-CNN、SSD等模型训练,助力电动车入梯智能识别与实时预警。
|
1月前
|
机器学习/深度学习 数据采集 人工智能
建筑玻璃缺陷目标检测数据集(3000 张图片已划分、已标注)| AI训练适用于目标检测任务
本数据集含3000张真实场景建筑玻璃图像(训练2160/验证617/测试310),精细标注5类缺陷(破裂、打胶、起霜、污染、未加工),YOLO格式,适配YOLO/Faster R-CNN等主流模型,专为幕墙质检与工业视觉检测研发打造。

热门文章

最新文章

下一篇
开通oss服务