半导体芯片表面缺陷检测数据集(2500张高质量标注)| YOLO工业视觉数据集 AI质检

简介: 本数据集含2500张真实产线采集的半导体芯片图像,YOLO格式标注,涵盖ZF-scratch、scratch、broken、pinbreak四类表面缺陷,标注精度≥99%,适配YOLOv8等模型,专为工业质检、小目标检测与AI质检系统落地设计。

半导体芯片表面缺陷检测数据集(2500张高质量标注)| YOLO工业视觉数据集 AI质检


引言

在半导体制造领域,芯片质量直接决定产品性能与可靠性,而“表面缺陷检测”则是芯片出厂前最关键的一道质量关卡之一。传统人工检测方式不仅效率低、成本高,而且在面对微小缺陷(如细微划痕、引脚损伤)时,极易出现漏检与误检。

随着计算机视觉与深度学习技术的发展,基于目标检测模型(如 YOLO 系列)的自动化缺陷检测方案,正逐步成为工业质检领域的主流方向。
在这里插入图片描述

本文将围绕一套半导体芯片表面缺陷检测数据集(2500张)进行系统解析,从数据结构、标注规范、缺陷类别到实际应用价值,帮助你快速搭建工业级视觉检测模型。

数据集下载

通过网盘分享的文件:半导体芯片表面缺陷检测
链接: https://pan.baidu.com/s/1oPyVFgQHqNve0J-jxXnUlA?pwd=sapi

提取码: sapi

数据集概述

本数据集专门面向半导体芯片制造环节中的表面缺陷检测任务构建,能够直接支持深度学习模型的训练、验证与评估。

核心信息如下:

  • 数据规模:2500 张高质量芯片图像
  • 数据来源:真实芯片制造产线采集
  • 任务类型:目标检测(缺陷识别)
  • 标注格式:YOLO标准格式
  • 类别数量(nc=4)

    • ZF-scratch(工艺划痕)
    • scratch(通用划痕)
    • broken(破损)
    • pinbreak(引脚断裂)

数据覆盖不同芯片型号、工艺阶段与拍摄条件,具备良好的工业泛化能力。


背景

在芯片制造过程中,缺陷可能出现在多个环节:

  • 晶圆切割
  • 芯片封装
  • 运输与装配
  • 焊接与插拔

常见问题包括:

  • 微小划痕影响电路性能
  • 芯片边缘破损导致失效
  • 引脚断裂影响连接稳定性

传统检测方式存在明显局限:

  • ❌ 人工检测效率低
  • ❌ 检测标准不统一
  • ❌ 易受疲劳影响
  • ❌ 难以检测微小缺陷

因此,引入基于深度学习的视觉检测模型,实现自动化、标准化检测,已成为行业趋势。
在这里插入图片描述


数据集详情

1. 数据结构

数据集采用标准划分方式,便于直接接入训练流程:

dataset/
├── train/
├── test/
└── trainval.txt

说明:

  • train/:训练集,用于模型学习
  • test/:测试集,用于最终评估
  • trainval.txt:验证集路径配置文件

👉 可轻松转换为 YOLO 标准结构:

images/
labels/

2. 标注格式

数据集完全适配 YOLO 系列模型:

<class_id> <x_center> <y_center> <width> <height>

特点:

  • 坐标归一化(0~1)
  • 一张图对应一个标注文件
  • 支持多缺陷检测

3. 缺陷类别定义

类别ID 缺陷名称 缺陷说明
0 ZF-scratch 工艺相关划痕(特定芯片类型)
1 scratch 通用表面划痕
2 broken 芯片破损(边缘/表面)
3 pinbreak 引脚断裂或变形

👉 覆盖芯片表面与结构关键缺陷,具有较强工程实用性。


4. 数据特点

(1)真实产线采集

  • 来源于工业现场
  • 还原真实缺陷分布

(2)多样化采集条件

  • 不同光照(强光/弱光)
  • 不同拍摄角度
  • 多型号芯片

(3)高精度标注

  • 工程师人工标注
  • 像素级精度
  • 准确率 ≥ 99%

(4)缺陷细粒度

  • 微小划痕
  • 细微引脚损伤

👉 对模型精度要求极高。
在这里插入图片描述


适用场景

该数据集在工业视觉领域具有非常高的应用价值:


1. 半导体产线自动检测

结合工业相机与YOLO模型:

  • 实时检测芯片缺陷
  • 自动筛选不良品
  • 提高检测效率

2. 智能质检系统

替代传统人工检测:

  • 标准统一
  • 结果稳定
  • 可追溯

3. AI工业视觉研究

适用于:

  • 小目标检测研究
  • 缺陷检测算法优化
  • 模型轻量化研究

4. 工业AI项目落地

可用于:

  • 工业视觉Demo展示
  • 企业级AI解决方案
  • 智能制造系统开发

使用建议(实战经验)

1. 模型选择

推荐:

  • YOLOv8s(工业场景首选)
  • YOLOv8m(高精度需求)

2. 小目标优化(重点)

芯片缺陷通常较小,建议:

  • 提高分辨率(768 / 1024)
  • 使用多尺度训练
  • 引入FPN / BiFPN

3. 数据增强策略

建议:

  • 随机裁剪(增强局部特征)
  • 对比度增强(提升缺陷可见性)
  • 噪声扰动(模拟工业环境)

4. 训练参数建议

epochs=150~300
imgsz=768
batch=8~16

5. 常见难点

(1)划痕 vs 背景纹理

👉 解决:

  • 增加负样本
  • 使用注意力机制

(2)引脚缺陷识别困难

👉 解决:

  • 局部增强
  • 高分辨率输入

(3)类别不平衡

👉 解决:

  • 数据重采样
  • Focal Loss

心得

在工业视觉项目中,这类数据集有几个关键特点:

1. 精度要求极高

工业场景容错率极低:

👉 漏检 = 质量事故
👉 误检 = 成本增加


2. 小目标检测是核心难点

相比普通目标检测:

👉 更依赖模型细节表达能力


3. 数据质量决定模型上限

  • 标注精度
  • 数据真实性

远比数量更重要。


4. 非常适合做高质量项目

适用于:

  • 工业AI方向毕业设计
  • 企业级视觉检测Demo
  • YOLO改进论文实验

结语

随着智能制造的不断推进,AI视觉检测正在重塑传统工业质检流程。从“人工经验判断”到“模型自动识别”,不仅提升了效率,也极大提高了检测一致性与可靠性。

本次分享的半导体芯片缺陷检测数据集(2500张),具备:

  • 工业级真实数据
  • 高精度标注
  • 多缺陷覆盖
  • 可直接训练

无论你是从事:

  • 工业视觉
  • YOLO目标检测
  • 智能制造研究

该数据集都具有极高的实践价值。

相关文章
|
4月前
|
机器学习/深度学习 人工智能 编解码
工业织物缺陷目标检测数据集(1000+高精度标注样本)| AI训练适用于目标检测任务
工业织物瑕疵检测并非简单的目标检测问题,而是一个融合了弱特征感知、噪声抑制与细粒度识别的综合挑战。本文介绍的数据集,正是围绕这一核心难点构建,具备较高的工程与研究价值。 无论是用于工业落地,还是作为算法验证基准,该数据集都为复杂弱纹理场景下的智能视觉检测研究提供了可靠支撑。 随着更先进的模型结构与训练策略不断涌现,基于此类真实工业数据集的探索,将持续推动智能制造向更高精度、更高可靠性方向发展。
工业织物缺陷目标检测数据集(1000+高精度标注样本)| AI训练适用于目标检测任务
|
机器学习/深度学习 人工智能 数据库
【表面缺陷检测】表面缺陷检测数据集汇总
本文收集整理了16个表面缺陷检测相关的数据集,并对每个数据集的特点进行了简单的介绍。
【表面缺陷检测】表面缺陷检测数据集汇总
|
2月前
|
机器学习/深度学习 编解码 人工智能
23类 PCB电子元器件检测数据集(1600张)|YOLO训练数据集 工业质检 小目标检测
本数据集含1600张真实PCB图像,涵盖23类电子元器件,标注精准、格式规范(YOLO标准),专为小目标密集检测优化,适用于YOLOv5/v8等模型训练,助力工业质检、缺陷识别与AI项目开发。
23类 PCB电子元器件检测数据集(1600张)|YOLO训练数据集 工业质检 小目标检测
|
并行计算 Linux 计算机视觉
还在手工标注数据集?快来试一试自动化多模型标注大模型-gui交互式标注(部署运行教程-高效生产力)
还在手工标注数据集?快来试一试自动化多模型标注大模型-gui交互式标注(部署运行教程-高效生产力)
|
3月前
|
机器学习/深度学习 人工智能 编解码
抽烟行为检测数据集(约3000张图片已标注)| YOLO训练数据集 AI视觉检测
本数据集含约3000张多场景抽烟行为图像,YOLO格式标注(单类“smoke”),覆盖室内外、不同光照与人群姿态,支持YOLOv5/v8直接训练。适用于智慧安防、禁烟监管及AI行为识别研究,助力实时检测与自动告警。
抽烟行为检测数据集(约3000张图片已标注)| YOLO训练数据集 AI视觉检测
|
3月前
|
机器学习/深度学习 监控 自动驾驶
7种交通场景目标检测数据集分享(适用于YOLO系列深度学习检测任务)
7种交通场景目标检测数据集分享(适用于YOLO系列深度学习检测任务) 源码下载 在智能交通与自动驾驶技术快速发展的今天,如何高效、准确地感知道路环境已经成为研究与应用的核心问题。车辆、行人和交通信号灯
973 0
|
2月前
|
机器学习/深度学习 数据采集 算法
6类钢材表面缺陷检测数据集(6000张)|YOLO训练数据集 工业质检 缺陷识别 智能制造 表面检测
本数据集含6000张真实工业场景钢材表面图像,精准标注6类典型缺陷(裂纹、夹杂、斑块、麻面、氧化皮压入、划痕),采用YOLO标准格式,结构规范、质量高,可直接用于YOLOv5/v8等模型训练,助力工业质检智能化升级。
|
4月前
|
机器学习/深度学习 边缘计算 算法
金属材料表面六种缺陷类型数据集:工业视觉检测的优质训练资源
本数据集包含1800张640×640金属表面缺陷图像,涵盖裂纹、夹杂、斑块、凹坑、氧化皮、划痕6类典型缺陷,已按7:2:1划分训练/验证/测试集,标注规范(YOLO格式),适配YOLO、Faster R-CNN等模型,助力工业视觉检测研究与落地。
|
5月前
|
机器学习/深度学习 监控 算法
基于YOLOv8的工业织物瑕疵检测识别|完整源码数据集+PyQt5界面+完整训练流程+开箱即用!
本项目基于YOLOv8构建工业织物瑕疵智能检测系统,精准识别洞、异物、油斑、织线错误四类缺陷,专为弱纹理高精细织物(如丝绸、粘胶)设计。含完整源码、标注数据集、预训练权重、PyQt5可视化界面及详细教程,支持图片/视频/摄像头实时检测,开箱即用,适用于质检、教学与科研。
554 14
|
3月前
|
机器学习/深度学习 人工智能 编解码
PCB印刷电路板表面缺陷检测数据集(近 3500张图片已标注)| YOLO训练数据集 AI视觉检测
本数据集围绕工业实际需求构建,专注于 PCB 表面典型缺陷识别任务,具有如下特点: 📌 数据规模适中:3500 张高质量图像,兼顾训练效率与模型效果 📌 类别覆盖全面:包含 6 类常见工业缺陷 📌 标注精度高:误差控制在像素级别,满足工业级标准 📌 场景贴近真实:来源于实际生产或仿真工业环境

热门文章

最新文章