使用卷积神经网络对晶圆图上的八种制造缺陷进行分类

简介: 使用简单的卷积神经网络 (CNN) 对晶圆图上的八种制造缺陷进行分类。

​一、前言
使用简单的卷积神经网络 (CNN) 对晶圆图上的八种制造缺陷进行分类。
晶圆是半导体材料(通常是硅)的薄盘,用作集成电路的基础。每个晶圆产生几个单独的电路(IC),分成芯片。自动检测机测试晶圆上IC的性能。这些机器生成称为晶圆图的图像,指示哪些芯片性能正确(通过),哪些芯片不符合性能标准(失败)。
晶圆图上合格和失效芯片的空间模式可以指示制造过程中的特定问题。深度学习方法可以有效地对大量晶圆上的缺陷图案进行分类。因此,通过使用深度学习,您可以快速识别制造问题,从而及时修复制造过程并减少浪费。训练检测和分类八种制造缺陷模式的分类网络。该示例还演示如何评估网络的性能。
二、下载WM-811K晶圆缺陷图数据
此示例使用 WM-811K 晶圆缺陷图数据集。该数据集由811,457张晶圆图图像组成,其中包括172,950张标记图像。每个图像只有三个像素值。该值表示背景,该值表示行为正确的模具,该值表示有缺陷的模具。标记的图像具有基于缺陷模具空间模式的九个标签之一。数据集的大小为 3.5 GB。
设置为数据集的所需位置。使用帮助程序函数下载数据集。
二、预处理和扩充数据
数据作为结构数组存储在MAT文件中。将数据集加载到工作区中。
通过显示结构的第一个元素来浏览数据。该字段包含图像数据。该字段包含缺陷的标签。
2.1 重新格式化数据
此示例仅使用带标签的图像。从结构中删除未标记的图像。
该示例使用与字段指定的约定不同的约定将数据分区为训练集、验证集和测试集。
指定图像类。
要对数据应用其他预处理操作,例如调整图像大小以匹配网络输入大小或应用随机训练网络进行分类,可以使用增强图像数据存储。您无法从结构中的数据创建增强映像数据存储,但可以从表中的数据创建数据存储。将数据转换为具有两个变量的表:

1.png

2.2 通过过采样平衡数据
显示每个类的图像数量。数据集严重不平衡,每个缺陷类别的图像明显少于没有缺陷的图像数量。

要改进类平衡,请使用帮助程序函数对缺陷类进行过采样。此函数作为支持文件附加到示例。帮助程序函数在数据集后附加每个缺陷图像的五个修改副本。每个副本都有以下修改之一:水平反射、垂直反射或旋转 90 度的倍数。

显示类平衡后每个类的图像数量。
2.png

2.3 将数据划分为训练集、验证集和测试集
将过采样数据集拆分为训练集、验证集和测试集。大约 90% 的数据用于训练,5% 用于验证,5% 用于测试。

2.4 扩充训练数据
对象指定一组要应用于训练数据的随机增强。向训练图像添加随机增强可以避免网络过度拟合训练数据。

指定网络的输入大小。创建一个增强图像数据存储(深度学习工具箱),用于读取训练数据,将数据大小调整为网络输入大小,并应用随机增强。
创建用于读取验证和测试数据的数据存储,并将数据大小调整为网络输入大小。您无需对验证或测试数据应用随机增强。
三、创建网络
定义卷积神经网络架构。图像输入层的范围反映了晶圆图只有三个级别的事实。
四、指定练选项
指定 Adam 优化的训练选项。训练网络 30 个纪元。
五、训练网络或下载预训练网络
默认情况下,该示例加载预训练的晶圆缺陷分类网络。预训练网络使您能够运行整个示例,而无需等待训练完成。

六、根据测试数据量化网络性能
使用分类(深度学习工具箱)函数对每个测试图像进行分类。使用混淆垫(深度学习工具箱)函数以混淆矩阵的形式计算网络与地面实况分类相比的性能。使用混淆图(深度学习工具箱)函数可视化混淆矩阵。此矩阵对角线上的值表示正确的分类。完美分类器的混淆矩阵仅在对角线上具有值。
3.png

6.1 精度、召回率和 F1 分数
此示例使用多个指标评估网络性能:精度、召回率和 F1 分数。这些指标是为二元分类定义的。为了克服此多类问题的限制,您可以将预测视为一组二元分类,每个分类对应一个分类。

精度是正确预测属于某个类的图像的比例。

对于每个类,使用混淆矩阵中可用的 TP、FP 和 FN 结果计数计算精度、召回率和 F1 分数。

显示每个类的指标。分数接近 1 表示网络性能越好。
4.png

6.2 精确召回曲线和曲线下面积 (AUC)
除了返回每个测试图像的分类外,网络还可以预测测试图像是每个缺陷类别的概率。在这种情况下,精度-召回率曲线提供了一种评估网络性能的替代方法。

要计算精度-召回率曲线,首先通过将概率与任意阈值进行比较,对每个缺陷类执行二元分类。当概率超过阈值时,可以将图像分配给目标类。阈值的选择会影响 TP、FP 和 FN 结果的数量以及准确度和召回率分数。若要评估网络性能,必须考虑阈值范围内的性能。精度-召回率曲线在调整二元分类的阈值时绘制精度和召回率值之间的权衡。AUC 指标将类的精度-召回率曲线汇总为 [0, 1] 范围内的单个数字,其中 1 表示无论阈值如何,都是完美分类。

使用该函数计算每个类在阈值范围内的精度、召回率和 AUC。绘制精度-召回率曲线。
5.png

理想分类器的精度-召回率曲线通过点 (1, 1)。具有趋向于 (1, 1) 的精度召回率曲线的类(如 和 )是网络性能最佳的类。该网络的性能在该类中最差。计算并显示每个类的精度/召回率曲线的 AUC 值。

七、使用 GradCAM 可视化网络决策
梯度加权类激活映射(Grad-CAM)对网络做出的决策产生可视化解释。您可以使用 gradCAM(深度学习工具箱)函数来识别对网络预测影响最大的图像部分。

7.1 Donut缺陷类别
缺陷的特征是图像具有围绕芯片中心聚集在同心圆中的缺陷像素。缺陷类别的大多数图像在芯片边缘周围没有缺陷像素。

这两个图像都显示了带有缺陷的数据。网络将左侧的图像正确分类为缺陷。网络将右侧的图像错误分类为缺陷。图像具有与函数输出相对应的颜色叠加。对网络分类影响最大的影像区域在叠加层上以鲜艳的颜色显示。对于分类为缺陷的图像,模具边界处的缺陷被视为重要。造成这种情况的一个可能原因可能是,与图像相比,训练集中的图像要多得多。

6.png

7.2 Loc缺陷类别
缺陷的特征是图像具有缺陷像素聚集在远离芯片边缘的斑点中。这两个图像都显示了具有 Loc 缺陷的数据。网络将左侧的图像正确分类为缺陷。网络错误地分类了右侧的图像,并将缺陷分类为缺陷。对于分类为缺陷的图像,芯片边界处的缺陷对网络预测的影响最大。缺陷与缺陷的区别主要在于缺陷簇的位置。
7.png

目录
相关文章
|
12天前
|
算法 前端开发 数据挖掘
【类脑智能】脑网络通信模型分类及量化指标(附思维导图)
本文概述了脑网络通信模型的分类、算法原理及量化指标,介绍了扩散过程、路由协议和参数模型三种通信模型,并详细讨论了它们的性能指标、优缺点以及在脑网络研究中的应用,同时提供了思维导图以帮助理解这些概念。
13 3
【类脑智能】脑网络通信模型分类及量化指标(附思维导图)
|
2天前
|
机器学习/深度学习 人工智能 自然语言处理
卷积神经网络(CNN):视觉识别的革命先锋
卷积神经网络(CNN)作为人工智能领域的一颗璀璨明珠,在计算机视觉中发挥着核心作用。CNN的发展历程展现了从生物学灵感到技术创新的转变,历经LeNet-5至AlexNet、VGGNet、ResNet等里程碑式的进步。其独特结构包括卷积层、池化层及全连接层,能够层层递进地提取特征并作出决策。CNN不仅在图像分类、目标检测等领域表现卓越,还在人脸识别、医学影像分析等方面展现出巨大潜力。尽管存在局限性,如对序列数据处理能力有限及解释性问题,但通过引入注意力机制、自监督学习等方法,CNN将持续演进,引领人工智能技术走向更加精彩的未来。
27 2
|
1天前
|
机器学习/深度学习 数据采集 算法
一文搞懂 卷积神经网络 批归一化 丢弃法
这篇文章详细介绍了卷积神经网络中的批归一化(Batch Normalization)和丢弃法(Dropout),包括它们的计算过程、作用、优势以及如何在飞桨框架中应用这些技术来提高模型的稳定性和泛化能力,并提供了网络结构定义和参数计算的示例。
8 0
|
1天前
|
机器学习/深度学习 Shell 计算机视觉
一文搞懂 卷积神经网络 卷积算子应用举例 池化 激活函数
这篇文章通过案例详细解释了卷积神经网络中的卷积算子应用、池化操作和激活函数,包括如何使用卷积算子进行边缘检测和图像模糊,以及ReLU激活函数如何解决梯度消失问题。
6 0
|
1天前
|
机器学习/深度学习 人工智能 BI
4.1卷积神经网络
这篇文章详细介绍了卷积神经网络(CNN)的基础模块,包括卷积计算、填充(padding)、步幅(stride)、感受野(Receptive Field)、多输入/输出通道和批量操作的概念,以及如何在飞桨(PaddlePaddle)框架中使用卷积API。
5 0
|
6天前
|
机器学习/深度学习 自然语言处理 算法
基于卷积神经网络(CNN)的垃圾邮件过滤方法
传统的垃圾邮件过滤手段如规则匹配常因垃圾邮件的多变而失效。基于深度学习的方法,特别是卷积神经网络(CNN),能自动学习邮件中的复杂特征,有效识别垃圾邮件的新形态。CNN通过特征学习、处理复杂结构、良好的泛化能力和适应性,以及高效处理大数据的能力,显著提升了过滤精度。在文本分类任务中,CNN通过卷积层提取局部特征,池化层减少维度,全连接层进行分类,特别适合捕捉文本的局部模式和顺序信息,从而构建高效的垃圾邮件过滤系统。
25 0
|
6天前
|
机器学习/深度学习 编解码 Android开发
MATLAB Mobile - 使用预训练网络对手机拍摄的图像进行分类
MATLAB Mobile - 使用预训练网络对手机拍摄的图像进行分类
18 0
|
14天前
|
机器学习/深度学习 算法 数据安全/隐私保护
基于CNN卷积神经网络的MPSK调制识别matlab仿真
本项目展示一种基于CNN的MPSK调制识别算法,可在Matlab 2022a上运行。该算法能自动区分BPSK、QPSK及8PSK信号,利用卷积层捕捉相位特征并通过全连接层分类。训练过程涉及调整网络权重以最小化预测误差,最终实现对未知信号的有效识别。附带完整代码与说明视频。
|
3天前
|
SQL 安全 网络安全
网络安全与信息安全:保护数字世界的基石
【8月更文挑战第16天】在数字化时代,网络安全与信息安全的重要性日益凸显。本文将深入探讨网络安全漏洞、加密技术以及安全意识等关键领域,旨在为读者提供全面的知识分享和实践指导。我们将从网络攻击的常见类型及其防御措施出发,进一步讨论加密技术在保障数据安全中的作用,并强调提升个人和企业的安全意识的必要性。通过分析真实案例,本文旨在帮助读者构建更加坚固的网络安全防线,共同守护我们的数字生活。
|
4天前
|
SQL 安全 网络安全
网络安全与信息安全:漏洞、加密技术与安全意识的探讨
【8月更文挑战第16天】在数字化时代,网络安全与信息安全成为维护社会稳定和保护个人隐私的重要议题。本文将深入探讨网络安全漏洞的成因、影响及防范措施,介绍加密技术的基本原理和应用,并强调提升公众的安全意识在构建网络防线中的重要性。通过分析当前网络安全面临的挑战,提出加强技术防护和提高用户安全意识的双重策略,旨在为读者提供全面的网络安全知识分享。
23 9

热门文章

最新文章