AI智检员:这是一位“有眼睛”、“会思考”、“越学越聪明”的工业视觉专家

简介: 如何解决集成电路制造工艺中缺陷在线检测难题?

如何解决集成电路制造工艺中缺陷在线检测难题?


这是中国科协提出的2020重大科学问题和工程技术难题之一,也是我国半导体产业链中最薄弱的环节之一。


成立于2018年,致力于成为国际先进的AI视觉方案提供者以及行业标杆企业的视睿科技,带着基于深度学习等AI技术的图像识别与图像分类解决方案来了


该方案可应用于工业视觉领域的产品缺陷检测,并已在半导体场景,尤其是光电行业的晶圆与封测场景中广泛落地。

 

先整体来看,


11.jpg

 

核心技术1:数据标准化预处理-RepScissor重复物体万能分割系统,可将各工业场景中非标准化数据转化成标准数据输入集


1. 任意新场景,少量引导参数,配置简单,无需单独适配分割算法

2. 100+不同场景下验证,准确率100%

3. 效率高,>1000fps


核心技术2:FSSL半监督式迭代数据分选和训练系统,降低NG样本数据标注周期与标注成本


融合了模型辅助分选(半监督学习+主动学习), 异常检测和传统基于规则的方法,通过三种方式来缩小标注范围(“从100个样本里面挑1个不良”提升为“从3个样本里面挑一个不良”),同时还能降低单一模型样本选择的偏好性,丰富样本的多样性,从而最终提升模型的准确率。


1)其中,模型辅助分选的核心技术FSSL(Feature-guided Semi-Supervised Learning),主要为了解决工业检测场景下,特别是项目前期标记样本少且难以获取的问题,旨在最大化发挥标注样本的指导性,从而引导对未标注样本进行更高效的特征学习。


使用该算法,项目初期只需要少量标记样本(每类<20个)既可以开始迭代,经过1~3天的迭代就能达到可以跑批量的效果(准确率>99.9%),上线跑批量后再经过2~3天的迭代即可实现量产(准确率>99.95)。


同时在迭代过程中结合一些差异性和不确定性的度量准则,可以最大化的挑选出困难样本和混淆样本,交由专业标记人员进行标记。如下图是FSSL迭代分选的示意图。


12.jpg


2)异常检测所用的一个核心假设即是OK样本的有限性(constrained)。这里的有限性指,正常的OK样本,往往是有着相似的色彩分布、结构与纹理特征的,从统计学的角度,我们可以假设正常OK样本图片是服从一个constrained distribution,而异常样本,尽管他们各有各的分布,但都他们不能被fit到这个正常图像的分布中。


视睿采用的异常检测有别于传统的异常检测方法最关键的一点在于,并不是只对OK样本,而是对全样本建模(无需标记),这主要是基于两点发现:1)成熟的产线不良率都很低(<1%);2)产线某种工艺制程下不良率是大体恒定的。


基于这两点假设视睿从而可以将这种不良率的先验知识通过设计一个新的损失函数灌输到模型的训练中去,经过大量实践发现异常检测对于不良呈现出了相当的检出率。


如下图所示即是视睿在某一个比较有挑战的检测场景测试出来的效果。左图是ROC曲线,右图为针对不同缺陷类型的检出率,从中可以看出,哪怕在不做任何标记的情况下,训练出来的模型对于大部分异常已经具备了相当的检出率,虽然还不足以达到产品检测的准确率要求,但对于辅助分选已经有了不小的帮助。

                                      14.jpg

ROC曲线  

13.jpg        

 Accuracy


3)基于规则的特征描述的方法是针对前两种方法的补充,因为前面两种方式都是基于深度学习的,模型在对于样本的预测和选择上一般会呈现一定的偏向性。因此视睿还采用了一些基于传统模式识别基于规则特征表达的方法,例如表面结构的,基于统计方法的、基于滤波的和基于参数模型的。


这些方法都需要人为地根据经验设计特征,如根据表面纹理的大小,方向等。通过加入这种方法,极大的丰富了样本的多样性。


核心技术3:SmartBrickie 自动建模柔性适配技术,可柔性适配客户的弹性标准


缺陷标准的定义往往边界不够清晰,存在人为主观差异。对此,视睿研发了SmartBrickie数据拟合的方案。核心思想是对于OK和NG样本之间划分出一批不确定样本,或者也可以叫做缓冲区样本。


对于这种缓冲区样本,通过算法给它自动拟合一个软标签,这样训练出来的模型输出的概率分布就会有更大的区分度, 然后就可以通过设定阈值动态调节样本的分类,从而实现柔性适配客户的弹性标准。

 

封装产品矩阵


15.jpg



封装AI智检员设备,产品包括单面检测、三面检测、正反面检测、切割膜上检测;客户现场实际运行效率在300K-1KK/H,准 确率达到了99.95%以上;现已实现第二代封装AI智检员产品的量产,并推出了晶圆AI智检员、和PCB AI智检员等产品

 

视睿科技创始人兼CEO单书畅博士表示,现在主流的 High-Tech 团队打法是做 AI 云平台,由客户或集成商自行提供数据, 自行打标签,且行业与场景比较分散,很难把行业内的老师傅们的专家经验和知识进行累积,也就很难集中精力在典型行业提供高品质、高检出率的解决方案。


16.jpgimage.gif


而视睿科技作为 High-Tech 能力与半导体垂直行业深度兼备的企业,不仅有 AI 与图像处理能力,还有很强能力来构造高可信 AI 软硬件系统,同时有很扎实的行业领域知识,对客户实际检测需求、产品品质规则等都有很深的理解,更懂客户到底需要什么,从而提供端到端的设备与算法融合的软硬件解决方案,而不只是软件平台或者算法开发包。


总而言之,是把同一块行业中老专家的经验和智慧通过大数据驱动的手段汇聚在一起,集中力量诊断同一个垂直行业的产品品质问题,从而提供高检出率的好方案,好产品;此外,从公司成立至今,一直聚焦在半导体场景上,已经在这个赛道上的几十家企业做过 PoC,并在数十家企业落地,积累了海量的行业数据,而对于 AI 公司来说,数据是最有价值的资产,未来视睿会继续深耕在半导体场景中。


17.jpg


视睿科技联合创始人谢涛教授表示,学术界甚至公司研究院做科研很多时候聚焦于单点上的技术突破,而且这些研发出来的技术往往只对符合一定假定条件的情况特别有效,而对不符合假定条件但在落地场景也很重要的情况则效果不够好。而产业落地则需要有端到端的解决方案,而且对这些解决方案在各种情况下全面效果以及可信度要求会很高


视睿科技聚合多学科领域背景的人才,有机器视觉的博士,也有高可信硬件技术的博士,并联合高可信软件技术的高校科研队伍,多学科领域融合交叉,紧密地和市场客户沟通迭代,成功研发出端对端的高可信解决方案来去很好地解决了垂直行业的产品品质检测问题。视睿科技在AI工业视觉这个赛道上同时具备算法能力,产品能力,软硬件能力,和数据能力。

 

18.jpg


AOI 的难点从根源讲还是技术,现在基于深度学习等技术红利,采用缺陷特征学习的方法,去解决传统视觉对于外观缺陷检测精度不高的痛点问题,是机器视觉发展的重要趋势和大方向,而目前视睿科技的云-端结合的深度学习算法方案,及软硬一体的AI智检员产品,已经得到客户、集成商、以及行业友商的普遍认可。

 

视睿团队核心技术成员由来自于中科院、北大、华为、阿里等国内一线高校、科研机构和企业的硕博人员组成,创始人兼CEO单书畅是中科院计算所博士;联合创始人谢涛目前担任北京大学计算机科学技术系讲席教授,高可信软件技术教育部重点实验室(北京大学)副主任,IEEE、AAAS Fellow, ACM杰出科学家,2020年度“科学探索奖”获得者;CTO别晓辉是中科院软件所博士,前华为中央软件院主任工程师;CMO陈龙是前海尔彩电研发所长、国内首批LED背光产品设计者;另有来自半导体制造工业企业的资深工程师团队负责产品与项目落地。

 

目前视睿已与光电等泛半导体晶圆与封测行业的国内外龙头企业展开合作,产品涵盖晶圆类AI智检员产品、miniLED类AI智检员产品、封装固晶焊线AI智检员产品、封装点胶塑封后外观AI智检员产品、支架类AI智检员产品、PCB类AI智检员产品、3C产品类 AI智检员产品等,并不断为更多行业和客户提供高性能的AI检测产品与设备。

 

视睿科技目前已有核心研发人员50余人,并自建自动化设备生产工厂,团队致力于为客户提供最好的AI视觉解决方案和完整的自动化解决方案,用最懂客户的产品为客户解决工业缺陷检测痛点问题。

相关文章
|
1月前
|
机器学习/深度学习 人工智能 算法
整合海量公共数据,谷歌开源AI统计学专家DataGemma
【10月更文挑战第28天】谷歌近期开源了DataGemma,一款AI统计学专家工具,旨在帮助用户轻松整合和利用海量公共数据。DataGemma不仅提供便捷的数据访问和处理功能,还具备强大的数据分析能力,支持描述性统计、回归分析和聚类分析等。其开源性质和广泛的数据来源使其成为AI研究和应用的重要工具,有助于加速研究进展和推动数据共享。
62 6
|
4月前
|
人工智能 自然语言处理 搜索推荐
如何10分钟获得一位24小时AI专家助手?
进入百炼控制台创建应用,选通义千问-Plus为模型,可设定Prompt引导对话。测试后若发现不足,可进一步优化。获取API-KEY和应用ID以便API调用,实现网页集成。此AI助手能即时解答用户问题,提供个性化服务及推荐,有效提升用户体验与企业效率,同时降低成本并助力策略规划。随着AI技术进步,这类智能助手将成为日常生活的重要组成部分。
|
23天前
|
人工智能 自然语言处理 算法
【AI问爱答-双十一返场周直播】AI产品专家直播解读重点AI应用场景怎么用?
阿里云【AI问爱答】栏目强势回归,11月25日至28日每晚19:00,连续四天直播,涵盖AI营销、企业办公、社交娱乐及大模型推理调优四大主题,助您深入了解AI应用,解决实际问题。欢迎预约观看!
|
2月前
|
机器学习/深度学习 人工智能 算法
使用 NVIDIA TAO Toolkit 5.0 体验最新的视觉 AI 模型开发工作流程
NVIDIA TAO Toolkit 5.0 提供低代码框架,支持从新手到专家级别的用户快速开发视觉AI模型。新版本引入了开源架构、基于Transformer的预训练模型、AI辅助数据标注等功能,显著提升了模型开发效率和精度。TAO Toolkit 5.0 还支持多平台部署,包括GPU、CPU、MCU等,简化了模型训练和优化流程,适用于广泛的AI应用场景。
71 0
使用 NVIDIA TAO Toolkit 5.0 体验最新的视觉 AI 模型开发工作流程
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
AI技术性文章移动应用开发之旅:从新手到专家的蜕变之路
【8月更文挑战第30天】本文将介绍人工智能的基本原理和应用,包括机器学习、深度学习和自然语言处理等。我们将通过代码示例来展示如何使用Python和TensorFlow库实现一个简单的神经网络模型。
|
3月前
|
人工智能 自然语言处理 Linux
Llama 3.2:开源可定制视觉模型,引领边缘AI革命
Llama 3.2 系列 11B 和 90B 视觉LLM,支持图像理解,例如文档级理解(包括图表和图形)、图像字幕以及视觉基础任务(例如基于自然语言描述在图像中精确定位对象)。
|
4月前
|
机器学习/深度学习 人工智能 Android开发
揭秘AI编程:从零开始构建你的第一个机器学习模型移动应用开发之旅:从新手到专家
【8月更文挑战第29天】本文将带你走进人工智能的奇妙世界,一起探索如何从零开始构建一个机器学习模型。我们将一步步解析整个过程,包括数据收集、预处理、模型选择、训练和测试等步骤,让你对AI编程有一个全面而深入的理解。无论你是AI初学者,还是有一定基础的开发者,都能在这篇文章中找到你需要的信息和启示。让我们一起开启这段激动人心的AI编程之旅吧! 【8月更文挑战第29天】在这篇文章中,我们将探索移动应用开发的奇妙世界。无论你是刚刚踏入这个领域的新手,还是已经有一定经验的开发者,这篇文章都将为你提供有价值的信息和指导。我们将从基础开始,逐步深入到更复杂的主题,包括移动操作系统的选择、开发工具的使用、
|
4月前
|
机器学习/深度学习 人工智能 监控
探索视觉AI:超越计算机视觉的边界
【8月更文挑战第20天】
68 2
|
4月前
|
人工智能 数据管理 Serverless
手把手教你如何10分钟获得一位24小时AI专家助手
【8月更文挑战第1天】手把手教你如何10分钟获得一位24小时AI专家助手
132 2
|
3月前
|
机器学习/深度学习 数据挖掘 TensorFlow
从数据小白到AI专家:Python数据分析与TensorFlow/PyTorch深度学习的蜕变之路
【9月更文挑战第10天】从数据新手成长为AI专家,需先掌握Python基础语法,并学会使用NumPy和Pandas进行数据分析。接着,通过Matplotlib和Seaborn实现数据可视化,最后利用TensorFlow或PyTorch探索深度学习。这一过程涉及从数据清洗、可视化到构建神经网络的多个步骤,每一步都需不断实践与学习。借助Python的强大功能及各类库的支持,你能逐步解锁数据的深层价值。
72 0

热门文章

最新文章