前言
说起目标检测大家往往想到的是“有监督”检测,这里例如(ssd\yolo等模型);然而还有另外的一种思路供我们思考使用:聚类(K-means)。在本文中我提供一个例子讲解下聚类思想在目标检测中的应用并简要分析“有监督”与“无监督”模型之间的差异。
需求表述
例如有如下场景:在一条传送带上传送着红色、绿色、黄色和黑色的电缆圈,现在在传送带上进行传送,每次只过一卷电缆,需要检测出通过传送带指定位置的电缆颜色为后续分揽件做准备。
根据上述的需求对现有设备进行统计:
- 深绿色传送带一条
- 闸机一套
- 工业相机一台
- PC工控机一台
分析
业务逻辑
对上述的需求部分进行分析,可以清晰的知道在传送带上的电缆是单卷进行运送,电缆颜色也不同于传送带的颜色,数据采集的设备(工业相机也具备了)。这样我们可以做如下设计:在闸机前安装工业相机(下面简称相机),使相机画面仅能容下传送带上的物品(这里特指电缆),在检测到电缆的颜色后把信息传递给闸机。
算法逻辑
主要目标是对传送带上的电缆的颜色进行识别,这里我们考虑到电缆的颜色只有四种且电缆颜色与传送带的颜色也不一样,那么可以对传送带上的电缆图像进行颜色聚类,通过颜色聚类我们可以得到两种颜色:传送带的背景色与电缆的颜色,我们在聚类的结果中将背景颜色剔除掉后那么剩下的就是电缆的颜色了。
有/无监督
K-means是非常典型的无监督模型的范例,通过上述的业务逻辑与算法逻辑分析来看,避免了有监督模型的繁琐的数据采集与标注,使用无监督模型的优点在这里显现出来了:不需要大量的数据进行训练,仅需要对业务场景以及业务逻辑的详细清晰的判研即可实现项目需求。
结束
这里为大家带来了一个解决检测目标颜色的可执行方案,希望对大家有帮助。