“开水白菜”——程序应用中的上等国宴

简介: “开水白菜”——程序应用中的上等国宴

前言

  开水者,场景也;白菜者,算法也。在工业检测界业务视觉的应用场景往往较为单一,没有智慧城市与自动驾驶业务端场景复杂,但缺有独特的业务需求(精度往往要求比智慧城市要高)在本文中我将为大家举一简单工业检测界的业务,为大家展示多种“烹饪”方式。请诸位服飨!

场景介绍分析

  我们可以简化下业务场景:有五种颜色的物体,分别在传送带上被运输,我们需要做到的事情是将通过传送带上的物体的颜色检测出来,并对被检测颜色的物体数量+1操作。

  由于是真实的场景,那么必然是会存在一些让人意想不到的情况出现,比如传送带是整体是绿色的,但是这条 传送带是首位焊接一起的,在焊接部分是呈现黑绿色,传送带比较光滑,会发生镜面反射现象。对于被检测的物品会存在部分被检测物品的出厂log会在摄像头正下方,被检测物品有塑料膜包裹,由于塑料膜表面比较光滑,所以被检测物体也会出现镜面反射。

算法烹饪

  对上述业务场景明显可以得到是一个很【分类】任务我们按照深度学习的范畴来划分可以划分为【有导师监督】与【无导师监督】。也可以不采用深度学习的方式完成业务场景下的任务。下面我将为大家带来这两个方向的“烹饪”技法。

无导师监督

  在无导师监督学习中最经典的算法莫过于聚类算法了(k-means算法),使用k-means进行二分类对业务场景的应用流程如下:

image.png

理想中的检测结果可如下:

  1. 【底色,底色】:传送带上无物体,统计结果不变;
  2. 【底色,非底色】:传送带上有物体,且物体颜色为检测颜色,被检测颜色物体个数+1;
  3. 【非底色,非底色】:传送带上有物体,且物体颜色为检测色,被检测颜色物体个数+1;

根据上述流程我们可以发现,我们需要处理的问题有:

  1. 物体颜色不可与传送带颜色RGB范围值过于接近;
  2. 物体之间的颜色RGB范围值不可过于接近;
  3. 传送带自身的颜色RGB范围不应有太大的变换;
  4. 物体本身印刷的log颜色会干扰检测结果,应避免;

有导师监督

  有导师监督的深度学习算法这个里面涵盖的类别就较多了,在这里我们继续细分为【图像分类】和【目标检测OR分割】

图像分类

  分析业务场景如果我们采用图像分类实现传送带上物体的检测,由于物体会持续性出现在画面中,所以需要划定ROI区域进行识别,在构建数据集的时候,考虑到后期可能会存在物体颜色于传送带颜色接近,故而需要对传送带上没有物体的时候进行采样,并对传送带上存在物体的时候进行采样。流程如下:

image.png

理想中的检测结果可如下:

  1. 当ROI区域没有目标的时候,返回的最大置信度的结果为空,被检测物体个数不变;
  2. 当ROI区域存在物体目标的时候,返回的最大置信度的结果为实际检测到的物体颜色,被检测物体个数+1;

  根据上述流程我们可以发现,我们需要着重处理的问题为:数据清洗阶段无法很好把控物体进入ROI区域的临界线会导致存在物体与不存在物体的边界模糊不清

目标检测(分割)

  由于在图像分类任务中我们无法很好的把握物体进入ROI区域的边界,导致检测结果会出现一些不友好的地方,我们可以考虑使用目标检测类,这里我们仅以yolo为例子进行分析流程:

image.png

理想中的检测结果可如下:

  1. 当没有物体在传送带上的时候,没有检测框,统计物体数据不变;
  2. 当传送带上存在物品时但物品坐标与ROI坐标形成的区域没有交集时,只显示当前检测物品颜色,不进行物品数量+1;
  3. 当传送带上存在物品且物品坐标与ROI坐标形成的区域存在交集时,对检测的物品颜色显示并对该颜色的物品个数+1;

  采样目标检测虽然可以很好的实现对传送带上的物品进行检测并统计,此时具备一定的泛化能力,但这种方法也不是十分友好,例如下“不友好的地方”:

  1. 数据标注耗费时间精力;
  2. 训练网络需要耗费精力;
  3. 更改需求后,例如新增物体时,数据需要采集并训练;

非深度学习

  对于完成某一目标的识别检测,不妨我们可以跳出机器学习的圈子,我们难道忘记了做当前做车牌识别课程设计时采用的模板匹配算法么?在OPENCV中集成了模板匹配算法,大家可以自行Google一下稍加调试便可实现一个简单的目标匹配算法。这里我简单概述一下目标匹配算法的流程:

image.png

理想中的检测结果可如下:

  1. 当画面中没有物体时不显示被检测信息;被检测物体数据不变;
  2. 当出现物体且进入指定较大的ROI区域内时,对检测的物品颜色显示并对该颜色的物品个数+1;

  在使用非深度学习时,我们通过流程图可以明显得到流程足够精简,我们不用花费很多精力便将任务初步解决了,虽然使用模板匹配也是不十分优秀的解决方案,也是存在一些让人诟病的地方。例如:

  1. 无法很好的适应被检测物体的大小变换
  2. 当被检测物体被log遮挡过多的时候,检测结果会出现异常

  当然上述让人诟病的地方也不是不可被解决,例如我们可以摄像头上当安装一激光感应模块,当摄像头正下方出现物体的时候,传递相应的电平信号进行分析是否有物体通过,模板匹配法充当物体颜色检测模块使用,会让我们更方便处理业务,这样我们在收集数据样本时不必像深度学习那般繁琐,对于添加新颜色物体的时候,模板匹配库也是较为轻易的实现。

结束语

  一个小小的工业端的物体颜色检测并统计问题,在本文中我提出了两大类解决办法,一类是深度学习,另一类是非深度学习。同时也为大家带来了相应的解决流程,分析了各自的优劣,希望大家可以在处理日常的业务的时候,能够发散思维,不要局限于某一类方法中,不迷信于深度学习方法,多尝试一些其它方法,有时候会有意想不到的结果。

  尤其对于新入行的人来说,面对新的业务时逐步剖析这个问题面临的问题,去思考如何解决这个问题,有哪几种方式解决,比对各种方法的优劣,方便后期项目中的选择,为自己的“烹饪”技巧添砖加瓦。

白菜易,开水白菜难!


目录
打赏
0
0
0
0
181
分享
相关文章
深度评测 | 仅用3分钟,百炼调用满血版 Deepseek-r1 API,百万Token免费用,简直不要太爽。
仅用3分钟,百炼调用满血版Deepseek-r1 API,享受百万免费Token。阿里云提供零门槛、快速部署的解决方案,支持云控制台和Cloud Shell两种方式,操作简便。Deepseek-r1满血版在推理能力上表现出色,尤其擅长数学、代码和自然语言处理任务,使用过程中无卡顿,体验丝滑。结合Chatbox工具,用户可轻松掌控模型,提升工作效率。阿里云大模型服务平台百炼不仅速度快,还确保数据安全,值得信赖。
189466 32
深度评测 | 仅用3分钟,百炼调用满血版 Deepseek-r1 API,百万Token免费用,简直不要太爽。
用DeepSeek,就在阿里云!四种方式助您快速使用 DeepSeek-R1 满血版!更有内部实战指导!
DeepSeek自发布以来,凭借卓越的技术性能和开源策略迅速吸引了全球关注。DeepSeek-R1作为系列中的佼佼者,在多个基准测试中超越现有顶尖模型,展现了强大的推理能力。然而,由于其爆火及受到黑客攻击,官网使用受限,影响用户体验。为解决这一问题,阿里云提供了多种解决方案。
23731 37
PAI Model Gallery 支持云上一键部署 DeepSeek-V3、DeepSeek-R1 系列模型
DeepSeek 系列模型以其卓越性能在全球范围内备受瞩目,多次评测中表现优异,性能接近甚至超越国际顶尖闭源模型(如OpenAI的GPT-4、Claude-3.5-Sonnet等)。企业用户和开发者可使用 PAI 平台一键部署 DeepSeek 系列模型,实现 DeepSeek 系列模型与现有业务的高效融合。
零门槛,轻松体验阿里云 DeepSeek-R1 满血版:快速部署,立享超强推理能力
DeepSeek-R1 是阿里云推出的先进推理模型,专为解决复杂任务设计,尤其在数学推理、代码生成与修复、自然语言处理等领域表现出色。通过阿里云的“零门槛”解决方案,用户无需编写代码即可快速部署 DeepSeek-R1,大幅简化了部署流程并提升了使用效率。该方案提供了详尽的文档和可视化界面,使开发者能轻松上手。DeepSeek-R1 支持多种模型尺寸,适用于不同场景,如智能客服、代码自动化生成、数学问题求解和跨领域知识推理。尽管存在对高自定义需求支持有限、云端依赖性等不足,但对于希望快速验证模型效果的用户而言,阿里云的这一解决方案仍然是高效且经济的选择。
1894 29
零门槛、百万token免费用,即刻拥有DeepSeek-R1满血版,还有实践落地调用场景等你来看
DeepSeek 是热门的推理模型,能在少量标注数据下显著提升推理能力,尤其擅长数学、代码和自然语言等复杂任务。本文涵盖四种部署方案,可以让你快速体验云上调用 DeepSeek-R1 满血版的 API 及部署各尺寸模型的方式,无需编码,最快 5 分钟、最低 0 元即可实现
本地部署DeepSeek模型
要在本地部署DeepSeek模型,需准备Linux(推荐Ubuntu 20.04+)或兼容的Windows/macOS环境,配备NVIDIA GPU(建议RTX 3060+)。安装Python 3.8+、PyTorch/TensorFlow等依赖,并通过官方渠道下载模型文件。配置模型后,编写推理脚本进行测试,可选使用FastAPI服务化部署或Docker容器化。注意资源监控和许可协议。
1666 10
DeepSeek-R1满血版上线阿里云,新用户专享100万token额度,5分钟快速部署!
DeepSeek是当前AI领域的热门话题,尤其其大模型备受关注。由于网页版访问时常超时,推荐使用阿里云百炼的API调用方式快速体验。此方法仅需五分钟,提供100万免费Token,有效期至2025年7月26日。用户可通过注册阿里云账户、开通服务、创建API-Key、安装并配置ChatBox客户端等步骤轻松上手。测试结果显示,DeepSeek-R1在回答问题、解释数学概念及编写代码等方面表现优异。部署成本低、操作简便,是体验DeepSeek的理想选择。
DeepSeek-R1满血版上线阿里云,新用户专享100万token额度,5分钟快速部署!
手把手教你使用 Ollama 和 LobeChat 快速本地部署 DeepSeek R1 模型,创建个性化 AI 助手
DeepSeek R1 + LobeChat + Ollama:快速本地部署模型,创建个性化 AI 助手
3578 117
手把手教你使用 Ollama 和 LobeChat 快速本地部署 DeepSeek R1 模型,创建个性化 AI 助手
如何在通义灵码里用上DeepSeek-V3 和 DeepSeek-R1 满血版671B模型?
除了 AI 程序员的重磅上线外,近期通义灵码能力再升级全新上线模型选择功能,目前已经支持 Qwen2.5、DeepSeek-V3 和 R1系列模型,用户可以在 VSCode 和 JetBrains 里搜索并下载最新通义灵码插件,在输入框里选择模型,即可轻松切换模型。
1168 14
满血 DeepSeek 免费用?附联网搜索&prompt编写教程!暨第三方 API 平台全面横评
满血 DeepSeek 免费用!支持联网搜索!创作声明:真人攥写-非AI生成,Written-By-Human-Not-By-AI
1240 8
满血 DeepSeek 免费用?附联网搜索&prompt编写教程!暨第三方 API 平台全面横评

热门文章

最新文章

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等