[视觉概述] 机器视觉应用方向、项目流程及学习思路总结

简介: [视觉概述] 机器视觉应用方向、项目流程及学习思路总结

一. 机器视觉应用方向

   机器视觉则是建立在计算机视觉理论的基础上,偏重于计算机视觉技术工程化。与计算机视觉研究的视觉模式识别、视觉理解等内容不同,机器视觉重点在于感知环境中物体的形状、位置、姿态、运动等几何信息。机器视觉主要分2D和3D两个方向:

2D

  1. 识别定位:①Blob分析(主要包括二值化形态学处理特征选择。ps:受光照影响较大)②模板匹配(常用的是Shape匹配Ncc匹配,有时还会用到可变形模板);
  2. 符号需求(一维码、二维码、三维码、OCR光学字符识别
  3. 测量类(单目相机的标定相机自标定);
  4. 缺陷检测系列;
  5. 视觉+运动控制板卡+机器人:手眼抓取(涉及手眼标定抓取等方面)

3D

  1. 双目及多目相机标定;
  2. 鞋点胶;
  3. 无序抓取:参考Halcon【实例程序】中【方法】【多目立体视觉】locate_pipe_joints-stereo.hdev案例中;
    核心知识点:3D手眼标定——标定3D传感器和机械手之间的关系;
  4. 点云数据+深度学习;

工具Halcon(德国)VisionPro(美国康耐视)LabViewOpenCV+C++Emgucv+C#)、SherlockEvsionInsightMatlab;

推荐Halcon===>>>> OpenCV ====>>>> 源码自己编写

语言主流C#+halcon(适合初学、开发效率快,但执行速度相对慢一些,因为C#需要翻译成机器语言)、C+++QT+halcon(适合有一定基础、开发效率慢(对开发者要求高一点),但执行速度更快,因为C++直接生成.exe文件,是操作系统可以直接执行的机器语言)、C+++MFC+halcon


二. 项目总体流程

做机器视觉的项目,拿到项目时一般遵循如下流程:

(1)需求分析(2D)

              问题                说明
确定检测物体 检测的目标物是什么?形状是什么样的?物体具体尺寸是多少?
检测哪些指标 具体检测什么指标?有无?状态?尺寸?位置?粘连?差异?毛刺 ?颜色?
工作距离 安装摄像机到被测物体的最大允许距离是多少?可否自由调节?
分辨率多高 相机的测量尺寸精度是多高?
检测速度多快 全自动测量还是手动?每分钟测量多少个?
安装空间 被测零件周围是否有安装光源的位置?是否有适合安装摄像机头的位置?怎么样固定比较合适?
颜色 被测物体是什么颜色?我们是否需要对颜色判别?是否可以利用颜色差异帮助我们实现检测目的?
材质 物体是什么材料的,表面光学性质怎样?
合格判据 合格/不合格的定义
工位信号 有工位触发信号还是需要自动连续拍照?
剔除或控制方式 是否需要自动剔除残次品或控制机器动作?怎么样对不合格品进行剔除?使用什么信号格式,在什么位置进行?
工作环境 工作环境的温度、湿度、粉尘、防水、杂散光线情况
交货日期 这是不言而喻的

(2)方案设计(硬件):

  • 2D:根据客户应用的场合不同,选择相应的镜头相机、支架、光源及如何打光(感兴趣的可看看《工程光学》一书)等。
  • 3D:自己搭建双目结构光、激光三角等3D平台,或直接买市面公司成熟的3D方案(首先,因为速度更快、精度更高一些),相关3D硬件平台参考:主流3D光学视觉方案

(3)概要设计(软件):

  • 包含软件架构体系,视觉开发环境(VC+++Halcon还是C#+Halcon等);
  • 算法流程(怎么通讯、怎么识别等)。

(4)详细设计(软件):

  • 各个功能模块如何做,包括图像采集模块、处理模块、包括算法模块,如何通讯等;
  • 通常将每个模块形成一个动态库,调用相应的接口函数即可,项目图像采集调用SDK也是调用动态库的过程;

(5)软件编码 —— (6)测试、调试和修改 —— (7)客户交付、确认 —— (8)调试:根据客户反馈结果来不断的修改程序Bug。

(9) 达到客户需求,最后交付客户及软硬件操作文档 —— (10)后期维护。


三. 视觉常规算法流程

  1. 图像采集
  2. 图像预处理:包含几何变换、灰度处理、图像增强、图像滤波、二值化、图像细化等
    注:图像预处理在视觉算法中一般是可选项,图像效果很好的时候可跳过该步
  3. 定位(blob分析、模板匹配)
  4. 特征提取: 包含几何特征(面积、周长、矩形度)、纹理特征(与灰度相关,如熵、能量值)、概率特征、角点、特征描述算子特征等,直接影响定位、识别的效果
  5. 对特征区域进行处理(根据不同工业需求选择对应的检测识别算法)
  6. 结果显示

四. 机器视觉工程师需要具备的能力

4.1 图像处理相关知识
  1. 图像处理的基本理论知识(图像理论的基础知识)
  2. 图像增强(对比度拉伸、灰度变换等)
  3. 图像的几何变换(仿射变换,旋转矩阵等)
  4. 图像的频域处理(傅里叶变换、DFT、小波变换、高低通滤波器设计)
  5. 形态学(膨胀、腐蚀、开运算和闭运算以及凸壳等)
  6. 图像分割(HALCON里的Blob分析)
  7. 图像复原
  8. 运动图像
  9. 图像配准(模板匹配等)
  10. 模式识别(分类器训练,神经网络深度学习等)

学习参考资料:

  • 经典教材:冈萨雷斯的《数字图像处理》及对应的MATLAB版
  • 杨丹等编著《MATLAB图像处理实例详解》
  • 张铮等编著《数字图像处理与机器视觉——Visual C++与MATLAB实现》
  • 左飞编著的《数字图像处理:原理与实践(MATLAB版)》
  • 左飞编著的《数字图像处理技术详解与Visual C++实践》
  • 谢凤英编著的《Visual C++数字图像处理》
  • 《精通系列·精通Visual C++数字图像处理典型算法及实现(第2版)》
4.2 软件编程功底

软件功底的作用是软件的架构设计分析,架构包括UI层设计、业务逻辑层开发、数据层开发。以下三个方面,每个方面至少会一种,具体选择视所在公司应用而定:

  • 编程语言:C#,C,C++(自己用哪个就学哪个)
  • 界面框架:C#界面,Qt界面,MFC界面(比较老了,以前的项目用的较多)
  • 图像算法处理软件:HALCON,VisionPro,OpenCV等

学习资料参考:

  1. C# 可以看书籍《C#从入门到精通》、《Head First C#》、《C#入门经典》、《C#图解教程》、《C#高级编程》、《.Net Frameword 高级编程》、《CLR via C#》
  2. C 语言的学习主要看谭浩强写的C语言相关知识
  3. C++主要看《C++ primer plus》书籍
  4. Qt 学习可以看《Qt Creator快速入门》(入门)、《C++ GUI Qt4》(进阶)
  5. MFC 的学习主要看孙鑫编写的《VC++深入详解》这本书及相应的视频教程,并在VC++6.0软件或VS2010等软件上编写程序和实践
4.3 视觉硬件知识

主要在你设计方案时相机、镜头、光源等选型时起到关键作用。

学习资料参考:

主要阅读书籍《工程光学》、重点放在几何光学方面,了解成像原理及相应的光路分析,知道光源的特性、镜头分辨率、相机分辨率等方面的知识。


五. 学习机器视觉的一些建议

1.学习机器视觉一定要结合项目实战,在实践中学习总结经验教训,系统化学习所需知识。

2.补充一定的C++和c#知识,进行VS联合开发,客户现场的学习和现场调试,不断学习示例分析,掌握方法套路流程。

3.根据实际问题,学习模块调用,按照方法套路学习。

4.最好是先用Halcon等视觉处理软件实现图像处理部分,然后在VS开发软件中利用MFC或Qt等图形界面实现出来,实践学习是最好的方法。

机器视觉学习的发展趋势是结合神经网络、深度学习进行相应的人工智能机器视觉开发。


下雨天,最惬意的事莫过于躺在床上静静听雨,雨中入眠,连梦里也长出青苔。


目录
相关文章
|
1月前
|
编解码
Sora的技术思路与其他产品有何不同?
【2月更文挑战第9天】Sora的技术思路与其他产品有何不同?
32 1
Sora的技术思路与其他产品有何不同?
|
1月前
电子书阅读分享《思维的边界:认知智能》
电子书阅读分享《思维的边界:认知智能》
33 0
|
1月前
|
人工智能 自然语言处理 算法
技术角度告诉你ChatGPT是什么?和一些深度思考
技术角度告诉你ChatGPT是什么?和一些深度思考
104 0
|
12月前
|
传感器 数据可视化 算法
全面了解三维重建在建筑领域应用:多种技术思路、落地案例全都有
全面了解三维重建在建筑领域应用:多种技术思路、落地案例全都有
297 0
|
机器学习/深度学习 传感器 人工智能
纯视觉3D检测综述!一文详解3D检测现状、趋势和未来方向!(下)
基于图像的3D目标检测是自动驾驶领域的一个基本问题,也是一个具有挑战性的问题,近年来受到了业界和学术界越来越多的关注。得益于深度学习技术的快速发展,基于图像的3D检测取得了显著的进展。特别是,从2015年到2021年,已经有超过200篇研究这个问题的著作,涵盖了广泛的理论、算法和应用。然而,到目前为止,还没有一个调查来收集和组织这方面的知识。本文首次对这一新兴的不断发展的研究领域进行了全面综述,总结了基于图像的3D检测最常用的流程,并对其各个组成部分进行了深入分析。此外,作者还提出了两个新的分类法,将最先进的方法组织成不同的类别,以期提供更多的现有方法的系统综述,并促进与未来作品的公平比较。
纯视觉3D检测综述!一文详解3D检测现状、趋势和未来方向!(下)
|
机器学习/深度学习 人工智能 算法
纯视觉3D检测综述!一文详解3D检测现状、趋势和未来方向!(中)
基于图像的3D目标检测是自动驾驶领域的一个基本问题,也是一个具有挑战性的问题,近年来受到了业界和学术界越来越多的关注。得益于深度学习技术的快速发展,基于图像的3D检测取得了显著的进展。特别是,从2015年到2021年,已经有超过200篇研究这个问题的著作,涵盖了广泛的理论、算法和应用。然而,到目前为止,还没有一个调查来收集和组织这方面的知识。本文首次对这一新兴的不断发展的研究领域进行了全面综述,总结了基于图像的3D检测最常用的流程,并对其各个组成部分进行了深入分析。此外,作者还提出了两个新的分类法,将最先进的方法组织成不同的类别,以期提供更多的现有方法的系统综述,并促进与未来作品的公平比较。
纯视觉3D检测综述!一文详解3D检测现状、趋势和未来方向!(中)
|
机器学习/深度学习 编解码 人工智能
纯视觉3D检测综述!一文详解3D检测现状、趋势和未来方向!(上)
基于图像的3D目标检测是自动驾驶领域的一个基本问题,也是一个具有挑战性的问题,近年来受到了业界和学术界越来越多的关注。得益于深度学习技术的快速发展,基于图像的3D检测取得了显著的进展。特别是,从2015年到2021年,已经有超过200篇研究这个问题的著作,涵盖了广泛的理论、算法和应用。然而,到目前为止,还没有一个调查来收集和组织这方面的知识。本文首次对这一新兴的不断发展的研究领域进行了全面综述,总结了基于图像的3D检测最常用的流程,并对其各个组成部分进行了深入分析。此外,作者还提出了两个新的分类法,将最先进的方法组织成不同的类别,以期提供更多的现有方法的系统综述,并促进与未来作品的公平比较。在
纯视觉3D检测综述!一文详解3D检测现状、趋势和未来方向!(上)
|
人工智能 开发者
《思维的边界:认知智能》下载地址
《思维的边界:认知智能》手册中对“企业人工智能从技术战略到行业落地论坛”、“基于超大规模训练模型的小样本和零样本学习”、“面向知识的可解释认知推理”三个演讲的内容干货进行了总结。
50 0
《思维的边界:认知智能》下载地址
|
人工智能 开发者
《思维的边界:认知智能》下载
《思维的边界:认知智能》手册中对“企业人工智能从技术战略到行业落地论坛”、“基于超大规模训练模型的小样本和零样本学习”、“面向知识的可解释认知推理”三个演讲的内容干货进行了总结。
46 0
《思维的边界:认知智能》下载
|
机器学习/深度学习 移动开发 人工智能
深度强化学习-运动规划(3)|学习笔记
快速学习深度强化学习-运动规划(3)
169 0
深度强化学习-运动规划(3)|学习笔记