计算机视觉图像常用基本算法(阈值化、形态学变化、模糊)

简介: 计算机视觉图像常用基本算法(阈值化、形态学变化、模糊)

阈值化


大白话说就是给定图像一个像素值作为阈值,将图像中所有像素与这个像素阈值比较,如果大于或者小于这个阈值,就会将图像中这个像素改变会特定的像素值。


简单阈值化


简单阈值化有五种如下表所示:

设定图像中像素值为X XX,阈值为T TT


1687224242452.png

自适应阈值化


对比简单阈值化,简单阈值化作用与全局的图像,即对整个图像做一种方法的处理,但是在图像中由于不同区域的光线状况不同,这种简单的处理效果就不会太好。自适应阈值化能够很好的对图像不同区域分别应用不同的阈值



自适应阈值化有二种方法:

对于要进行阈值化的图像,图像中每个像素都有自己对应的阈值。


自适应均值阈值化:阈值为每个像素邻近区域的像素值的均值

自适应高斯阈值化:阈值为每个像素邻近区域的像素值的加权和,相应权重是由一个高斯函数决定

像素邻近区域(如下图所示,白色像素的邻近区域为蓝色像素部分):

e23ece062fb74005bf06c4713286b6a4.png


OTSU阈值化


Otsu 的原理是最小化类间方差,从像素分布直方图的角度来看就是在像素分布直方图的峰值之间找一个点,使得两个类之间的方差最大,类内方差最小


大白话说,就是选择图像中像素值出现次数最多的前二位,在这个二个像素值之间选取一个像素值作为阈值


算法对应应用场景


简单阈值化算法:适用于没有光线等其他环境因素下的图像。

自适应阈值化算法:适用于有光线等外在因素的图像。

OTSU阈值化算法:适用于OCR、车牌分割。


形态学变化


形态学变化,是基于图像中形状的简单操作,通常处理二值化图像,通常将文本从背景或其他形状中区分处理。


腐蚀


对于二值图像中由白色像素表示的形状,腐蚀操作会通过在内外两侧去掉一个像素来降低形状的厚度

2784433a30094a0c8d4ba221ae43503f.png

膨胀


与腐蚀相反,对于二值图像中由白色像素表示的形状,膨胀操作会通过在内外两侧增加一个像素来增加形状的厚度

6f7250f7f4444e66969469abf1d9a959.png


开运算


开运算通常是用来去掉图像中的噪声,操作步骤:


  1. 先执行腐蚀操作
  2. 再执行膨胀操作
  3. 8a3f5d184a39452ba44595ac3a220256.png
  4. 通俗的理解,图像中存在独立的噪声,先使用腐蚀,这些噪声就会变得更小甚至消失,这个时候再使用膨胀,就可以恢复到原来想要的像素。

闭运算


闭运算通常是用来去掉形状内的孔洞,操作步骤:

  1. 先执行膨胀操作
  2. 再执行腐蚀操作

82027c561ad6496ead783324046134f4.png

模糊(平滑)


模糊操作使用一个卷积核对图像进行卷积操作,简单来说就是将一个由特定构成的矩阵与图像的每个部分依次相乘,从而到达平滑的目的。模型操作有助于消除噪声和边缘

1c49decdf7654d7fb53d53aaa2b3c4a1.png


模糊卷积过程上图所示,这里输入进行模糊处理的图像为6x6,使用卷积核为3x3,进行卷积,从左到右,从上带下。


均值模糊


算法原理:卷积核与图像对应的区域,相同位置的像素值一一相乘求和再除以9,取平均值,将平均值赋给图像的红色区域,依次卷积,其中卷积核中各数值都为1。


高斯模糊


算法原理:与均值模糊相识,不同的是用的不是卷积核而是高斯核,高斯核与卷积核不同的地方在于高斯核的数组是对称数组,并且其中的数值,位置越靠近数组中心值越大。



中值模糊


算法原理:卷积核与图像对应的区域,相同位置的像素值一一相乘取中位数,将中位数值赋给图像的红色区域,依次卷积,其中卷积核中各数值都为1。

相关文章
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
【MM2024】阿里云 PAI 团队图像编辑算法论文入选 MM2024
阿里云人工智能平台 PAI 团队发表的图像编辑算法论文在 MM2024 上正式亮相发表。ACM MM(ACM国际多媒体会议)是国际多媒体领域的顶级会议,旨在为研究人员、工程师和行业专家提供一个交流平台,以展示在多媒体领域的最新研究成果、技术进展和应用案例。其主题涵盖了图像处理、视频分析、音频处理、社交媒体和多媒体系统等广泛领域。此次入选标志着阿里云人工智能平台 PAI 在图像编辑算法方面的研究获得了学术界的充分认可。
【MM2024】阿里云 PAI 团队图像编辑算法论文入选 MM2024
|
1月前
|
机器学习/深度学习 人工智能 算法
【MM2024】面向 StableDiffusion 的多目标图像编辑算法 VICTORIA
阿里云人工智能平台 PAI 团队与华南理工大学合作在国际多媒体顶级会议 ACM MM2024 上发表 VICTORIA 算法,这是一种面向 StableDiffusion 的多目标图像编辑算法。VICTORIA 通过文本依存关系来修正图像编辑过程中的交叉注意力图,从而确保关系对象的一致性,支持用户通过修改描述性提示一次性编辑多个目标。
|
2月前
|
机器学习/深度学习 编解码 自动驾驶
计算机视觉之图像到图像的翻译
图像到图像的翻译(Image-to-Image Translation)是指将一种图像从一种表示转换为另一种表示的过程。该任务的目标是在保证图像语义信息的前提下,将图像风格、颜色或其他视觉特征进行转换。该技术在计算机视觉领域具有广泛应用,例如图像风格迁移、图像修复、图像增强、超分辨率、语义分割等。
56 4
|
1月前
|
算法 数据安全/隐私保护
织物图像的配准和拼接算法的MATLAB仿真,对比SIFT,SURF以及KAZE
本项目展示了织物瑕疵检测中的图像拼接技术,使用SIFT、SURF和KAZE三种算法。通过MATLAB2022a实现图像匹配、配准和拼接,最终检测并分类织物瑕疵。SIFT算法在不同尺度和旋转下保持不变性;SURF算法提高速度并保持鲁棒性;KAZE算法使用非线性扩散滤波器构建尺度空间,提供更先进的特征描述。展示视频无水印,代码含注释及操作步骤。
|
2月前
|
算法 数据可视化 数据安全/隐私保护
基于LK光流提取算法的图像序列晃动程度计算matlab仿真
该算法基于Lucas-Kanade光流方法,用于计算图像序列的晃动程度。通过计算相邻帧间的光流场并定义晃动程度指标(如RMS),可量化图像晃动。此版本适用于Matlab 2022a,提供详细中文注释与操作视频。完整代码无水印。
|
3月前
|
算法 前端开发 计算机视觉
基于均值坐标(Mean-Value Coordinates)的图像融合算法的优化实现
基于均值坐标(Mean-Value Coordinates)的图像融合算法的优化实现
43 0
|
3月前
|
自然语言处理 并行计算 算法
基于均值坐标(Mean-Value Coordinates)的图像融合算法的具体实现
基于均值坐标(Mean-Value Coordinates)的图像融合算法的具体实现
46 0
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
|
1月前
|
算法 安全 数据安全/隐私保护
基于game-based算法的动态频谱访问matlab仿真
本算法展示了在认知无线电网络中,通过游戏理论优化动态频谱访问,提高频谱利用率和物理层安全性。程序运行效果包括负载因子、传输功率、信噪比对用户效用和保密率的影响分析。软件版本:Matlab 2022a。完整代码包含详细中文注释和操作视频。
|
8天前
|
算法 数据安全/隐私保护 索引
OFDM系统PAPR算法的MATLAB仿真,对比SLM,PTS以及CAF,对比不同傅里叶变换长度
本项目展示了在MATLAB 2022a环境下,通过选择映射(SLM)与相位截断星座图(PTS)技术有效降低OFDM系统中PAPR的算法实现。包括无水印的算法运行效果预览、核心程序及详尽的中文注释,附带操作步骤视频,适合研究与教学使用。

热门文章

最新文章

下一篇
无影云桌面