聊一聊计算机视觉中的高斯分布

简介: 高斯分布,又称正态分布,是概率统计中常见的分布形式。在计算机视觉领域,高斯分布被广泛应用于图像噪声建模、高斯滤波、特征表示、背景建模及高斯核密度估计等方面,是许多图像处理算法的核心。通过高斯分布,可以有效处理噪声、平滑图像、提取特征及建模背景,提升算法性能。

聊一聊计算机视觉中的高斯分布

B站:肆十二-的个人空间-肆十二-个人主页-哔哩哔哩视频 (bilibili.com)

博客:肆十二-CSDN博客

问答:(10 封私信 / 72 条消息) 肆十二 - 知乎 (zhihu.com)

高斯分布基础概念

高斯分布的定义:

高斯分布(Gaussian distribution),也叫正态分布(Normal distribution),是概率统计中最常见的一种分布形式。一个随机变量 ( X ) 服从高斯分布的概率密度函数定义为:

$$ f(x | \mu, \sigma^2) = \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left( -\frac{(x - \mu)^2}{2\sigma^2} \right) $$
其中:

  • $$ \mu 是平均值或期望值(期望中心的位置),它决定分布的中心位置。 $$

  • $$ \sigma^2是方差(或标准差\sigma 的平方),它决定分布的宽度(分布的散布程度)。 $$

通俗解释:

你可以把高斯分布想象成一个钟形曲线(钟形曲线的样子是对称的),它的形状由两件事决定:

  1. 中心位置:高斯分布的平均值 ( \mu ) 是曲线的中心。绝大多数数据点会围绕这个中心值分布。
  2. 分散程度:标准差 ( \sigma ) 决定了数据的离散程度。如果标准差较小,数据点会更集中在平均值附近;如果标准差较大,数据点会更分散。

举个简单的例子,假设你测量一群人的身高,大多数人的身高会接近平均值,极高或极矮的人会比较少。高斯分布就像是在描述这种现象:大部分数据集中在中间,越偏离平均值的情况越少。

在高斯分布中,数据呈现对称性,左右两侧是相同的,这意味着偏离平均值相同距离的数据出现的概率相同。

你可以想象一下,这种分布经常出现在许多自然现象中,比如测量误差、体温、考试分数等。

计算机视觉中的高斯分布

在计算机视觉领域,高斯分布的概念和它在统计学中的定义相同,但其应用则更加具体。高斯分布在计算机视觉中通常用来建模噪声、描述图像特征,或者用作滤波工具。以下是高斯分布在计算机视觉中几种常见的应用:

1. 图像噪声建模

在实际场景中,图像采集过程中往往会有噪声,这些噪声通常可以用高斯分布来建模。高斯噪声是一种最常见的噪声类型,它假设噪声的强度遵循高斯分布。比如在摄像头拍摄时,传感器中的随机波动产生的噪声常常近似服从高斯分布。

实际应用:

  • 当我们处理图像去噪问题时,假设图像中的噪声是高斯噪声,许多去噪算法会基于这一假设来设计。
  • 图像复原中,了解噪声的分布性质(如高斯分布)有助于设计更加鲁棒的滤波算法。

2. 高斯滤波器(Gaussian Filter)

高斯分布的另一个常见应用是在图像平滑处理中。高斯滤波器是一种基于高斯分布的滤波方法,用于对图像进行平滑处理,减少噪声和细节。

高斯滤波器的定义:
高斯滤波器的核心是用一个二维高斯函数来作为滤波核,它的数学表达式为:
$$ G(x, y) = \frac{1}{2\pi\sigma^2} \exp\left( -\frac{x^2 + y^2}{2\sigma^2} \right) $$
其中,( \sigma ) 是高斯分布的标准差,它控制了滤波的程度。这个二维高斯函数对图像的每个像素点进行加权平均,距离中心越近的像素权重越大。

实际应用:

  • 高斯滤波广泛用于图像预处理步骤,如边缘检测之前的噪声去除。
  • 在物体检测和跟踪中,高斯滤波可以平滑噪声和不必要的细节,帮助我们更好地聚焦于目标。

3. 特征表示中的高斯分布

在特征描述和匹配中,特别是SIFTSURF 等特征提取算法中,高斯分布用于构建图像金字塔,以检测不同尺度下的特征。

金字塔构建:

  • 通过对图像逐级应用高斯滤波器,可以生成一系列不同尺度的图像,称为“高斯金字塔”。金字塔中的每一层代表图像的一个模糊程度,较低层次包含较多细节,较高层次则较为模糊。
  • 在这些不同的尺度下提取特征点,可以实现尺度不变的特征检测,即在不同尺度和分辨率下,能够识别出相同的特征。

4. 背景建模(Background Modeling)

在视频监控、运动检测等任务中,使用高斯混合模型(GMM, Gaussian Mixture Model)来进行背景建模。高斯混合模型使用多个高斯分布来描述背景像素的值,尤其当背景中存在某些细微变化时(如光照变化、风吹草动等),GMM 可以很好地对这些变化进行建模。

实际应用:

  • 在运动物体检测中,背景通常是动态变化的,用一个高斯分布来描述可能不足够。因此,GMM会用多个高斯分布对同一像素点进行建模,从而对像素值的变化进行捕捉。
  • 背景建模对于从视频流中分离前景物体(如检测行人、车辆)非常有帮助。

5. 高斯核密度估计(Kernel Density Estimation)

在计算机视觉中,有时需要对图像中特征分布进行估计。高斯核密度估计是一种常见的方法,它使用高斯分布的核函数来平滑和估计数据的分布。

实际应用:

  • 对于图像中特征的统计建模,如估计颜色分布或形状特征。
  • 在分类任务中,高斯核密度估计常用于估计类别的概率密度分布。

总结

在计算机视觉中,高斯分布不仅是理论上的统计工具,更是很多实际算法的核心。例如,在噪声建模、高斯滤波、图像特征提取和背景建模等任务中,都依赖于高斯分布的特性。理解高斯分布及其在这些应用中的角色,可以帮助我们设计更为有效的图像处理算法。

目录
相关文章
|
6月前
|
机器学习/深度学习 自然语言处理 算法
【模式识别】探秘判别奥秘:Fisher线性判别算法的解密与实战
【模式识别】探秘判别奥秘:Fisher线性判别算法的解密与实战
155 0
|
1月前
|
机器学习/深度学习 监控 计算机视觉
聊一聊计算机视觉中的KL散度
KL散度(Kullback-Leibler Divergence)是一种衡量两个概率分布差异的非对称度量,在计算机视觉中有广泛应用。本文介绍了KL散度的定义和通俗解释,并详细探讨了其在变分自编码器(VAE)、生成对抗网络(GAN)、知识蒸馏、图像分割、自监督学习和背景建模等领域的具体应用。通过最小化KL散度,这些模型能够更好地逼近真实分布,提升任务性能。
88 0
|
6月前
|
机器学习/深度学习 算法 数据可视化
【模式识别】探秘分类奥秘:最近邻算法解密与实战
【模式识别】探秘分类奥秘:最近邻算法解密与实战
67 0
|
6月前
|
机器学习/深度学习 算法 vr&ar
强化深度学习中利用时序差分法中的Sarsa算法解决风险投资问题实战(附源码 超详细必看)
强化深度学习中利用时序差分法中的Sarsa算法解决风险投资问题实战(附源码 超详细必看)
73 0
|
机器学习/深度学习 算法 数据挖掘
机器学习算法背后的数学原理
机器学习算法背后的数学原理
160 0
机器学习算法背后的数学原理
|
机器学习/深度学习 数据采集 传感器
阿旭机器学习实战【2】KNN算法进行人体动作识别
阿旭机器学习实战【2】KNN算法进行人体动作识别
阿旭机器学习实战【2】KNN算法进行人体动作识别
|
机器学习/深度学习 算法
ZAO 背后的深度学习算法原理浅析
ZAO最近火爆,成为现象级产品之一,引起大家的广泛关注,ATA上面已经有同学做了一些说明分析,链接如下: https://www.atatech.org/articles/148375?spm=ata.13269325.0.0.27ad49fa0Vr2gG 上面文章介绍了ZAO是基于deep fake算法演变出来的一种产品,并提供了deepFake lab的下载地址,计算机硬件的要求等等。本文
|
机器学习/深度学习 编解码 算法
综述专栏 | 姿态估计综述
顾名思义,通过姿势估计,我们尝试从图像中推断出物体或人的姿势。这涉及识别和定位身体上的关键点。由于身体的小关节、遮挡和缺乏上下文、旋转和方向,关键点的识别是一项非常具有挑战性的任务。在本文其余部分将主要关注人体姿势估计的情况下,膝盖、肘部、肩部和手腕等主要关节代表这些关键点。
综述专栏 | 姿态估计综述
|
机器学习/深度学习 算法 网络架构
人工神经网络背后的数学原理!(上)
提到人工智能算法,人工神经网络(ANN)是一个绕不过去的话题。但是对于新手,往往容易被ANN中一堆复杂的概念公式搞得头大,最后只能做到感性的认识,而无法深入的理解。正好最近笔者本人也在经历这个痛苦的过程,本着真理越辩越明的态度,索性坐下来认真的把这些头大的问题梳理一番,试试看能不能搞清楚ANN背后的数学原理。
|
机器学习/深度学习 人工智能 算法
人工神经网络背后的数学原理!(下)
人工神经网络背后的数学原理!