HOG 特征的计算

简介:

方向梯度直方图(Histogram of Oriented Gradient, HOG)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度方向直方图来构成特征。HOG 特征检测算法的几个步骤:颜色空间归一化、梯度计算、梯度方向直方图、重叠块直方图归一化、HOG特征。下面分别对其进行介绍。

1 颜色空间归一化

由于图像的采集环境、装置等因素,采集到的人脸图像效果可能不是很好,容易出现误检或漏检的情况,所以需要对采集到的人脸进行图像预处理,主要是处理光线太暗或太强的情况,这里有两次处理:图像灰度化、Gamma校正。

1.1 图像灰度化

对于彩色图像,将 RGB 分量转化成灰度图像,其转化公式为:

$$ Gray = 0.3 R + 0.59 G + 0.11 B $$

1.2 Gamma 校正

在图像照度不均匀的情况下,可以通过 Gamma 校正,将图像整体亮度提高或降低。在实际中可以采用两种不同的方式进行 Gamma 标准化,平方根、对数法。这里我们采用平方根的办法,公式如下(其中 $\gamma =0.5$):

$$ Y(x,y) = I(x,y)^{\gamma} $$

其中 $I(x,y)$ 表示检测窗口在像素点 $(x,y)$ 处的灰度值,$Y(x,y)$ 表示 Gamma 校正后的灰度值。

2 梯度计算

对经过颜色空间归一化后的图像,求取其梯度及梯度方向。分别在水平和垂直方向进行计算,梯度算子为:

  • 水平方向:$[-1, 0, 1]$
  • 垂直方向:$[-1, 0, 1]^T$

$$ \begin{aligned} &G_x(x,y) = I(x+1,y) - I(x-1,y)\\ &G_y(x,y) = I(x,y+1) - I(x,y-1)\\ &G(x,y) = \sqrt{G_x(x,y)^2 + G_y(x,y)^2}\\ &\theta(x,y) = \text{argtan} (\frac{G_y(x,y)}{G_x(x,y)}) \end{aligned} $$

其中 $G_x(x,y), G_y(x,y)$ 分别是图像在像素点 $(x,y)$ 处的水平和垂直梯度值。$G(x,y)$ 为像素点 $(x,y)$ 的梯度的模长大小 (梯度幅值),$\theta(x,y)$ 则指的是像素点 $(x,y)$ 的方向。

3 构建方向的直方图

为图像的每个细胞单元构建梯度方向直方图。细胞单元中的每一个像素点都为某个基于方向的直方图通道(orientation-based histogram channel)投票。投票是采取加权投票(weighted voting)的方式,即每一票都是带权值的,这个权值是根据该像素点的梯度幅度计算出来。可以采用幅值本身或者它的函数来表示这个权值,实际测试表明: 使用幅值来表示权值能获得最佳的效果,当然,也可以选择幅值的函数来表示,比如幅值的平方根(square root)、幅值的平方(square of the gradient magnitude)、幅值的截断形式(clipped version of the magnitude)等。细胞单元可以是矩形的(rectangular),也可以是星形的(radial)。直方图通道是平均分布在 $0\sim 180$ 度(无 向)或 $0\sim 360$ 度(有向)范围内。采用无向的梯度和 $9$ 个直方图通道,能在行人检测试验中取得最佳的效果。

目录
相关文章
|
6月前
|
机器学习/深度学习 算法 内存技术
【CVPR2021】CondenseNetV2:用于深度网络的稀疏特征再激活
【CVPR2021】CondenseNetV2:用于深度网络的稀疏特征再激活
145 2
【CVPR2021】CondenseNetV2:用于深度网络的稀疏特征再激活
|
5月前
|
算法 计算机视觉
图像处理之积分图应用四(基于局部均值的图像二值化算法)
图像处理之积分图应用四(基于局部均值的图像二值化算法)
529 0
|
4月前
|
机器学习/深度学习 PyTorch 算法框架/工具
VQ-VAE:矢量量化变分自编码器,离散化特征学习模型
VQ-VAE 是变分自编码器(VAE)的一种改进。这些模型可以用来学习有效的表示。本文将深入研究 VQ-VAE 之前,不过,在这之前我们先讨论一些概率基础和 VAE 架构。
121 10
|
6月前
|
vr&ar
用于非线性时间序列预测的稀疏局部线性和邻域嵌入(Matlab代码实现)
用于非线性时间序列预测的稀疏局部线性和邻域嵌入(Matlab代码实现)
120 0
用于非线性时间序列预测的稀疏局部线性和邻域嵌入(Matlab代码实现)
|
机器学习/深度学习 传感器 算法
【图像重建】基于离散余弦变换DCT图像重建含MSE、PSNR、压缩比附matlab代码
【图像重建】基于离散余弦变换DCT图像重建含MSE、PSNR、压缩比附matlab代码
|
资源调度 算法 机器人
图像特征提取与描述_角点特征02:SIFT算法+SURF算法
前面两节我们介绍了Harris和Shi-Tomasi角点检测算法,这两种算法具有旋转不变性,但不具有尺度不变性,以下图为例,在左侧小图中可以检测到角点,但是图像被放大后,在使用同样的窗口,就检测不到角点了。
209 0
|
机器学习/深度学习 自然语言处理 算法
稀疏特征和密集特征
在机器学习中,特征是指对象、人或现象的可测量和可量化的属性或特征。特征可以大致分为两类:稀疏特征和密集特征。
220 0
|
编解码 资源调度 算法
CV学习笔记-尺度不变特征变换(SIFT)
CV学习笔记-尺度不变特征变换(SIFT)
507 0
CV学习笔记-尺度不变特征变换(SIFT)
|
机器学习/深度学习 Python
梯度直方图(HOG)用于图像多分类和图像推荐(上)
梯度直方图(HOG)用于图像多分类和图像推荐
168 0
梯度直方图(HOG)用于图像多分类和图像推荐(上)