HOG 特征的计算

简介:

方向梯度直方图(Histogram of Oriented Gradient, HOG)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度方向直方图来构成特征。HOG 特征检测算法的几个步骤:颜色空间归一化、梯度计算、梯度方向直方图、重叠块直方图归一化、HOG特征。下面分别对其进行介绍。

1 颜色空间归一化

由于图像的采集环境、装置等因素,采集到的人脸图像效果可能不是很好,容易出现误检或漏检的情况,所以需要对采集到的人脸进行图像预处理,主要是处理光线太暗或太强的情况,这里有两次处理:图像灰度化、Gamma校正。

1.1 图像灰度化

对于彩色图像,将 RGB 分量转化成灰度图像,其转化公式为:

$$ Gray = 0.3 R + 0.59 G + 0.11 B $$

1.2 Gamma 校正

在图像照度不均匀的情况下,可以通过 Gamma 校正,将图像整体亮度提高或降低。在实际中可以采用两种不同的方式进行 Gamma 标准化,平方根、对数法。这里我们采用平方根的办法,公式如下(其中 $\gamma =0.5$):

$$ Y(x,y) = I(x,y)^{\gamma} $$

其中 $I(x,y)$ 表示检测窗口在像素点 $(x,y)$ 处的灰度值,$Y(x,y)$ 表示 Gamma 校正后的灰度值。

2 梯度计算

对经过颜色空间归一化后的图像,求取其梯度及梯度方向。分别在水平和垂直方向进行计算,梯度算子为:

  • 水平方向:$[-1, 0, 1]$
  • 垂直方向:$[-1, 0, 1]^T$

$$ \begin{aligned} &G_x(x,y) = I(x+1,y) - I(x-1,y)\\ &G_y(x,y) = I(x,y+1) - I(x,y-1)\\ &G(x,y) = \sqrt{G_x(x,y)^2 + G_y(x,y)^2}\\ &\theta(x,y) = \text{argtan} (\frac{G_y(x,y)}{G_x(x,y)}) \end{aligned} $$

其中 $G_x(x,y), G_y(x,y)$ 分别是图像在像素点 $(x,y)$ 处的水平和垂直梯度值。$G(x,y)$ 为像素点 $(x,y)$ 的梯度的模长大小 (梯度幅值),$\theta(x,y)$ 则指的是像素点 $(x,y)$ 的方向。

3 构建方向的直方图

为图像的每个细胞单元构建梯度方向直方图。细胞单元中的每一个像素点都为某个基于方向的直方图通道(orientation-based histogram channel)投票。投票是采取加权投票(weighted voting)的方式,即每一票都是带权值的,这个权值是根据该像素点的梯度幅度计算出来。可以采用幅值本身或者它的函数来表示这个权值,实际测试表明: 使用幅值来表示权值能获得最佳的效果,当然,也可以选择幅值的函数来表示,比如幅值的平方根(square root)、幅值的平方(square of the gradient magnitude)、幅值的截断形式(clipped version of the magnitude)等。细胞单元可以是矩形的(rectangular),也可以是星形的(radial)。直方图通道是平均分布在 $0\sim 180$ 度(无 向)或 $0\sim 360$ 度(有向)范围内。采用无向的梯度和 $9$ 个直方图通道,能在行人检测试验中取得最佳的效果。

目录
相关文章
|
数据采集 JavaScript 前端开发
爬虫与反爬虫
本文介绍了爬虫与反爬虫的基本概念。爬虫是自动抓取互联网信息的程序,通常使用HTTP请求和解析技术获取数据。反爬虫技术包括验证码、User-Agent检测、IP限制、动态加载和数据接口限制等,用于阻止或限制爬虫访问。开发者需了解这些反爬虫策略,并采取相应措施应对。同时,网站运营者在实施反爬虫时也应考虑用户体验。
|
存储 人工智能 大数据
云计算的详细介绍
云计算的详细介绍
2400 1
|
Java API 网络性能优化
NoClassDefFoundError: ch/qos/logback/classic/spi/ThrowableProxy
报错日志: java.lang.NoClassDefFoundError: ch/qos/logback/classic/spi/ThrowableProxy at ch.
11481 0
|
11月前
|
机器学习/深度学习 人工智能 算法
昇腾AI行业案例(一):基于AI图像处理的疲劳驾驶检测
在本实验中,您将学习如何使用利用CV(Computer Vision)领域的AI模型来构建一个端到端的疲劳驾驶检测系统,并使用开源数据集进行效果验证。为此,我们将使用昇腾的AI硬件以及CANN等软件产品。
474 3
|
9月前
|
存储 运维 监控
百万指标,秒级查询,零宕机——时序数据库 TDengine 在 AIOps 中的硬核实战
本篇文章详细讲述了七云团队在运维平台中如何利用 TDengine 解决海量时序数据存储与查询的实际业务需求。内容涵盖了从数据库选型、方案落地到业务挑战及解决办法的完整过程,特别是分享了升级 TDengine 3.x 时的实战经验,给到有需要的小伙伴参考阅读。
327 1
|
11月前
|
人工智能 分布式计算 大数据
MaxFrame 产品评测:大数据与AI融合的Python分布式计算框架
MaxFrame是阿里云MaxCompute推出的自研Python分布式计算框架,支持大规模数据处理与AI应用。它提供类似Pandas的API,简化开发流程,并兼容多种机器学习库,加速模型训练前的数据准备。MaxFrame融合大数据和AI,提升效率、促进协作、增强创新能力。尽管初次配置稍显复杂,但其强大的功能集、性能优化及开放性使其成为现代企业与研究机构的理想选择。未来有望进一步简化使用门槛并加强社区建设。
480 8
|
机器学习/深度学习 存储 计算机视觉
基于YOLOv8深度学习的PCB板缺陷检测系统【python源码+Pyqt5界面+数据集+训练代码】目标检测
基于YOLOv8深度学习的PCB板缺陷检测系统【python源码+Pyqt5界面+数据集+训练代码】目标检测
|
计算机视觉
计算机视觉:驾驶员疲劳检测(二)
计算机视觉:驾驶员疲劳检测(二)
489 0
|
计算机视觉
计算机视觉:驾驶员疲劳检测(一)
计算机视觉:驾驶员疲劳检测
300 0
|
Python
使用proteus实现51单片机的串口通讯仿真
使用proteus实现51单片机的串口通讯仿真
1076 1