备案控制台

开发者社区数据库文章正文

SIFT 特征提取算法总结

2016-07-13 1740

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 原文链接：http://www.cnblogs.com/cfantaisie/archive/2011/06/14/2080917.html 主要步骤 1)、尺度空间的生成； 2)、检测尺度空间极值点； 3)、精确定位极值点； 4)、为每个关键点指定方向参数； 5)、关键点描述子的生成。

原文链接：http://www.cnblogs.com/cfantaisie/archive/2011/06/14/2080917.html

主要步骤

1)、尺度空间的生成；

2)、检测尺度空间极值点；

3)、精确定位极值点；

4)、为每个关键点指定方向参数；

5)、关键点描述子的生成。

L(x,y,σ), σ= 1.6 a good tradeoff

D(x,y,σ), σ= 1.6 a good tradeoff

关于尺度空间的理解说明：图中的2是必须的，尺度空间是连续的。在 Lowe的论文中，

将第0层的初始尺度定为1.6，图片的初始尺度定为0.5. 在检测极值点前对原始图像的高斯

平滑以致图像丢失高频信息，所以 Lowe 建议在建立尺度空间前首先对原始图像长宽扩展

一倍，以保留原始图像信息，增加特征点数量。尺度越大图像越模糊。

next octave 是由 first octave 降采样得到（如2）

，

尺度空间的所有取值，s为每组层数，一般为3~5

同一组中的相邻尺度（由于k的取值关系，肯定是上下层）之间进行寻找

在极值比较的过程中，每一组图像的首末两层是无法进行极值比较的，为了满足尺度

变化的连续性，我们在每一组图像的顶层继续用高斯模糊生成了 3 幅图像，高斯金字

塔有每组S+3层图像。DOG金字塔每组有S+2层图像.

If ratio > (r+1)2/(r), throw it out (SIFT uses r=10)

表示DOG金字塔中某一尺度的图像x方向求导两次

通过拟和三维二次函数以精确确定关键点的位置和尺度（达到亚像素精度）？

直方图中的峰值就是主方向，其他的达到最大值80%的方向可作为辅助方向

Identify peak and assign orientation and sum of magnitude to key point

The user may choose a threshold to exclude key points based on their

assigned sum of magnitudes.

利用关键点邻域像素的梯度方向分布特性为每个关键点指定方向参数，使算子具备

旋转不变性。以关键点为中心的邻域窗口内采样，并用直方图统计邻域像素的梯度

方向。梯度直方图的范围是0～360度，其中每10度一个柱，总共36个柱。随着距

中心点越远的领域其对直方图的贡献也响应减小.Lowe论文中还提到要使用高斯函

数对直方图进行平滑，减少突变的影响。

关键点描述子的生成步骤

通过对关键点周围图像区域分块，计算块内梯度直方图，生成具有独特性

的向量，这个向量是该区域图像信息的一种抽象，具有唯一性。

每一个小格都代表了特征点邻域所在的尺度空间的一个像素，箭头方向代表了像素梯

度方向，箭头长度代表该像素的幅值。然后在4×4的窗口内计算8个方向的梯度方向直

方图。绘制每个梯度方向的累加可形成一个种子点。

每个直方图有8方向的梯度方向，每一个描述符包含一个位于关键点附近的四个直方图

数组.这就导致了SIFT的特征向量有128维.（先是一个4×4的来计算出一个直方图，

每个直方图有8个方向。所以是4×4×8=128维）将这个向量归一化之后，就进一步

去除了光照的影响。

旋转为主方向

基本概念及一些补充

什么是局部特征？

•局部特征从总体上说是图像或在视觉领域中一些有别于其周围的地方

•局部特征通常是描述一块区域，使其能具有高可区分度

•局部特征的好坏直接会决定着后面分类、识别是否会得到一个好的结果

局部特征需具备的特性

•重复性

•可区分性

•准确性

•数量以及效率

•不变性

局部特征提取算法-sift

•SIFT算法由D.G.Lowe 1999年提出，2004年完善总结。后来Y.Ke将其描述子部分用PCA代替直方图的方式，对其进行改进。

•SIFT算法是一种提取局部特征的算法，在尺度空间寻找极值点，提取位置，尺度，旋转不变量

•SIFT特征是图像的局部特征，其对旋转、尺度缩放、亮度变化保持不变性，对视角变化、仿射变换、噪声也保持一定程度的稳定性。

•独特性好，信息量丰富，适用于在海量特征数据库中进行快速、准确的匹配。

•多量性，即使少数的几个物体也可以产生大量SIFT特征向量。

•可扩展性，可以很方便的与其他形式的特征向量进行联合。

尺度空间理论

•尺度空间理论目的是模拟图像数据的多尺度特征

•其基本思想是在视觉信息图像信息处理模型中引入一个被视为尺度的参数, 通过连续变化尺度参数获得不同尺度下的视觉处理信息, 然后综合这些信息以深入地挖掘图像的本质特征。

描述子生成的细节

•以极值点为中心点，并且以此点所处于的高斯尺度sigma值作为半径因子。对于远离中心点的梯度值降低对其所处区域的直方图的贡献，防止一些突变的影响。

•每个极值点对其进行三线性插值，这样可以把此极值点的贡献均衡的分到直方图中相邻的柱子上

归一化处理

•在求出4*4*8的128维特征向量后，此时SIFT特征向量已经去除了尺度变化、旋转等几何变形因素的影响。而图像的对比度变化相当于每个像素点乘上一个因子，光照变化是每个像素点加上一个值，但这些对图像归一化的梯度没有影响。因此将特征向量的长度归一化，则可以进一步去除光照变化的影响。

•对于一些非线性的光照变化，SIFT并不具备不变性，但由于这类变化影响的主要是梯度的幅值变化，对梯度的方向影响较小，因此作者通过限制梯度幅值的值来减少这类变化造成的影响。

PCA-SIFT算法

•PCA-SIFT与标准SIFT有相同的亚像素位置，尺度和主方向。但在第4步计算描述子的设计，采用的主成分分析的技术。

•下面介绍一下其特征描述子计算的部分：

•用特征点周围的41×41的像斑计算它的主元，并用PCA-SIFT将原来的2×39×39维的向量降成20维，以达到更精确的表示方式。

•它的主要步骤为，对每一个关键点：在关键点周围提取一个41×41的像斑于给定的尺度，旋转到它的主方向；计算39×39水平和垂直的梯度，形成一个大小为3042的矢量；用预先计算好的投影矩阵n×3042与此矢量相乘；这样生成一个大小为n的PCA-SIFT描述子。

文章标签：

算法

资源调度

数据库

关键词：

特征提取算法

算法sift

算法特征提取

sift算法

sift特征提取算法

迈克老狼1

目录

相关文章

简简单单做算法

|

算法语音技术

基于MFCC特征提取和HMM模型的语音合成算法matlab仿真

基于MFCC特征提取和HMM模型的语音合成算法matlab仿真

简简单单做算法

207 0 0

简简单单做算法

|

3月前

|

机器学习/深度学习算法数据安全/隐私保护

基于MSER和HOG特征提取的SVM交通标志检测和识别算法matlab仿真

### 算法简介 1. **算法运行效果图预览**：展示算法效果，完整程序运行后无水印。 2. **算法运行软件版本**：Matlab 2017b。 3. **部分核心程序**：完整版代码包含中文注释及操作步骤视频。 4. **算法理论概述**： - **MSER**：用于检测显著区域，提取图像中稳定区域，适用于光照变化下的交通标志检测。 - **HOG特征提取**：通过计算图像小区域的梯度直方图捕捉局部纹理信息，用于物体检测。 - **SVM**：寻找最大化间隔的超平面以分类样本。整个算法流程图见下图。

简简单单做算法

90 7 7

简简单单做算法

|

3月前

|

算法数据安全/隐私保护

织物图像的配准和拼接算法的MATLAB仿真,对比SIFT,SURF以及KAZE

本项目展示了织物瑕疵检测中的图像拼接技术，使用SIFT、SURF和KAZE三种算法。通过MATLAB2022a实现图像匹配、配准和拼接，最终检测并分类织物瑕疵。SIFT算法在不同尺度和旋转下保持不变性；SURF算法提高速度并保持鲁棒性；KAZE算法使用非线性扩散滤波器构建尺度空间，提供更先进的特征描述。展示视频无水印，代码含注释及操作步骤。

简简单单做算法

68 0 0

简简单单做算法

|

7月前

|

机器学习/深度学习算法

基于BP神经网络和小波变换特征提取的烟草香型分类算法matlab仿真,分为浓香型,清香型和中间香型

```markdown 探索烟草香型分类：使用Matlab2022a中的BP神经网络结合小波变换。小波分析揭示香气成分的局部特征，降低维度，PCA等用于特征选择。BP网络随后处理这些特征，以区分浓香、清香和中间香型。 ```

简简单单做算法

87 1 1

简简单单做算法

|

7月前

|

机器学习/深度学习算法语音技术

基于语音信号MFCC特征提取和GRNN神经网络的人员身份检测算法matlab仿真

**语音识别算法概览** MATLAB2022a中实现，结合MFCC与GRNN技术进行说话人身份检测。MFCC利用人耳感知特性提取语音频谱特征，GRNN作为非线性映射工具，擅长序列学习，确保高效识别。预加重、分帧、加窗、FFT、滤波器组、IDCT构成MFCC步骤，GRNN以其快速学习与鲁棒性处理不稳定数据。适用于多种领域。

简简单单做算法

88 0 0

简简单单做算法

|

机器学习/深度学习算法数据库

基于HOG特征提取和GRNN神经网络的人脸表情识别算法matlab仿真,测试使用JAFFE表情数据库

基于HOG特征提取和GRNN神经网络的人脸表情识别算法matlab仿真,测试使用JAFFE表情数据库

简简单单做算法

121 4 4

热烈的马

|

8月前

|

算法数据挖掘计算机视觉

OpenCV中应用尺度不变特征变换SIFT算法讲解及实战（附源码）

OpenCV中应用尺度不变特征变换SIFT算法讲解及实战（附源码）

热烈的马

103 0 0

时义龙

|

算法计算机视觉

图像特征提取--ORB算法

图像特征提取--ORB算法

时义龙

129 0 0

简简单单做算法

|

5天前

|

算法数据安全/隐私保护计算机视觉

基于Retinex算法的图像去雾matlab仿真

本项目展示了基于Retinex算法的图像去雾技术。完整程序运行效果无水印，使用Matlab2022a开发。核心代码包含详细中文注释和操作步骤视频。Retinex理论由Edwin Land提出，旨在分离图像的光照和反射分量，增强图像对比度、颜色和细节，尤其在雾天条件下表现优异，有效解决图像去雾问题。

简简单单做算法

96 70 70

软件算法开发

|

5天前

|

算法数据可视化安全

基于DWA优化算法的机器人路径规划matlab仿真

本项目基于DWA优化算法实现机器人路径规划的MATLAB仿真，适用于动态环境下的自主导航。使用MATLAB2022A版本运行，展示路径规划和预测结果。核心代码通过散点图和轨迹图可视化路径点及预测路径。DWA算法通过定义速度空间、采样候选动作并评估其优劣（目标方向性、障碍物距离、速度一致性），实时调整机器人运动参数，确保安全避障并接近目标。

软件算法开发

95 68 68

热门文章

最新文章

基于改进遗传优化的BP神经网络金融序列预测算法matlab仿真

局域网屏幕监控系统中的Python数据结构与算法实现

机器学习算法的优化与改进：提升模型性能的策略与方法

室内障碍物射线追踪算法matlab模拟仿真

排队算法的matlab仿真,带GUI界面

婚恋交友系统平台相亲交友平台系统婚恋交友系统APP 婚恋系统源码婚恋交友平台开发流程婚恋交友系统架构设计婚恋交友系统前端/后端开发婚恋交友系统匹配推荐算法优化

单目标问题的烟花优化算法求解matlab仿真,对比PSO和GA

员工上网行为监控中的Go语言算法：布隆过滤器的应用

强化学习之父Richard Sutton给出一个简单思路，大幅增强所有RL算法

调研180多篇论文，这篇综述终于把大模型做算法设计理清了

python中算法递归错误（Recursion Errors）

目标检测算法：从理论到实践的深度探索

Python并查集大揭秘：让你在算法界呼风唤雨，秒杀一切复杂场景！

Python中算法错误

基于无线传感器网络的MCKP-MMF算法matlab仿真

Dantzig-Wolfe分解算法解释与Python代码示例

模型训练实战：选择合适的优化算法

火箭般的提升！学会Python并查集，让你的算法能力飞跃新高度！

带你读《阿里云产品六月刊》——十四、【CVPR2024】阿里云人工智能平台PAI图像编辑算法论文入选CVPR2024

基于粒子群优化的图像融合算法matlab仿真

相关课程

更多

智能运维赛（复赛）：利用数据和算法，快速定位系统异常并进行根因分析

智能创作赛（复赛）：相册应用中的视频故事生成算法介绍

智能创作赛（初赛）：相册应用中的故事生成算法介绍

相册服务中的故事生成算法介绍

Go语言核心编程 - 数据结构和算法

神经网络概览及算法详解

相关电子书

更多

数据+算法定义新世界

袋鼠云基于实时计算的反黄牛算法

Alink：基于Apache Flink的算法平台

相关实验场景

更多

使用Swing算法实现商品推荐

RSA密码算法设计与实现

欧拉图的构造性证明与算法实现

推荐系统入门之使用ALS算法实现打分预测

下一篇

阿里云开通OSS存储服务详细流程