图像处理之Hessian矩阵提取关键点

简介: 图像处理之Hessian矩阵提取关键点

一:大致的算法流程

1. 对每个像素点计算图像在X方向Y方向的二阶偏导数,计算图像的XY方向的导数

2. 根据第一步的计算结果,有Hessian Matrix计算D(h) = Ixx*Iyy - Ixy*Ixy

其中Ixx表示X方向的二阶偏导数

Iyy表示Y方向的二阶偏导数

Ixy表XY方向的二阶导数

3. 根据第二步计算出来的值使用3×3窗口实现非最大信号压制,

我的做法, 直接给了threshold值,这个其实不很对,真的懒,不想弄啦!

二:导数计算实现

关于一阶与二阶高斯偏导数计算请看这里:

http://blog.csdn.net/jia20003/article/details/16369143

三:程序效果

四:算法代码

package com.gloomyfish.image.harris.corner;
 
import java.awt.image.BufferedImage;
import java.util.ArrayList;
import java.util.List;
 
import com.gloomyfish.filter.study.AbstractBufferedImageOp;
 
public class HessianFeatureDetector extends AbstractBufferedImageOp {
  
  private GaussianDerivativeFilter gdFilter;
  private double minRejectThreshold = 4.1; // (r+1)^2/r
  private List<HessianMatrix> pixelMatrixList;
  
  public HessianFeatureDetector()
  {
    gdFilter = new GaussianDerivativeFilter();
    pixelMatrixList = new ArrayList<HessianMatrix>();
  }
  
  @Override
  public BufferedImage filter(BufferedImage src, BufferedImage dest) {
    int width = src.getWidth();
        int height = src.getHeight();
        initSettings(height, width);
        if ( dest == null )
            dest = createCompatibleDestImage( src, null );
 
        int[] inPixels = new int[width*height];
        gdFilter.setDirectionType(GaussianDerivativeFilter.XX_DIRECTION);
        BufferedImage bixx = gdFilter.filter(src, null);
        getRGB( bixx, 0, 0, width, height, inPixels );
        extractPixelData(inPixels, GaussianDerivativeFilter.XX_DIRECTION, height, width);
        
        // YY Direction
        gdFilter.setDirectionType(GaussianDerivativeFilter.YY_DIRECTION);
        BufferedImage biyy = gdFilter.filter(src, null);
        getRGB( biyy, 0, 0, width, height, inPixels );
        extractPixelData(inPixels, GaussianDerivativeFilter.YY_DIRECTION, height, width);
        
        // XY Direction
        gdFilter.setDirectionType(GaussianDerivativeFilter.XY_DIRECTION);
        BufferedImage bixy = gdFilter.filter(src, null);
        getRGB( bixy, 0, 0, width, height, inPixels );
        extractPixelData(inPixels, GaussianDerivativeFilter.XY_DIRECTION, height, width);
        
        int[] outPixels = new int[width*height];
        int index = 0;
        for(int row=0; row<height; row++) {
          int ta = 0, tr = 0, tg = 0, tb = 0;
          for(int col=0; col<width; col++) {
            index = row * width + col;
            ta = 255;
            HessianMatrix hm = pixelMatrixList.get(index);
            double[] t = hm.getThreshold();
            if(t[0] > minRejectThreshold)
            {
              tr = 127;
            }
            else
            {
              tr = 0;
            }
            if(t[1] > minRejectThreshold)
            {
              tg = 127;
            }
            else
            {
              tg = 0;
            }
            if(t[2] > minRejectThreshold)
            {
              tb = 127;
            }
            else
            {
              tb = 0;
            }
                outPixels[index] = (ta << 24) | (tr << 16) | (tg << 8) | tb;
          }
        }
 
        setRGB( dest, 0, 0, width, height, outPixels );
        return dest;
  }
  
  private void initSettings(int height, int width)
  {
        int index = 0;
        for(int row=0; row<height; row++) {
          for(int col=0; col<width; col++) {
            index = row * width + col;
                HessianMatrix matrix = new HessianMatrix();
                pixelMatrixList.add(index, matrix);
          }
        }
  }
  
  private void extractPixelData(int[] pixels, int type, int height, int width)
  {
        int index = 0;
        for(int row=0; row<height; row++) {
          int ta = 0, tr = 0, tg = 0, tb = 0;
          for(int col=0; col<width; col++) {
            index = row * width + col;
            ta = (pixels[index] >> 24) & 0xff;
                tr = (pixels[index] >> 16) & 0xff;
                tg = (pixels[index] >> 8) & 0xff;
                tb = pixels[index] & 0xff;
                HessianMatrix matrix = pixelMatrixList.get(index);
                if(type == GaussianDerivativeFilter.XX_DIRECTION)
                {
                  matrix.setXx(new double[]{tr, tg, tb});
                }
                if(type == GaussianDerivativeFilter.YY_DIRECTION)
                {
                  matrix.setYy(new double[]{tr, tg, tb});
                }
                if(type == GaussianDerivativeFilter.XY_DIRECTION)
                {
                  matrix.setXy(new double[]{tr, tg, tb});
                }
          }
        }
  }
 
}

转载请注明!

相关文章
|
关系型数据库 Linux PostgreSQL
Linux centos8 docker中安装postgresql12.4及远程访问设置
Linux centos8 docker中安装postgresql12.4及远程访问设置
1394 0
|
存储 异构计算
Verilog RAM/ROM的数据初始化
Verilog RAM/ROM的数据初始化
|
存储 传感器 编解码
3D激光SLAM:LeGO-LOAM论文解读---完整篇
![在这里插入图片描述](https://img-blog.csdnimg.cn/348d0b4467a24296a22413207566c67e.png) 论文的标题是:**LeGO-LOAM: Lightweight and Ground-Optimized Lidar Odometry and Mapping on Variable Terrain** - 标题给出的应用场景是 **可变地形** - 重点是 **轻量级** 并 利用 **地面优化** - 本质依然是一个 **激光雷达里程计和建图**
3D激光SLAM:LeGO-LOAM论文解读---完整篇
|
Linux 开发工具 Android开发
FFmpeg开发笔记(六十)使用国产的ijkplayer播放器观看网络视频
ijkplayer是由Bilibili基于FFmpeg3.4研发并开源的播放器,适用于Android和iOS,支持本地视频及网络流媒体播放。本文详细介绍如何在新版Android Studio中导入并使用ijkplayer库,包括Gradle版本及配置更新、导入编译好的so文件以及添加直播链接播放代码等步骤,帮助开发者顺利进行App调试与开发。更多FFmpeg开发知识可参考《FFmpeg开发实战:从零基础到短视频上线》。
1466 2
FFmpeg开发笔记(六十)使用国产的ijkplayer播放器观看网络视频
|
机器学习/深度学习 人工智能 自然语言处理
清华EconAgent获ACL 2024杰出论文:大模型智能体革新计算经济学研究范式
近年来,人工智能的迅猛发展推动了数据驱动建模在宏观经济学领域的应用。清华大学研究团队提出的EconAgent模型,基于大型语言模型,具备类似人类的决策能力,能更准确地模拟个体行为对宏观经济系统的影响。EconAgent在个体异质性、市场动态及宏观经济因素模拟方面表现出色,并具有更好的可解释性和灵活性。然而,其高计算复杂度和部分决策过程的不透明性仍需进一步解决。该成果已在ACL 2024会议上获得杰出论文奖。论文链接:https://arxiv.org/abs/2310.10436v4
527 3
|
9月前
|
人工智能 缓存 自然语言处理
electron35-vue3-deepseek客户端流式输出AI对话系统
Electron35-DeepSeek桌面端AI系统|vue3.5+electron+arco客户端ai模板。2025跨平台ai实战electron35+vite6+arco仿DeepSeek/豆包ai流式打字聊天助手。
372 4
|
8月前
|
安全 网络协议 搜索推荐
远控安全金标准,ToDesk、向日葵、网易UU安全功能盘点,是否能攻破防线
本文对ToDesk、向日葵和网易UU三款主流远程控制软件进行了安全性评测。远程控制技术虽带来便利,但也存在安全隐患。文章从设备授权管理、远程连接与数据传输、隐私安全机制及主动防诈保护四个方面展开分析。ToDesk在二次验证、金融窗口保护等方面表现突出;向日葵基础安全功能完善但缺乏创新;网易UU侧重基础功能,安全机制尚待完善。最终通过星级表对比,ToDesk综合表现最佳,向日葵次之,网易UU适合低风险场景。未来远控软件需向体系化、智能化方向发展以应对不断演变的威胁。
|
机器学习/深度学习 人工智能 监控
一文读懂deepSpeed:深度学习训练的并行化
DeepSpeed 是由微软开发的开源深度学习优化库,旨在提高大规模模型训练的效率和可扩展性。通过创新的并行化策略、内存优化技术(如 ZeRO)及混合精度训练,DeepSpeed 显著提升了训练速度并降低了资源需求。它支持多种并行方法,包括数据并行、模型并行和流水线并行,同时与 PyTorch 等主流框架无缝集成,提供了易用的 API 和丰富的文档支持。DeepSpeed 不仅大幅减少了内存占用,还通过自动混合精度训练提高了计算效率,降低了能耗。其开源特性促进了 AI 行业的整体进步,使得更多研究者和开发者能够利用先进优化技术,推动了 AI 在各个领域的广泛应用。
|
数据可视化 Linux 网络安全
如何使用服务器训练模型
本文介绍了如何使用服务器训练模型,包括获取服务器、访问服务器、上传文件、配置环境、训练模型和下载模型等步骤。适合没有GPU或不熟悉Linux服务器的用户。通过MobaXterm工具连接服务器,使用Conda管理环境,确保训练过程顺利进行。
2048 0
如何使用服务器训练模型