河海大学计算机研究生毕业,热爱模式识别及机器学习算法
为保证作者原意,不做翻译 cited from: Adrian Rosebrock Get off the deep learning bandwagon and get some perspective Disclaimer: This post is a bit cynical in tone.
今天学习了稀疏的光束平差法,基于上一篇博文Levenberg–Marquardt算法学习,这里对学习内容做一个理论梳理。本次内容包括: BA简介 BA迭代步长的数学推导 稀疏BA迭代步长的算法求解过程 1.BA简介 摄像机在静态环境中移动,得到不同时刻拍摄的多幅图像。
本次打算梳理下最基本的几个矩阵之间的关系以及计算,总结大体内容: 1. 单应性矩阵的基本概念 什么是单应性矩阵?单应性变换包含什么样的射影组合(projective transformation)? 单应性关系的前提条件? 单应性与极几何的联系? 2. 单应性矩阵的计算 本质矩阵和基础矩阵的性质,上一篇博文有详细介绍,所以此处只讲计算方法了。
由于《Hartley, Zisserman ...》书太厚,啃不动。所以最近回头看youtube上的德国鬼子视频, 补习机器视觉最基础的知识。所以本次博文,没有算法,没有代码,纯粹的定义和识记。
代码是我几个月前,不知道哪里下载的,原始版权不在我,也没法给出处。 opencv做相机标定经常碰到问题,就是超大图片无法找到角点。我做了小修改,就是把图片先缩小,等找到角点了,再放大到原来比例。
Gauss-Newton算法是解决非线性最优问题的常见算法之一,最近研读开源项目代码,又碰到了,索性深入看下。本次讲解内容如下: 基本数学名词识记 牛顿法推导、算法步骤、计算实例 高斯牛顿法推导(如何从牛顿法派生)、算法步骤、编程实例 高斯牛顿法优劣总结 一、基本概念定义 1.非线性方程定义及最优化方法简述 指因变量与自变量之间的关系不是线性的关系,比如平方关系、对数关系、指数关系、三角函数关系等等。
假设你有一坨带颜色点云,非常想要贴纹理的效果,但又觉得PCL那一堆API很恶心,那么就用meshlab吧! 本文将给出主要步骤:【大部分来自youtube视频】,参数什么的大家自己调吧。
之前一直不知道如何实时保存RGB-D数据,每次都写入PCD文件不现实,对于30fps的,每秒就有30个PCD文件,硬盘速度绝逼跟不上。保存color和depth视频吧,总觉得不方便,而且depth压缩与解压缩会有精度损失。
最近入手NvidiaTegra 1 开发板,ARM架构的,做室内三维重建用。今天就讲讲的PCL 1.8+ OPENCV3.1 + OPENNI2.0在ubuntu14.04 上的安装与编译。
一个SIFT关键点拥有三个信息:位置,尺度和方向。前面已经介绍了如何精确定位关键点的位置,通过尺度不变性求极值点,可以使其具有缩放不变的性质。现在来谈谈为特征点指定方向参数,使提取的特征对图像旋转具有不变性,从而实现匹配时图像的旋转无关性。
前面介绍了如何生成高斯图像金字塔,并计算了每组图像的高斯差分图像。现在介绍如何进行关键点搜索与定位(都在灰度图上搞的)。 一、极值点计算 关键点是由DOG空间的局部极值点组成的。
本次博文介绍固定点拼接点云,kinect拍摄两幅画面,二者之间旋转10度,运行环境vs2012 pcl1.7.2 使用方法: 1.采样一致性初始配准算法SAC-IA,粗略估计初始变换矩阵 2.
手头有三个prime sensor摄像头,分别固定在不同角度,打算根据RGBD信息,将三个摄像头的点云数据拼接起来。 设备限制+能力不足,一直没有把point cloud library 1.8环境搭建起来,因此无法实时读取点云信息。
我的Kinect型号:PrimeSense Carmine 使用Openni2.0 这次比较粗糙,就是想将摄像头采集的深度信息转化为现实世界的三维坐标,然后用Opengl画出来。
虚拟现实技术一直比较火,应用领域也非常广。本次为大家讲解虚拟现实的一个入门级例子,如果对以下内容感兴趣: 初音: http://jandan.net/2012/07/09/augmented-reality-girlfriend.html 动画纹身: http://jandan.net/2011/07/10/animated-tattoo.html 本次讲解将是上述实现的技术基础。
上篇文章中,我们获得了人脸的各种表情模式,也就是一堆标注点的形变参数。这次我们需要训练一中人脸特征(团块模型),它能够对人脸的不同部位(即“标注点”)分别进行描述,作为后面人脸跟踪、表情识别的区分依据。
上一篇博文中,我们了解了系统的功能和模块,明确了需要采集哪些类型的样本点及利用类的序列化的保存方式。这次将介绍几何约束模块,通过统计形态分析法(Statistical Shape Analysis, SSA),利用样本点建立对形状的描述,然后对描述的形状建立点分布模型,并从中学习统计参数,完成对形状的建模。
最近又开始学习《MasteringOpenCV系列》之前没看的部分,依旧是英文版。这次主要研究“非刚性人脸跟踪”(non-rigid face tracking),业余时间较少分几次写完吧。
本次的讲解主要内容如下: 1.什么是奇异值分解?为什么任意实矩阵都存在奇异值分解? 2.怎么用C语言代码实现SVD分解? 3.实际应用: 基于SVD的图像压缩 基于SVD的协同过滤推荐系统 一、SVD奇异值分解概念 在多数情况下,数据中的一小段携带了数据集中的大部分信息,其他信息要么是噪声,要么就是毫不相干的信息。
感觉这篇文章不错,就转载了... 编者按:计算机视觉(Computer Vision)领域历史悠久,业界对此一直都不缺乏想象。当图像和视频总量每年以数十倍的速度增长,增长到人们有一天再也无法通过文字整理和检索这些信息时,计算机视觉技术或许会和当年的关键字搜索技术一样,成为救世主。
这次商业模式学习比较简单,可能于实际市场还有脱节,有些例子也不是很新。 但是商业模式贵在活学活用,这次下定决心今年利用周末时间,要把《商业模式新生代》全部看完。
本次内容主要讲解什么是支持向量,SVM分类是如何推导的,最小序列SMO算法部分推导。 最后给出线性和非线性2分类问题的smo算法matlab实现代码。
一、logistic回归分析简介 logistic回归是研究观察结果(因变量)为二分类或多分类时,与影响因素(自变量)之间关系的一种多变量分析方法,属于概率型非线性回归。
def loadDataSet(): postingList=[['my', 'dog', 'has', 'flea', 'problems', 'help', 'please'], ['m...
推荐大家看论文《An adaptive color-based particle filter》 这次我直接截图我的硕士毕业论文的第二章的一部分,应该讲得比较详细了。
今天介绍Kalman滤波器理论知识,并给出一个演示的例子。由于Kalman滤波在目标跟踪时,需要不断获取观测向量,所以没法单独使用。如果时间充裕,下一篇博文将会做基于MeanShift + Kalman的目标跟踪。
这次将介绍基于MeanShift的目标跟踪算法,首先谈谈简介,然后给出算法实现流程,最后实现了一个单目标跟踪的MeanShift算法【matlab/c两个版本】 csdn贴公式比较烦,原谅我直接截图了… 一、简介 首先扯扯无参密度估计理论,无参密度估计也叫做非参数估计,属于数理统计的一个分支,和参数密度估计共同构成了概率密度估计方法。
前些日子一直在忙答辩的事情,毕业后去了华为,图像处理什么的都派不上用场了。打算分3-4篇文章,把我研究生阶段学过的常用算法为大家和4107的师弟师妹们分享下。
从最终实现的角度来看,说不上是遗留物检测,至多是静止目标检测【运动物体长时间滞留检测】。实验室同学搞毕业设计,帮忙弄弄,也没弄成。 本文将分别给出老外论文+对应的代码【在老外论文基础上改进的】和国内的论文+代码【失败,能力不行】。
本文依旧延续斯坦福的课程,讲解下如何用形态学操作来辨识钥匙。给定一把钥匙,如何从一串钥匙中匹配该钥匙,每把钥匙尾部都不同,但两幅图像中钥匙尺寸都相同。
本程序使用范围:为运动目标跟踪提供ground truth【真实数据】,然后你可以进行各种跟踪算法误差对比 这是写论文的好帮手哦! 内容转自:http://blog.csdn.net/xiaowei_cqu,是个妹子 我在她代码上稍微改进了下。
这篇文章还是来自斯坦福课后作业hw2_3,主要是结合一个例子介绍otsu算法【亦称为大律算法,小日本】及其改进算法。 本文将先介绍老外的题目、解题思路及maltab解答,然后分析otsu算法步骤,末了给出opencv实现。
一则比较有意思的应用,来自斯坦福 EE368/CS232:Digital Image Processing 课程作业1 【另外,推荐大家去看看老外的课程设计,全是图像处理+android / ios,有题目,有代码,有说明,有海报及视频展示...
人脸识别主要方法: .Eigenfaces,PCA(Principal Component Analysis),Turk and Pentland,1991 .
本文将分别介绍特征值分解、奇异值分解、及PCA的相关理论概念。 文章末尾将给出Householder矩阵变换、QR算法求解特征值、特征向量的代码 其中,特征值分解、奇异值分解的相关内容,转载自: http://www.cnblogs.com/LeftNotEasy/archive/2011/01/19/svd-and-applications.html 考虑到本文50%以上的部分不是那个哥们的博客原文,所以我搞成原创标题了。
本文是为《Mastering Opencv...》第七章准备的,他要使用主动外观模型AMM和POSIT算法做一个头部3D姿态估计。图像上的特征点由人工标定,但由于头部运动,比如张嘴,会导致外观形状的扭曲,即特征带点坐标变化,但相对位置几乎不变。
老外的原文:《Multiresolution gray-scale and rotation invariant texture classification with local binary patterns》 Timo Ojala, Matti PietikaÈ inen,2002 本文将对这篇文章做部分翻译,最后将分别给出下列代码实现 。
首先吐槽,搞了1天半,终于弄好了。自己android开发是小白,之前一门心思想在jni目录下读取xml文件,事实证明无论如何都不行的。好吧,后来发现资源文件应该都放在assets目录下,可是文件会被压缩,必须用什么assetmanager访问。
继上一篇文章后,现在要做的就是从车牌图像上使用optical character recognition算法将字符提取出来。对于每一块被检测的车牌,使用带监督的神经网络机器学习算法来识别字符。
一、ANPR简介: Automatic Number Plate Recognition (ANPR),,是一种使用Optical Character Recognition (OCR)和其他分割、检测方法来读取汽车注册牌照的算法。
本文的目的是用C实现生成Gabor模版,并对图像卷积。并简单提一下,Gabor滤波器在纹理特征提取上的应用。 一、什么是Gabor函数(以下内容含部分翻译自维基百科) 在图像处理中,Gabor函数是一个用于边缘提取的线性滤波器。
版权归他们:《Android高级开发实战---UI、NDK与安全》 王氏兄弟 1.何为JNI JNI (Java Native Interface) 即Java本地开发接口,也是C/C++与Java通信的一个协议,这个协议可以使Java代码与C/C++代码之间进行沟通,通过该协议,Java代码就可以调用C/C++代码,C/C++代码也可以调用Java代码,这样就可以将Java程序与C/C++程序集成到一起。
人们普遍认为角点是二维图像亮度变化剧烈的点或图像边缘曲线上曲率极大值的点。这些点在保留图像图形重要特征的同时,可以有效地减少信息的数据量,使其信息的含量很高,有效地提高了计算的速度,有利于图像的可靠匹配,使得实时处理成为可能。
SVM算法实现工具有很多,包括svm light,libsvm,有matlab本身自带的svm工具包等。 网友们一般都研究Microsoft Research的John C.
以下内容为神经网络课件SVM部分的小结: 1. 问题:对线性可分集,总能找到使样本正确划分的分界面,而且有无穷多个,哪个是最优? 必须寻找一种最优的分界准则,是两类模式分开的间隔最大。
这是本书的第三章,本文主要关注其中的特征点匹配及去除失配点的方法。 主要功能:对统一物体拍了两张照片,只是第二张图片有选择和尺度的变化。现在要分别对两幅图像提取特征点,然后将这些特征点匹配,使其尽量相互对应 下面,本文通过采用surf特征,分别使用Brute-force matcher和Flann-based matcher对特征点进行相互匹配: 第一段代码摘自opencv官网的教程: // test2.cpp : 定义控制台应用程序的入口点。
昨天CSDN博客抽风了。这是第7次编辑这个文件了,之前老是提交失败! 声明 1.电脑比较坑爹,前置摄像头坏掉了。 2.卡通化效果运行比较慢,老外的书上说是,人每触摸一下屏幕,才生成一张卡通化效果的图片 因此,为了简便期间,我就只对一副图像进行卡通化效果。
CSDN如何转载别人文章啊?!!! 悲剧只能复制黏贴了 这个老兄的地址是:http://blog.csdn.net/abcjennifer/article/details/7616663 双边滤波器是什么? 双边滤波(Bilateral filter)是一种可以保边去噪的滤波器。
这本书和配套代码网上都有得下载。 要实现书中的效果,只要三步:1.使用拉普拉斯算子提取轮廓 2.使用双边滤波器对图像进行平滑 3.根据第一步得到的轮廓模版图,将第二步的结果拷贝过去【填充轮廓图中全白的部分】 由于我的笔记本摄像头坏了,故我的程序读取的是手机拍摄的视频。