序言:离散傅里叶变换(DFT ) 是指傅里叶变换在时域和频域上都呈现离散的形式,将时域信号的采样变换为在离散时间傅里叶变换(DTFT)频域的采样。在形式上,变换两端的序列是有限长的,而实际上这两组序列都应当被认为是离散周期信号的主值序列。即使对有限长的离散信号做DFT,也应当对其经过周期延拓成为周期信号再进行变换。(其实介绍一大推,我一点都不懂)
继续向下看:
1、离散傅里叶变换原理
说明:对于上面总的来说,对一张图像使用傅里叶变换就是将她分解成正弦和余弦两部分,也就是将图像从空间域(spatial domain)转换到频域(frequency domain)。
傅里叶变换就是一个用来将函数分解的工具,任一函数都可以表示成无数个正弦和余弦函数的和的形式。
二维图像的傅里叶变换可以有以下数学公式:
其中: f是空间域(spatial domain)值,F是频域(frequency domain)值。转换之后的频域值是复数,因此,显示傅里叶变换之后的结果需要使用实数图像(real image)加虚数图像(complex image),或者幅度图像(magitude image)加相位图像(phasen image)的形式。在实际的图像处理过程中,仅仅使用了幅度图像,因为幅度图像包含原图像的几乎所有我们需要的几何信息。然而,如果想通过修改幅度图像或者相位图像的方法来间接修改原空间图像,需要使用逆傅里叶变换得到修改后的空间图像。
另外: 在频域里面,对于一幅图像,高频部分代表了图像的细节、纹理信息;低频部分代表了图像的轮廓信息。如果对一幅精细的图像使用低通滤波器,那么滤波后的结果就只剩下轮廓了。这与信号处理的基本思想是相通的。如果图像受到的噪声恰好位于某个特定的“频率”范围内,则可以通过滤波器来恢复原来的图像。傅里叶变换在图像处理中可以做到图像增强与图像去噪、图像分割之边缘检测、图像特征提取图像压缩等。
2、dft()函数详解
说明:dft函数的作用是对一维或二维浮点数数组进行正向或反向离散傅里叶变换。
void dft(InputArray src,OutputArray dst,int flags=0,int nonzeroRows=0);
- 第一个参数:输入矩阵,可以为实数或者虚数
- 第二个参数:函数调用后的运算结果存储在这,其尺寸和类型取决于标识符,也就是第三个参数flags
- 第三个参数:转换的标识符,默认值0,取值也可以如下表
第四个参数:int类型的 nonzeroRows,有默认值0.当此参数设为非零时(最好是取值为想要处理的那一行的值,比如C.rows),函数会假设只有输入矩阵的第一个非零行包含非零元素(木有设置DFE_INVERSE标识符),或者只有输出矩阵的第一个非零行包含非零元素(设置DFT_INVERSE标识符),这样函数就可以对其他进行更高效的处理,以节省时间开销。
3、返回DFT最优尺寸大小:getOptimalDFTSize()函数
int getOptimalDFTSize(int vecsize);
解释: getOptimalDFTSize函数返回给定向量尺寸的傅里叶最优尺寸大小。为了提高离散傅里叶变换的运行速度,需要扩充图像,而具体扩充多少,由函数决定。此函数的唯一一个参数为int类型的vecsize,向量尺寸,即图片的rows、cols。
4、扩充图像边界:copyMakeBorder()函数
作用:扩充图像边界
void copyMakeBorder(IntputArray src,OutputArray dst,int top,int bottom,int left,int right,int borderType,const Scalar& value=Scalar())
第一个参数:IntputArray类型的src,输入图像,即源图像,填Mat类的对象即可
第二个参数:OutputArray类型的dst,函数调用后的运算结果存在这里,即这个参数用于存放函数调用后的输出结果,需和源图片有一样的尺寸和类型,且size应该为Size(src.cols+left+right,src.rows+top+bottom)
接下来四个参数:int类型的top、bottom、left、right,分别表示在源图像的四个方向上扩充多少像素,例如top=2,bottom=2,left=2,right=2就意味着在源图像的上下左右扩充两个像素宽度的边界。
第七个参数:边界类型,常见取值为BORDER_CONSTANT,可参考borderInterpolate()得到更多的细节
第八个参数:const Scalar&类型的 value,有默认值Scalar(),默认值为0。borderType取值为BORDER_CONSTANT时,这个参数表示边界值
5、计算二维矢量的幅值:magnitude()函数
void magnitude(InputArray x,InputArray y,OutputArray magnitude);
- 第一个参数:表示矢量的浮点型X坐标值,也就是实部。
- 第二个参数:表示矢量的浮点型Y的坐标值,也就是虚部
- 第三个参数:输出的幅值,它和第一个参数x有着同样的尺寸和类型
下面表示magnitude()函数的原理:
6、计算自然对数:log()函数
说明:log()函数的功能是计算每个数组元素绝对值的自然对数。
void log(InputArray src,OutputArray dst);
- 第一个参数:输入图像
- 第二个参数:得到绝对值。原理如下:
7、矩阵归一化:normalize()函数
void normalize(InputArray src,OutputArray dst,double alpha=1,double beta=0,int norm_type=NORM_L2,int dtype=-1,InputArray mask=noArray());
第一个参数:输入图像,即源图像,填Mat类的对象
第二个参数:函数调用后运算结果存在这里,和源图片有一样的尺寸和类型
第三个参数:归一化后的最大值,默认值1
第四个参数:归一化的最大值,默认值0
第五个参数:归一化类型,有NORM_INF、NORM_L1、NORM_L2和NORM_MINMAX等参数可选,默认值NORM_L2
第六个参数:默认值-1,当此参数为负值时,输出矩阵和src有同样的类型,否则,它和src有同样的通道数,且此时图像深度为CV_MAT_DEPTH(dtype)
第七个参数:可选的操作掩膜,默认值noArray()
8、示例程序
(1)载入原始图像
说明:将图片变换为0-255的灰度图像
Mat srcImage = imread("D:\\dota.jpg",0); if (!srcImage.data) { printf("读取图片错误\n"); return false; } imshow("原始图像灰度图", srcImage);
(2)将图像扩大到合适的尺寸
说明:离散傅里叶变换的运行速度与图片的尺寸有很大关系。当图像的尺寸是2、3、5的整数倍时计算速度最快。为了达到快速计算的目的,经常通过填凑新的边缘像素的方法获取最佳图像尺寸。函数getOptimalDFTSize()用于返回最佳尺寸,函数copyMakeBorder()用于填充边缘像素。
int m = getOptimalDFTSize(srcImage.rows); int n = getOptimalDFTSize(srcImage.cols); //将添加的像素初始化为0 Mat padded; copyMakeBorder(srcImage, padded, 0, m - srcImage.rows, 0, n - srcImage.cols, BORDER_CONSTANT, Scalar::all(0));
(3)为傅里叶变换的结果(实部和虚部)分配存储空间
说明:傅里叶变换的结果是复数,这就是说对于每个原图像值,结果会有两个图像值。此外,频域值范围远远超过空间值范围,因此至少要将频域存储在float格式中。将输入图像转换成浮点类型,并多加一个额外通道来存储复数部分。
//将planes数组组合合并成一个多通道的数组complexI Mat planes[] = { Mat_<float>(padded),Mat::zeros(padded.size(),CV_32F) }; Mat complexI; merge(planes, 2, complexI);
(4)进行离散傅里叶变换
//进行就地离散傅里叶变换 dft(complexI, complexI);
(5)将复数转换为幅值
复数包含实数部分(Re)和虚数部分(imaginary—Im)。离散傅里叶变换的结果是复数,对应的幅度可以表示为:
//5、将复数转换为幅值,即=>log(1+sqrt(Re(DFT(I))^2+Im(DFT(I))^2)) split(complexI, planes);//将多通道数组complexI分离几个单通道数组, //planes[0] = Re(DFT(I), planes[1] = Im(DFT(I)) magnitude(planes[0], planes[1], planes[1]);//planes[0]=magnitude Mat magnitudeImage = planes[0];
(6)进行对数尺度(logarithmic scale)缩放
说明:傅里叶变换的幅度值范围大到不适合在屏幕上显示。高值在屏幕上显示为白点,而低值为黑点,高低值的变换无法有效分辨。为了在屏幕上凸显出高低变化的连续性,可以用对数尺度来替换线性尺度,公式如下:
//6、进行对数尺度(logarithmic scale)缩放 magnitudeImage += Scalar::all(1); log(magnitudeImage, magnitudeImage);//求自然对数
(7)剪切和重分布幅度图象限
说明:因为在第二布延扩了图像,那现在是时候将新添加的像素剔除了。为了方便显示,也可以重新分布幅度图象限位置(第五步得到的幅度图从中间划开,得到4张1/4子图像,将每张子图像看成幅度图的一个象限,重新分布,即将4个角点重叠到图片中心)。这样话原点(0,0)就位移到图像中心了。
//7、剪切和重分布幅度图像象限 magnitudeImage = magnitudeImage(Rect(0, 0, magnitudeImage.cols&-1, magnitudeImage.rows&-2)); //重新排列傅里叶图像中的象限,使得原点位于图像中心 int cx = magnitudeImage.cols / 2; int cy = magnitudeImage.rows / 2; Mat q0(magnitudeImage, Rect(0, 0, cx, cy));//ROI区域的左上 Mat q1(magnitudeImage, Rect(cx, 0, cx, cy));//右上 Mat q2(magnitudeImage, Rect(0, cy, cx, cy));//左下 Mat q3(magnitudeImage, Rect(cx, cy, cx, cy));//右下 //交换象限(左上与右下交换) Mat tmp; q0.copyTo(tmp); q3.copyTo(q0); //交换象限(右上与左下交换) q1.copyTo(tmp); q2.copyTo(q1); tmp.copyTo(q2);
(8)归一化
说明:现在有了重分布后的幅度图,但是幅度值仍然超过可显示范围[0,1]。
//8、归一化,用0-1之间的浮点值将矩阵变换为可视的图像格式 normalize(magnitudeImage, magnitudeImage, 0, 1, NORM_MINMAX);
效果图:
示例完整代码
#include<opencv2/core/core.hpp> #include<opencv2/imgproc/imgproc.hpp> #include<opencv2/highgui/highgui.hpp> #include<iostream> using namespace std; using namespace cv; int main() { Mat srcImage = imread("D:\\dota.jpg",0); if (!srcImage.data) { printf("读取图片错误\n"); return false; } imshow("原始图像灰度图", srcImage); //ShowHelpText(); //2、输入图像延扩到最佳的尺寸,边界用0补充 int m = getOptimalDFTSize(srcImage.rows); int n = getOptimalDFTSize(srcImage.cols); //将添加的像素初始化为0 Mat padded; copyMakeBorder(srcImage, padded, 0, m - srcImage.rows, 0, n - srcImage.cols, BORDER_CONSTANT, Scalar::all(0)); //3、为傅里叶变换的结果分配存储空间 //将planes数组组合合并成一个多通道的数组complexI Mat planes[] = { Mat_<float>(padded),Mat::zeros(padded.size(),CV_32F) }; Mat complexI; merge(planes, 2, complexI); //4、进行就地离散傅里叶变换 dft(complexI, complexI); //5、将复数转换为幅值,即=>log(1+sqrt(Re(DFT(I))^2+Im(DFT(I))^2)) split(complexI, planes);//将多通道数组complexI分离几个单通道数组 //planes[0] = Re(DFT(I), planes[1] = Im(DFT(I)), magnitude(planes[0], planes[1], planes[1]);//planes[0]=magnitude Mat magnitudeImage = planes[0]; //6、进行对数尺度(logarithmic scale)缩放 magnitudeImage += Scalar::all(1); log(magnitudeImage, magnitudeImage);//求自然对数 //7、剪切和重分布幅度图像象限 magnitudeImage = magnitudeImage(Rect(0, 0, magnitudeImage.cols&-1, magnitudeImage.rows&-2)); //重新排列傅里叶图像中的象限,使得原点位于图像中心 int cx = magnitudeImage.cols / 2; int cy = magnitudeImage.rows / 2; Mat q0(magnitudeImage, Rect(0, 0, cx, cy));//ROI区域的左上 Mat q1(magnitudeImage, Rect(cx, 0, cx, cy));//右上 Mat q2(magnitudeImage, Rect(0, cy, cx, cy));//左下 Mat q3(magnitudeImage, Rect(cx, cy, cx, cy));//右下 //交换象限(左上与右下交换) Mat tmp; q0.copyTo(tmp); q3.copyTo(q0); //交换象限(右上与左下交换) q1.copyTo(tmp); q2.copyTo(q1); tmp.copyTo(q2); //8、归一化,用0-1之间的浮点值将矩阵变换为可视的图像格式 normalize(magnitudeImage, magnitudeImage, 0, 1, NORM_MINMAX); //显示效果图 imshow("频谱幅值", magnitudeImage); waitKey(0); return 0; }