本节主要目的是介绍本书所用到的数字图像处理的一些基本概念。来源于东北大学 魏颖教授的数字图像课程笔记。
图像的数字化
上一节中获取图像的方式有很多种,大部分是从感知数据生成数字图像。多数传感器的输出是连续的电压波形,我们需要把连续的感知数据转换为数字形式。这种转换包括两种处理:取样和量化。
设连续图像f ( x , y ) f(x, y)f(x,y)经数字化后,可以用一个离散量组成的矩阵f ( i , j ) f(i, j)f(i,j)(即二维数组)来表示。为了计算机处理,图像函数f ( x , y ) f(x, y)f(x,y)在空间和取值上必须数字化
该式的两边以等效的方式定量的表示了一副数字图像,右边是一个实数矩阵,该矩阵中的每个元素称为图像单元、图像元素或像素。数字图像的原点位于左上角,其中正x xx轴向下延伸,正y yy轴向右延伸。
1. 矩阵中的每一个元素称为一个像素;g ( i , j ) g (i, j)g(i,j)代表( i , j ) (i, j)(i,j)点的灰度值,即亮度值。
2. 用g ( i , j ) g(i,j)g(i,j)的数值来表示( i , j ) (i,j)(i,j)位置点上灰度级值的大小,即只反映了黑白灰度的关系。
3. 如果是一幅彩色图像, 各点的数值还应当反映色彩的变化,可用g ( i , j , λ ) g(i,j, λ)g(i,j,λ)表示,其中λ是波长。
4. 如果图像是运动的,还应是时间t tt的函数,即可表示为g ( i , j , λ , f ) g(i,j,\lambda,f)g(i,j,λ,f)。
将坐标值数字化称为采样;将振幅数字化称为量化。
- 图像的采样:
空间坐标( x , y ) (x,y)(x,y)的数字化被称为图像采样,确定水平和垂直方向上的像素个数N NN 、M MM。
采样:图像在空间上的离散化称为采样。也就是用空间上部分点 的灰度值代表图像,这些点称为采样点。由于图像是一种二维分 布的信息,为了对它进行采样操作,需要先将二维信号变为一维信号,再对一维信号完成采样。具体做法是,先沿垂直方向按一 定间隔从上到下顺序地沿水平方向直线扫描,取出各水平线上灰 度值的一维扫描。而后再对一维扫描线信号按一定间隔采样得到 离散信号,即先沿垂直方向采样, 再沿水平方向采样这两个步 骤完成采样操作。对于运动图像(即时间域上的连续图像),需 先在时间轴上采样,再沿垂直方向采样,最后沿水平方向采样由 这三个步骤完成。
在进行采样时,采样点间隔的选取是一个非常重要的问题, 它决定了采样后图像的质量,即忠实于原图像的程度。采样间隔的大小选取要依据原图像中包含的细微浓淡变化来决定。一般, 图像中细节越多,采样间隔应越小。
根据一维采样定理,若一维 信号g ( t ) g(t)g(t)的最大频率为ω ωω, 以T ≤ 1 / 2 ω T≤1/2ωT≤1/2ω为间隔进行采样,则能够根据采样结果g ( i T ) ( i = … , − 1 , 0 , 1 , … ) g(iT) (i=…, -1, 0, 1, …)g(iT)(i=…,−1,0,1,…)完全恢复g ( t ) g(t)g(t)。
与采样相关的分辨率的概念:
分辨率:1. 是指映射到图像平面上的单个像素的景物元素的尺寸。单位:像素/英寸,像素/厘米;2. 或者是指要精确测量和再现一定尺寸的图像所必需的像素个数。单位:像素*像素
采样处理:将x y xyxy平面分配到一个网格上,且每一个网格中心的坐标是一个笛卡儿乘积Z × Z Z \times ZZ×Z的元素对,即所有有序元素对( a , b ) (a,b)(a,b)的集合,其中a aa和b bb属于整数集合Z ZZ。
- 图像的量化
取值的数字化被称为图像灰度级量化,所谓的量化处理,就是将f ff 映射到Z ZZ的处理。Z ZZ的最大取值,确定像素的灰度级数G = 2 m G=2^{m}G=2m,如256。
模拟图像经过采样后,在时间和空间上离散化为像素。但采样所得的像素值(即灰度值)仍是连续量。把采样后所得的各像素的灰度值从模拟量到离散量的转换称为图像灰度的量化。
若连续灰度值用z zz来表示,对于满足z i ≤ z ≤ z i + 1 z_{i}≤z≤z_{i+1}zi≤z≤zi+1的z zz值,都量化为整数q i q_{i}qi。q i q_{i}qi称为像素的灰度值,z zz与q i q_{i}qi的差称为量化误差。一般,像素值量化后用一个字节8 bit 来表示。
如下图所示,把由黑—灰—白的连续变化的灰度值, 量化为0~255共256级灰度值,灰度值的范围为0~255,表示亮度从深到浅, 对应图像中的颜色为从黑到白。
量化的方法有两种:一是等间隔量化, 一是非等间隔量化。
等间隔量化就是简单地把采样值的灰度范围等间隔地分割并进行量化。对于像素灰度值在黑—白范围较均匀分布的图像,这种量化方法可以得到较小的量化误差。该方法也称为均匀量化或线性量化。
非均匀量化是依据一幅图像具体的灰度值分布的概率密度函数,按总的量化误差最小的原则来进行量化。具体做法是对图像中像素灰度值频繁出现的灰度值范围,量化间隔取小一些,而对那些像素灰度值极少出现的范围,则量化间隔取大一些。
由于图像灰度值的概率分布密度函数因图像不同而异, 所以不可能找到一个适用于各种不同图像的最佳非等间隔量化方案。因此, 实用上一般都采用等间隔量化。
一幅图像在采样时,行、列的采样点与量化时每个像素量化的级数,既影响数字图像的质量,也影响到该数字图像数据量的大小。
假定图像取M × N M \times NM×N个样点,每个像素量化后的灰度二进制位数为Q QQ,一般Q QQ总是取为2的整数幂,即Q = 2 k Q=2kQ=2k, 则存储一幅数字图像所需的二进制位数b bb为:
字节数B BB为:
一幅图像的坐标张成的实平面部分称为空间域,x 和y 称为空间变量或空间坐标。两个坐标轴决定空间位置,第三个坐标是以两个空间变量x xx和y yy为函数的f ff(灰度)值。出于存储和量化硬件的考虑,灰度级数L LL典型地取为2的整数次幂,即L = 2 k L=2^{k}L=2k。
存储数字图像所需的比特数b bb为:b = M × N × k 。通常灰度级为2 k 2^{k}2k的图像我们称为“k kk比特图像”!
有时,由灰度跨越的值域非正式地称为动态范围,定义为系统中最大可度量灰度与最小可检测灰度之比。作为一条规则,上限取决于饱和度,下限取决于噪声。与这一概念紧密联系的另一概念是图像对比度,定义为:一幅图像中最高和最低灰度级间的灰度差。
对一幅图像,当量化级数Q QQ一定时,采样点数M × N M \times NM×N对图像质量有着显著的影响。采样点数越多,图像质量越好; 当采样点数减少时,图上的块状效应就逐渐明显。
当图像的采样点数一定时,采用不同量化级数的图像质量也不一样。如图所示,量化级数越多,图像质量越好,当量化级数越少时,图像质量越差,量化级数最小的极端情况就是二值图像, 图像出现假轮廓。
当限定数字图像的大小时, 为了得到质量较好的图像可采用如下原则:
- 对缓变的图像, 应该细量化, 粗采样, 以避免假轮廓。
- 对细节丰富的图像, 应细采样, 粗量化, 以避免模糊(混叠)。
对于彩色图像,是按照颜色成分——红(R)、绿(G)、蓝(B)分别采样和量化的。若各种颜色成分均按8 bit量化,即每种颜色量级别是256, 则可以处理256×256×256=16 777 216种颜色。
- 图像数字化设备
将模拟图像数字化成为数字图像,需要某种图像数字化设备。常见的数字化设备有数字相机、扫描仪、数字化仪等。
图像数字化设备的性能主要有像素大小、图像大小、线性度、噪声等。
图像的表示
静态图像可分为矢量(Vector)图和位图(Bitmap),位图也称为栅格图像。
矢量图:是用一系列绘图指令来表示一幅图,如AutoCAD中的绘图语句。这种方法的本质是用数学(更准确地说是几何学)公式描述一幅图像。图像中每一个形状都是一个完整的公式,称为一个对象。对象是一个封闭的整体,所以定义图像上对象的变化和对象与其他对象的关系对计算机来说是简单的, 所有这些变化都不会影响到图像中的其他对象。
位图是通过许多像素点表示一幅图像,每个像素具有颜色属性和位置属性。位图可以从传统的相片、幻灯片上制作出来或使用数字相机得到, 也可以利用Windows的画笔(Painbrush)用颜色点填充网格单元来创建位图。位图又可以分成如下四种 :二值图像 ( 线画稿 LineArt) 、灰度图像(GrayScale)、索引颜色图像(Index Color)和真彩色图像(True Color)。
- 线画稿-二值图像(黑白图像):图像的每个像素只能是黑或者白,没有中间的过渡,故又称为2值图像。2值图像的像素值为0、1。
- 灰度图像:
在灰度图像中,像素灰度级用8 bit表示,所以每个像素都是介于黑色和白色之间的256 ( 2 8 = 256 ) 256(2^{8}=256)256(28=256)种灰度中的一种。灰度图像是指每个像素的信息由一个量化的灰度级来描述的图像,没有彩色信息。
- 索引图像:
颜色深度为每像素24位的数字图像是目前所能获取、浏览和保存的颜色信息最丰富的彩色图像,由于它所表达的颜色远远超出了人眼所能辨别的范围,故将其称为“真彩色”。
在真彩色出现之前, 由于技术上的原因,计算机在处理时并没有达到每像素24位的真彩色水平,为此人们创造了索引颜色。
索引颜色通常也称为映射颜色, 在这种模式下,颜色都是预先定义的,并且可供选用的一组颜色也很有限, 索引颜色的图像最多只能显示256种颜色。一幅索引颜色图像在图像文件里定义,当打开该文件时,构成该图像具体颜色的索引值就被读入程序里,然后根据索引值找到最终的颜色。
- 真色彩图像:
“真彩色”是RGB颜色的另一种流行的叫法。RGB图像的颜色是非映射的,它可以从系统的“颜色表”里自由获取所需的颜色,这种图像文件里的颜色直接与PC机上的显示颜色相对应。
在真彩色图像中,每一个像素由红、绿和蓝三个字节组成, 每个字节为8bit,表示0到255之间的不同的亮度值,这三个字节组合可以产生1670万种不同的颜色。
- 图像文件的格式:
数字图像有多种存储格式,每种格式一般由不同的开发商支持。随着信息技术的发展和图像应用领域的不断拓宽,还会出现新的图像格式。
图像文件的数据构成:每一种图像文件均有一个文件头, 在文件头之后才是图像数据。
文件头的内容由制作该图像文件的公司决定,一般包括文件类型、文件制作者、制作时间、版本号、 文件大小等内容。各种图像文件的制作还涉及到图像文件的压缩方式和存储效率等。
bmp 图像文件的格式:查阅BMP图像文件格式的相关博客,如:http://blog.csdn.net/o_sun_o/article/details/8351037
图像的质量
图像的质量包括:层次、对比度、清晰度
- 图像的质量:层次
灰度级:表示像素明暗程度的整数量;层次: 表示灰度级的数量。图像数据的实际层次越多视觉效果就越好。
- 图像的质量:对比度
对比度是指一幅图像中灰度反差的大小。对比度=最大亮度/最小亮度。
- 图像的质量:清晰度
与清晰度相关的主要因素:亮度、对比度、主题内容的大小、细微层次、颜色饱和度