图像的颜色
- 图像的颜色:RGB模型
为了科学地定量描述和使用颜色,人们提出了各种颜色模型。目前常用的颜色模型按用途可分为两类,一类面向诸如视频监视器、 彩色摄像机或打印机之类的硬件设备。另一类面向以彩色处理为目的的应用,如动画中的彩色图形。面向硬件设备的最常用彩色模型是RGB模型,而面向彩色处理的最常用模型是HSI模型。另外,在印刷工业上和电视信号传输中,经常使用CMYK和YUV色彩系统。
杨赫姆霍尔兹视觉三基色假说: C = R + G + B。视网膜锥体细胞感红、感绿、感蓝色素RGB分别取值0-1或0-255。
- 图像的颜色:HSI模型
HSI模型是Munseu提出的, 它反映了人的视觉系统观察彩色的方式,在艺术上 经 常 使 用 HSI 模 型 。 HSI模 型中 , H 表示色调 (Hue) , S 表 示 饱和度(Saturation), I 表示亮度(Intensity,对应成像亮度和图像灰度)。这个模型的建立基于两个重要的事实: ① I分量与图像的彩色信息无关;② H和S分量与人感受颜色的方式是紧密相联的。这些特点使得HSI模型非常适合借助人的视觉系统来感知彩色特性的图像处理算法。
饱和度是指一个颜色的鲜明程度,饱和度越高,颜色越深, 如深红,深绿。
亮度是指光波作用于感受器所发生的效应,其大小由物体反射系数来决定,反射系数越大,物体的亮度愈大,反之愈小。
RGB转换到HSI:
对任何3个[0, 1]范围内的R、G、B值,其对应HSI模型中的I、S、H分量的计算公式为
HSI转换到RGB:
假设S、I的值在[0,1]之间,R、G、B的值也在[0,1]之间,则HSI转换为RGB的公式为(分成3段以利用对称性)
(1)当H在[0°,120°]之间 :
(2)在GB扇形区域[120°,240°),转换公式为:
(3)在BR扇形区域[240°,360°),转换公式为:
- 图像的颜色:CMYK表色系统
CMYK表色系统也是一种常用的表示颜色的方式。计算机屏幕显示通常用RGB表色系统,它是通过相加来产生其他颜色, 这种做法通常称为加色合成法(Additive Color Synthesis)。而在印刷工业上则通常用CMYK表色系统,它 是 通过 颜色 相 减来 产生 其 他 颜 色的 , 所 以 称这 种方 式 为减 色 合成 法(Subtractive Color Synthesis)。
CMYK模式的原色为青色(Cyan)、品红色(Magenta)、黄色(Yellow)和黑色(Black)。在处理图像时,一般不用CMYK模式, 主要是因为这种模式的文件大, 占用的磁盘空间和内存大。这种模式一般在印刷时使用。
- 图像的颜色:伪彩色模型
定义:通过颜色映射表描述色彩实际上是RGB颜色模型的变体
用伪彩色描述颜色的方法:建立颜色映射表一般表的长度16-256;像素值用其RGB值在映射表中的位置代替;通过抖动技术缓解颜色种类不足的问题;如何找出16-256种关键颜色是成败的关键。
- 图像的颜色:其它表色系(YUV电视信号彩色坐标系统)
YUV彩色电视信号传输时,将R、G、B改组成亮度信号和色度信号。PAL制式将R、G、B三色信号改组成Y、U、V信号, 其中Y信号表示亮度,U、V信号是色差信号。
RGB与YUV之间的对应关系如下:
图像的像素
相邻像素:
位于坐标(x xx,y yy)处的像素p pp有4个水平和垂直的相邻像素,其坐标由下式给出:
这组像素称为p pp的4领域,用N 4 ( p ) N_{4}(p)N4(p)表示。
p pp的4个对角相邻像素的坐标如下:
并用N D ( p ) 表示。这些点与4领域点一起称为p的8领域,用N 8 ( p ) 表示。即N 4 ( p ) + N D ( p ) = N 8 ( p ) 。
- 图像的连通性:4-连通、8-连通、m-连通
两个像素连通的两个必要条件是:两个像素的位置在某种情况下是否相邻;两个像素的值是否满足某种相似性。
4-连通的定义:
对于具有值V的像素p和q, 如果q在集合N4§中,则称这两个像素是4-连通的
8-连通的定义:对于具有值V的像素p和q, 如果q在集合N8§中则称这两个像素是8-
连通的
- 图像的连通性:像素邻近、图像子图临近
像素临近的定义:
如果像素p和q是连通的,则称p临近于q。我们可以用定义邻域的方法定义4-临近、8-临近和m-临近
图像子图临近的定义:
如果两个图像子集S1和S2中的某些像素是临近的,则称S1和S2是临近的
- 图像的连通性:路径
路径的定义:
我们可以用定义临近的方法定义4-路径8-路径和m-路径
- 图像的连通性:4-路径、8-路径、m-路径
图像的连通性:
像素在图像子集中连通的定义:
如果像素p 和q 是图像子集S 中的元素,如果存在一条完全由S 中的像素组成的从pp到q 的路径,则称p 和q qq在S 中是连通的。
图像子集连通元素的定义:
对于S 中的任意像素p , S 中连接到p 的所有像素的集合被称为S 的连通元素。
- 图像的距离:
像素之间距离函数的定义:
对于像素p, q和z 分别具有坐标(x ,y) (s,t) (u ,v) ,D是距离函数或称度量,当
(a) D(p,q) ≥0 (D(p,q) = 0 仅当p = q),
(b) D(p,q) = D(q,p) 并且
© D(p,z)≤ D(p,q) + D(q,z)
像素之间距离函数的定义:
(a) D(p,q) ≥0 两点之间距离大于等于0
(b) D(p,q) = D(q,p) 距离与方向无关
© D(p,z)≤ D(p,q)+D(q,z) 两点之间直线距离最短
图像的距离:欧几里德距离(De距离):
对于这个距离计算法,具有与(x,y)距离小于等于某个值r的那些像素是包含在以(x,y)为圆心、以r为半径的圆环中的那些点。
图像的距离: D4距离(城市距离):
p和q之间的D4距离定义为:
具有与(x,y)距离小于等于某个值r 的那些像素形成一个菱形。例如,与点(x,y) (中心点)D4距离小于等于2的像素,形成下列常数距离的轮廓。具有D4 = 1的像素是(x,y)的4-邻域。
图像的距离: D8距离(棋盘距离):
p和q之间的D8距离定义为
具有D8 = 1的像素是(x,y)的8-邻域距离小于r的像素围城一个矩形。
图像的基本系统
基本图像处理系统的结构
- 图像的输入:图像输入设备
基于CCD光电耦器件的输入设备有:摄像机、数字摄像机、数字相机、平板扫描仪。
基于光电倍增管的输入设备有:滚筒扫描仪。
扫描仪分辨率与扫描图像的大小:分辨率:单位长度上采样的像素个数:DPI(dot/inch)。
- 图像的存储
图像文件格式体系:互联网用:GIF、JPG、PNG;印 刷 用:TIF、JPG、TAG 、PCX;国际标准:TIF、JPG
图像存储体系:内存存储:处理时使用; 硬盘存储:处理、备份时用(在线);备份存储:光盘、磁带(离线、近线);分级存储(HSM),网络存储(SAN/NAS)。
图像的直方图、卷积与滤波
直方图的基本概念:
将图像中像素亮度(灰度级别)看成是一个随机变量, 则其分布情况反映了图像的统计特性,这可用Probability Density Function (PDF)来刻画和描述,表现为灰度直方图(Histogram)。
灰度直方图是灰度级的函数,表示图像中具有某种灰度级的像素的个数,反映了图像中每种灰度出现的频率。
灰度直方图的横坐标是灰度级,纵坐标是该灰度级出现的频度,它是图像最基本的统计特征。
图像直方图的定义举例:
直方图的性质:
(1) 直方图只包含了该图像中某一灰度值的像素出现的概率,丢失了其所在位置的信息。
(2)任一幅图像,都能惟一地确定出一幅与它对应的直方图, 但不同的图像,可能有相同的直方图。如图两幅不同图像具有相同直方图。
- 卷积与滤波:
图像处理的方法基本上可分为空间域法和频域法两大类。
(1)空间域法:
在原图像上直接进行数据运算,对像素的灰度值进行处理。它又分为两类:点运算和局部运算。所谓的点运算就是:对图像作逐点运算;局部运算是:在与处理像点邻域有关的空间域上进行运算。
(2)频域法:
在图像的变换域上进行处理, 增强感兴趣的频率分量, 然后进行反变换,得到频域处理过的图像。
空域滤波及滤波器的定义:
使用空域模板进行的图像处理,被称为空域滤波(局部运算)。模板本身被称为空域滤波器。
空间域滤波:卷积与模板:
模板操作是数字图像处理中常用的一种运算方式,图像的平滑、锐化、细化、边缘检测等都要用到模板操作。例如, 有一种常见的平滑算法是将原图中的一个像素的灰度值和它周围邻近8个像素的灰度值相加,然后将求得的平均值作为新图像中该像素的灰度值。可用如下方法来表示该操作:
上式有点类似于矩阵,通常称之为模板(Template),带星号的数据表示该元素为中心元素,即这个元素是将要处理的元素。
如果模板为:
则该操作的含义是:将原图中一个像素的灰度值和它右下相邻近的8个像素值相加,然后将求得的平均值作为新图像中该像素的灰度值。
模板操作实现了一种邻域运算,即某个像素点的结果不仅和本像素灰度有关,而且和其邻域点的值有关。模板运算的数学含义是卷积(或互相关)运算。
- 卷积与滤波:
卷积是一种用途很广的算法,可用卷积来完成各种空域的图像处理:
卷积运算中的卷积核就是模板运算中的模板:
卷积就是作加权求和的过程。邻域中的每个像素(假定邻域为3×3大小,卷积核大小与邻域相同),分别与卷积核中的每一个元素相乘,乘积求和所得结果即为中心像素的新值。
卷积核中的元素称作加权系数(亦称为卷积系数),卷积核中的系数大小及排列顺序, 决定了对图像进行区处理的类型。改变卷积核中的加权系数, 会影响到总和的数值与符号, 从而影响到所求像素的新值。
卷积核=模板=空域滤波器
模板或卷积的加权运算中,存在一些具体问题:
- 图像边界问题,当在图像上移动模板(卷积核)至图像的边界时,在原图像中找不到与卷积核中的加权系数相对应的9个像素,即卷积核悬挂在图像缓冲区的边界上, 这种现像在图像的上下左右四个边界上均会出现。
解决这个问题采用两种简单方法:一种方法是忽略图像边界数据, 另一种方法是在图像四周复制原图像边界像素的值,从而使卷积核悬挂在图像四周时可以进行正常的计算。
- 计算出来的像素值的动态范围问题:对此可简单地将其值置为0或255即可。
空域图像的运算
- 加法运算的定义:
主要应用举例: 去除“叠加性”噪声。生成图像叠加效果
- 去除“叠加性”噪声:
对于原图像f(x,y),有一个噪声图像集其中:个图像的均值定义为:当:噪声h ( x , y ) i 为互不相关,且均值为0时,上述图像均值将降低噪声的影响。
- 生成图像叠加效果:
对于两个图像f ( x , y ) 和h ( x , y ))有:会得到二次暴光的效果。推广这个公式为:
我们可以得到各种图像合成的效果,也可以用于两张图片的衔接。
- 减法的定义:
- 主要应用举例:
去除不需要的叠加性图案;检测同一场景两幅图像之间的变化;计算物体边界的梯度。
a. 去除不需要的叠加性图案:
设:背景图像b(x,y),前景背景混合图像f(x,y):g(x,y) = f(x,y) – b(x,y)。g(x,y) 为去除了背景的图像。电视制作的蓝屏技术就基于此。
b. 检测同一场景两幅图像之间的变化:
设: 时间1的图像为T 1 ( x , y ) ,时间2的图像为T 2 ( x , y )
c .计算物体边界的梯度:
在一个图像内,寻找边缘时,梯度幅度(描绘变化陡峭程度的量)的近似计算
乘法的定义:
主要应用举例: 图像的局部显示;用二值蒙板图像与原图像做乘法。
- 逻辑运算:
在“与”和“或”运算中,亮的表示二进制码1,黑的代表0。模板处理有时可以作为一种感兴趣区(ROI)处理。
- 求反运算:
求反的定义g ( x , y ) = 255 − f ( x , y ) 主要应用举例:获得一个阴图像;获得一个子图像的补图像。
获得一个子图像的补图像:
像素之间的一些基本关系
相邻像素:
位于坐标(x ,y )处的像素p 有4个水平和垂直的相邻像素,其坐标由下式给出:
这组像素称为p 的4领域,用N 4 ( p ) 表示。
p 的4个对角相邻像素的坐标如下:
并用N D ( p ) 表示。这些点与4领域点一起称为p的8领域,用N 8 ( p ) 表示。即N 4 ( p ) + N D ( p ) = N 8 ( p ))。
邻接性、连通性、区域和边界:
定义V 为邻接性的灰度值集合。在二值图像中,我们把具有1值得像素归诸于邻接像素,即V ={1}。
**4邻接:如果q在集合N4§**中,则具有V中数值的两个像素p和q是4邻接的。
**8邻接:**如果q在集合N8§中,则具有V中数值的两个像素p和q是8邻接的。
m邻接:如果q在N4§中,或者在N D ( p ) 中,而且集合N4§与N4(q)的交集没有V中的像素,此为1,则具有V中数值的两个像素p和q是m邻接的。
我的微信公众号名称:深度学习与先进智能决策
微信公众号ID:MultiAgent1024
公众号介绍:主要研究分享深度学习、机器博弈、强化学习等相关内容!期待您的关注,欢迎一起学习交流进步!