数字图像基础(下)| 学习笔记

简介: 快速学习数字图像基础(下),介绍了数字图像基础(下)系统机制, 以及在实际应用过程中如何使用。

开发者学堂课程【高校精品课-华中科技大学 -智能媒体计算数字图像基础(下)】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/811/detail/15673


数字图像基础(下)


内容介绍:

一、图像的三个基本属性

二、属性一:分辨率

三、属性二:像素深度(颜色数量与颜色深度)

四、属性三:真彩色/伪彩色/直接色

五、数码相机的工作原理

六、图像工具

七、思考题


一、图像的三个基本属性

描述一幅图像需要使用图像的属性,图像的属性包含分辨率、像素深度、真/伪彩色、图像的表示法和种类等。

描述图像有三个基本属性,分别是:分辨率、像素深度和真/伪彩色。当然还有其他的因素,最主要的描述图像的这三个因素很重要。日常生活中用的最多的就是前两个分辨率和像素深度,它决定了图像的质量。


二、属性一:分辨率

我们经常遇到的分辨率有两种,图像本身的分辨率和显示设备的分辨率。

image.png

如图在华为官网上拷贝的照片,是用 P40pro 拍摄的蝴蝶,拍的很清楚,它还可以拍月亮,远近都可以。照片的分辨率取决于相机,相机本身的分辨率,就是能生成的最高分辨率很高的话,照片的分辨率就会很高。这是图像的分辨率,图像的分辨率一旦确定,照片的质量就随之确定。

显示分辨率是指手机屏幕可以显示多少个点,是它的精细程度。如果手机分辨率很高,也就是说,相同的照片在手机上看起来更清晰。这张蝴蝶的照片放在一部老款的手机上就看不到现在的效果,因为显示的分辨率太低使得照片看上去很粗糙。相反,如果图像本身拍摄得就不清晰,放到手机里面也不会变清晰。即高分辨率的手机也不能将低质量照片的质量提升。也就是说,图像的质量取决于图像本身的分辨率,相同质量的照片,显示器的质量越高,看起来的效果越好。

不同的设备里面有不同的分辨率,分辨率的单位通常用 dpi 表示,即每英寸显示的像素,也可以用 nx×ny 来表示。dpi 的数值越大,图像越清晰,数据量也会越大。分辨率是一条曲线,水平轴是分辨率,垂直坐标是清晰度,理论上,绝对清晰度是45°的线,实际的视觉效果是一条非线性曲线。一开始上升程度很高,高到一定程度会发现曲线变平。

image.png

说明分辨率很低的时候,分辨率每提高一步,就会感觉很明显。高到一定程度的时候,再提高分辨率,人的视觉系统就不敏感了。对于非专业人士,手机、相机不要追求像素的多少,三千万像素和五千万像素对于非专业人士没有太大区别就不用过于追求。

常见的分辨率:

显示器:96 dpi

显示用图片: 96 dpi

动画、视频: 96 dpi

平板扫描仪:1200dpi

底片扫描仪:4800dpi

平板扫描仪用来扫描书或表面,底片扫描仪可以扫描胶片相机的底片,有的人扫描已经洗出来的照片,如果照片本身质量不高的话,用扫描仪扫出来的质量也不会太高。

image.png

因此通常把底片放到底片扫描仪,然后用高分辨率的扫描仪扫描底片,就生成一张很好的数码照片,这就是老照片转成数码照片的过程。如果家里还有底片,赶紧扫描出来,否则胶片时间过长会坏掉。而换成数字信号,盘保存完好,就不会丢失。

激光打印机:600-1200dpi

喷墨打印机:720-2880dpi


三、属性二:像素深度(颜色数量与颜色深度)

像素深度,位数越多,颜色的数量或深度的数量也会越多。

颜色数量——用于表示图像色彩的有限位二进制数。

颜色深度——表示一个像素的二进制位数,以 bit 为单位。

颜色的数量取决于二进制的位数,数量越多,颜色数量越大。用位数表示深度,8位,16位,24位32位等等,都是指的颜色深度。

image.png

颜色深度从1位到36位,1位只有0和1两种选择,也就是黑白照片;4位是2的4次方,16种颜色;8位是2的8次方,可以有256种颜色;16位是2的16次方,65536种颜色;颜色的数量越多,五彩缤纷的世界到计算机中才可以保留下来。因此颜色深度很重要,我们通常使用的都是24位的。高于24位,人眼就区分不出来了。基于感知的压缩编码就是这样的,把实际存在而人看不见的信号直接不保存,直接压缩掉。所以人是有一定感知范围的。就像音频也是有范围的。

image.png

数字化图像以文件的形式存在,文件扩展名有严格的约定,不能修改。不同的图像文件格式,文件的扩展名也不相同。

不同的文件格式,不同的扩展名与图像处理的软件有关。psd 这种文件格式是保留图层的,就是 Photoshop 的图层文件。如果用 Photoshop 处理完之后,把它变成 Jpad 文件,就不能分层处理图像了。CAD 的图像文件也有不同的格式。


四、属性三:真彩色/伪彩色/直接色

真彩色/伪彩色/直接色,简单来讲,看是否用了颜色查找表,如果没有用颜色查找表,R、G、B 的值直接决定了显示器的显示的颜色,那就是真彩色,比如每个都用了8位,R、G、B 各有8位,一共24位,又没有用颜色查找表,就是24位真彩色。如果R、G、B 的值合在一起,作为一个索引,到颜色查找表里找了特定颜色,就叫做伪彩色。

如果 R、G、B 分别作为索引,到颜色查找表里查到表里的相应的颜色,来决定最终的R、G、B 的颜色的话,这就是直接色。

image.png

真彩色不经过颜色查找表,伪彩色和直接色要经过颜色查找表,不同的是伪彩色 R、G、B 三个值合成一个索引查表,直接色 R、G、B 三个分量分别查表。

不同颜色的生成方法的效果是不太一致的,直接色对美术、摄影的学习者等专业人士来说,还原自然的颜色更加自然;真彩色特别艳丽等等。

颜色查找表通常称为 LUT,Looking Up Table 的首写,左边图中每个像素,25不是R、G、B 的值,中间表是颜色查找表,表中存的是 R、G、B 的值,25是查表的索引,图像中存放的值是用来查表的,用25到表里面查到相应的 R、G、B 的值,然后在显示器里面把 R、G、B 的值显示出来。这就是通过颜色查找表来决定最后的颜色。

image.png

8位颜色的颜色选择器,R、G、B的值分别是0,255,255,就可以找到相对应的颜色,以此类推,从0到255也可以找到对应的颜色。知道了颜色查找表的概念,就知道了真彩色、伪彩色、直接色的概念。颜色查找表在计算机中经常使用,尤其是在图形学中。

image.png


五、数码相机的工作原理

我们模拟的相机是光的化学反应在胶片上,通过玻璃的镜头,光线进入,光线的强弱会导致不同的颜色反映在胶卷上,在不同的国家,胶卷的价格不同,我们国家原来没有胶卷,所以特别贵,后来有了叫乐凯的胶卷,科达在中国就便宜了很多,俄罗斯,东南亚很多地区,自己不能生产胶卷,科达就很贵。科达在当年模拟相机的时代是非常著名的,但是现在已经不复存在了。数码相机和模拟相机最大的区别,就是用电子元件取代了胶卷,玻璃的镜头没有改变,光信号进入以后,光强弱的变化是如何存储的呢?

图中黄色的部件是很重要的部件,光电偶合器件,CCD,Charged Coupled Device,也就是光敏元件,CCD 把光信号转化成电信号,如果它的敏感度越来越高,敏感度越高,就代表了相机的分辨率高。相机中 CCD 是非常重要的,它的作用是把可见光转变成电信号。数字电路里做得一系列事情,就是把电信号通过电压的高低变为数字信号。译码器是将电信号转换成数字信息,数字信号就可以存储在闪存卡,也可以存储在硬盘,还可以存储在 CD 里面。现在的相机都是用闪存盘的,插一个小卡片,就已经取代了胶卷。中间区域完全取代了胶卷,最核心的部件就是 CCD,变成数字信号之后,卡中的数字可以变成各种各样的文件,可以在电脑里处理,可以在手机里处理。从第一台数码相机问世到现在手机上都有很多个摄像头,如 p40pro 加在一起有6个摄像头,前置2个,后置4个,有的甚至更多,他们都是采集图像的设备。

image.png

 

六、图像工具

常用的处理软件,如浏览图像可以用 Windows 自带的图片和传真的查看器,有可以放大、缩小和旋转的功能,可以另存为不同的文件。

如果做一些简单的图像处理,比如裁剪图像中的某个区域,或者某个区域进行简单的编辑,或者添加一些文字,可以用 Windows 自带的图像处理工具——画图板,可以做一些简单处理。

Windows 自带的抓图工具,可以抓不同区域的图,变成不同的文件。

如果做一些专业的图像编辑的话,就要用到图像处理大师-Photoshop,这里面可以做各自复杂的处理,感兴趣的同学可以下载进行一些复杂的编辑,其中有很多技巧。


七、思考题

一幅分辨率为1024×768,颜色深度为24位真彩色的位图图像的大小是多少字节?

注:各种媒体形式都是可计算的。

相关文章
|
7月前
|
机器学习/深度学习 算法 数据可视化
一图胜千言:EBImage库分割和标注让你的图像说话
一图胜千言:EBImage库分割和标注让你的图像说话
203 0
|
算法 计算机视觉 开发者
镜头边界检测(上)| 学习笔记
快速学习镜头边界检测(上),介绍了镜头边界检测(上)系统机制, 以及在实际应用过程中如何使用。
镜头边界检测(上)| 学习笔记
|
机器学习/深度学习 编解码 算法
CV之NoGAN:利用图像增强技术(图片上色)实现对旧图像和电影片段进行着色和修复(爱因斯坦、鲁迅旧照/清末官员生活场景等案例)
CV之NoGAN:利用图像增强技术(图片上色)实现对旧图像和电影片段进行着色和修复(爱因斯坦、鲁迅旧照/清末官员生活场景等案例)
CV之NoGAN:利用图像增强技术(图片上色)实现对旧图像和电影片段进行着色和修复(爱因斯坦、鲁迅旧照/清末官员生活场景等案例)
|
存储 编解码 算法
数字图像基础(上)| 学习笔记
快速学习数字图像基础(上),介绍了数字图像基础(上)系统机制, 以及在实际应用过程中如何使用。
数字图像基础(上)| 学习笔记
|
机器学习/深度学习 算法 计算机视觉
图像特征提取(上)| 学习笔记
快速学习图像特征提取(上),介绍了图像特征提取(上)系统机制, 以及在实际应用过程中如何使用。
图像特征提取(上)| 学习笔记
|
存储 编解码 开发者
数字视频基础(上)| 学习笔记
快速学习数字视频基础(上),介绍了数字视频基础(上)系统机制, 以及在实际应用过程中如何使用。
数字视频基础(上)| 学习笔记
|
存储 编解码 图形学
数字视频基础(下)| 学习笔记
快速学习数字视频基础(下),介绍了数字视频基础(下)系统机制, 以及在实际应用过程中如何使用。
数字视频基础(下)| 学习笔记
|
算法 大数据 开发者
变换编码(上)| 学习笔记
快速学习变换编码(上),介绍了变换编码(上)系统机制, 以及在实际应用过程中如何使用。
 变换编码(上)| 学习笔记
|
Web App开发 算法 计算机视觉
变换编码(下)| 学习笔记
快速学习变换编码(下),介绍了变换编码(下)系统机制, 以及在实际应用过程中如何使用。
变换编码(下)| 学习笔记
|
机器学习/深度学习 开发者
镜头边界检测(中)| 学习笔记
快速学习镜头边界检测(中),介绍了镜头边界检测(中)系统机制, 以及在实际应用过程中如何使用。
镜头边界检测(中)| 学习笔记