图像方面基础知识

简介: 图像方面基础知识

image.png

图像的颜色


色度学理论认为,任何颜色可由红、绿、蓝三种基本颜色混合得到。  图像可用红、绿、蓝三原色来表示。

计算机屏幕上显示出来的画面通常有两种描述方法:一种为图形,另一种为图像。

图形:


由指令集合组成; 指令由位置、形状、颜色等描述。 记录的是坐标值; 颜色隐含,统一描述。 显示时执行命令,转变为屏幕上所显示的形状和颜色。  

图像:


光度值(亮度或彩色); 位置按规则方式排列; 坐标值隐含。

image.png

图像空间分辨率 :


   指图像数字化的空间精细程度。

灰度级分辨率:


   即颜色深度,表示每一像素的颜色值所占的二进制位数。颜色深度越大则能表示的颜色数目越多。

image.png

image.png

image.png

图像处理的目的:


1)提高图像的视感质量,达到赏心悦目的目的。 图像去除噪声,改变图像的亮度、颜色,增强图像中的某些成份、抑制某些成份,对图像进行几何变换等,从而改善图像的质量。

2)提取图像中某些特征, 以便于分析。     常用作模式识别、计算机视觉的预处理等。这些特征包括很多方面,如频域特性、灰度/颜色特性、边界/区域特性、纹理特性、形状特性等。

3)图像识别     在分析的基础上,进行内容识别,例如:汽车牌照识别,人脸识别、虹膜识别、指纹识别等。

4)对图像数据压缩,便于存储和传输。     提高存储量,提高网络的速度。

数字图像技术:


1. 图像获取、表示和表现

2. 图像复原

3. 图像增强

4. 图像分割

5. 图像分析

6. 图像重建

7. 图像压缩编码

图像的存储格式:


按照颜色深度分类,常用图像文件:

黑白图像

8位索引图像

24位真彩色图像

彩色图像:


是指每个像素的信息由RGB三原色构成的图像,其中RGB是由不同的灰度级来描述的。

image.png

8位伪彩色索引图像:


(1)  颜色表红、绿、蓝分量值不全相等。 (2)  像素值是图像颜色表的索引地址。

image.png

真彩色图像表示:


(1)每一像素由RGB三个分量组成。 (2)每个分量各占8位,取值范围为0~255,每个像素24位。

image.png

图像的文件格式:


(1) BMP(BitMaP)格式

(2) GIF(Graphics Interchange Format)格式

(3) TIFF(Tagged Image Format File)格式

(4) JPEG(Joint Photographic Expert Group)格式

GIF主要用于不同平台上交流和传输,而不是作为文件的存储格式。  

最大不能超过64 M,   颜色最多为256色。

TIF文件的设计考虑了扩展性、方便性和可修改性,是最复杂的一种。

要求用更多的代码来控制它,结果导致文件读写速度慢,代码长。

BMP文件组成:


位图文件头结构    BITMAPFILEHEADER 

位图信息头结构BITMAPINFOHEADER 

位图颜色表RGBQUAD 

位图像素数据 

BMP文件头:


typedefstructtagBITMAPFILEHEADER{  WORDbfType; //BMDWORDbfSize;//文件大小WORDbfReserved1;//0WORDbfReserved2;//0DWORDbfOffBits; //位图数据的起始位置,}BITMAPFILEHEADER; 

位图信息头:

typedefstructtagBITMAPINFOHEADER{
DWORDbiSize; 
LONGbiWidth;  
LONGbiHeight; 
WORDbiPlanes;   //WORDbiBitCount;//每个像素所需的位数,
DWORDbiCompression;     //位图压缩类型,DWORDbiSizeImage;      //位图的大小,LONGbiXPelsPerMeter;    //LONGbiYPelsPerMeter;    //DWORDbiClrUsed;     //颜色数DWORDbiClrImportant;    //重要的颜色数} BITMAPINFOHEADER;

颜色表:


typedefstructtagRGBQUAD{
BYTErgbBlue;//蓝色BYTErgbGreen; //绿色BYTErgbRed; //红色BYTErgbReserved;//0} RGBQUAD; 

位图信息-- BITMAPINFO结构:


image.png

image.png

image.png

256位图文件调色板:


调色板 256项;

所占字节数:256*4=1024;

1024/16=64行;

总行数43h=4*16+3=67行;

文件头占 3行;

每行16字节,可以存储4个表项, 64*4=256个表项。

目录
相关文章
|
7月前
|
分布式计算 MaxCompute 计算机视觉
ODPS问题之odps.sql.mapper.split.size属性有什么作用,以及如何根据场景调整它
ODPS问题之odps.sql.mapper.split.size属性有什么作用,以及如何根据场景调整它
355 1
|
7月前
|
SQL Oracle 关系型数据库
关系型数据库Oracle备份工具
【7月更文挑战第19天】
105 4
|
JSON 前端开发 Java
Java:SpringBoot返回json数据时间格式、命名风格、忽略字段返回
Java:SpringBoot返回json数据时间格式、命名风格、忽略字段返回
811 0
|
9月前
|
NoSQL Java 关系型数据库
【Redis系列笔记】分布式锁
分布式锁:满足分布式系统或集群模式下多进程可见并且互斥的锁。 分布式锁的核心思想就是让大家都使用同一把锁,只要大家使用的是同一把锁,那么我们就能锁住线程,不让线程进行,让程序串行执行,这就是分布式锁的核心思路
768 2
|
前端开发 PHP 开发工具
vscode 使用小结
vscode 使用小结
|
7月前
|
存储 索引 Python
NumPy 教程 之 NumPy Ndarray 对象 6
**NumPy的ndarray对象是核心特征,是同类型元素的多维数组。它包括数据指针、数据类型(dtype)、形状元组和跨度元组。创建数组使用`numpy.array()`,可通过`dtype`指定数据类型。例如:`a = np.array([1, 2, 3], dtype=complex)`生成复数数组。内存布局遵循C或F顺序。**
37 0
|
数据可视化 机器人 物联网
《计算机科学与工程导论:基于IoT和机器人的可视化编程实践方法第2版》一2.3.1 创建程序显示“Hello World”
本节书摘来华章计算机《计算机科学与工程导论:基于IoT和机器人的可视化编程实践方法第2版》一书中的第2章 ,第2.3.1节,陈以农 陈文智 韩德强 著 更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1111 0
|
3天前
|
人工智能 自然语言处理 Shell
深度评测 | 仅用3分钟,百炼调用满血版 Deepseek-r1 API,百万Token免费用,简直不要太爽。
仅用3分钟,百炼调用满血版Deepseek-r1 API,享受百万免费Token。阿里云提供零门槛、快速部署的解决方案,支持云控制台和Cloud Shell两种方式,操作简便。Deepseek-r1满血版在推理能力上表现出色,尤其擅长数学、代码和自然语言处理任务,使用过程中无卡顿,体验丝滑。结合Chatbox工具,用户可轻松掌控模型,提升工作效率。阿里云大模型服务平台百炼不仅速度快,还确保数据安全,值得信赖。
157353 24
深度评测 | 仅用3分钟,百炼调用满血版 Deepseek-r1 API,百万Token免费用,简直不要太爽。
|
5天前
|
人工智能 API 网络安全
用DeepSeek,就在阿里云!四种方式助您快速使用 DeepSeek-R1 满血版!更有内部实战指导!
DeepSeek自发布以来,凭借卓越的技术性能和开源策略迅速吸引了全球关注。DeepSeek-R1作为系列中的佼佼者,在多个基准测试中超越现有顶尖模型,展现了强大的推理能力。然而,由于其爆火及受到黑客攻击,官网使用受限,影响用户体验。为解决这一问题,阿里云提供了多种解决方案。
16983 37
|
13天前
|
机器学习/深度学习 人工智能 自然语言处理
PAI Model Gallery 支持云上一键部署 DeepSeek-V3、DeepSeek-R1 系列模型
DeepSeek 系列模型以其卓越性能在全球范围内备受瞩目,多次评测中表现优异,性能接近甚至超越国际顶尖闭源模型(如OpenAI的GPT-4、Claude-3.5-Sonnet等)。企业用户和开发者可使用 PAI 平台一键部署 DeepSeek 系列模型,实现 DeepSeek 系列模型与现有业务的高效融合。

热门文章

最新文章