图像方面基础知识

简介: 图像方面基础知识

image.png

图像的颜色


色度学理论认为,任何颜色可由红、绿、蓝三种基本颜色混合得到。  图像可用红、绿、蓝三原色来表示。

计算机屏幕上显示出来的画面通常有两种描述方法:一种为图形,另一种为图像。

图形:


由指令集合组成; 指令由位置、形状、颜色等描述。 记录的是坐标值; 颜色隐含,统一描述。 显示时执行命令,转变为屏幕上所显示的形状和颜色。  

图像:


光度值(亮度或彩色); 位置按规则方式排列; 坐标值隐含。

image.png

图像空间分辨率 :


   指图像数字化的空间精细程度。

灰度级分辨率:


   即颜色深度,表示每一像素的颜色值所占的二进制位数。颜色深度越大则能表示的颜色数目越多。

image.png

image.png

image.png

图像处理的目的:


1)提高图像的视感质量,达到赏心悦目的目的。 图像去除噪声,改变图像的亮度、颜色,增强图像中的某些成份、抑制某些成份,对图像进行几何变换等,从而改善图像的质量。

2)提取图像中某些特征, 以便于分析。     常用作模式识别、计算机视觉的预处理等。这些特征包括很多方面,如频域特性、灰度/颜色特性、边界/区域特性、纹理特性、形状特性等。

3)图像识别     在分析的基础上,进行内容识别,例如:汽车牌照识别,人脸识别、虹膜识别、指纹识别等。

4)对图像数据压缩,便于存储和传输。     提高存储量,提高网络的速度。

数字图像技术:


1. 图像获取、表示和表现

2. 图像复原

3. 图像增强

4. 图像分割

5. 图像分析

6. 图像重建

7. 图像压缩编码

图像的存储格式:


按照颜色深度分类,常用图像文件:

黑白图像

8位索引图像

24位真彩色图像

彩色图像:


是指每个像素的信息由RGB三原色构成的图像,其中RGB是由不同的灰度级来描述的。

image.png

8位伪彩色索引图像:


(1)  颜色表红、绿、蓝分量值不全相等。 (2)  像素值是图像颜色表的索引地址。

image.png

真彩色图像表示:


(1)每一像素由RGB三个分量组成。 (2)每个分量各占8位,取值范围为0~255,每个像素24位。

image.png

图像的文件格式:


(1) BMP(BitMaP)格式

(2) GIF(Graphics Interchange Format)格式

(3) TIFF(Tagged Image Format File)格式

(4) JPEG(Joint Photographic Expert Group)格式

GIF主要用于不同平台上交流和传输,而不是作为文件的存储格式。  

最大不能超过64 M,   颜色最多为256色。

TIF文件的设计考虑了扩展性、方便性和可修改性,是最复杂的一种。

要求用更多的代码来控制它,结果导致文件读写速度慢,代码长。

BMP文件组成:


位图文件头结构    BITMAPFILEHEADER 

位图信息头结构BITMAPINFOHEADER 

位图颜色表RGBQUAD 

位图像素数据 

BMP文件头:


typedefstructtagBITMAPFILEHEADER{  WORDbfType; //BMDWORDbfSize;//文件大小WORDbfReserved1;//0WORDbfReserved2;//0DWORDbfOffBits; //位图数据的起始位置,}BITMAPFILEHEADER; 

位图信息头:

typedefstructtagBITMAPINFOHEADER{
DWORDbiSize; 
LONGbiWidth;  
LONGbiHeight; 
WORDbiPlanes;   //WORDbiBitCount;//每个像素所需的位数,
DWORDbiCompression;     //位图压缩类型,DWORDbiSizeImage;      //位图的大小,LONGbiXPelsPerMeter;    //LONGbiYPelsPerMeter;    //DWORDbiClrUsed;     //颜色数DWORDbiClrImportant;    //重要的颜色数} BITMAPINFOHEADER;

颜色表:


typedefstructtagRGBQUAD{
BYTErgbBlue;//蓝色BYTErgbGreen; //绿色BYTErgbRed; //红色BYTErgbReserved;//0} RGBQUAD; 

位图信息-- BITMAPINFO结构:


image.png

image.png

image.png

256位图文件调色板:


调色板 256项;

所占字节数:256*4=1024;

1024/16=64行;

总行数43h=4*16+3=67行;

文件头占 3行;

每行16字节,可以存储4个表项, 64*4=256个表项。

目录
相关文章
|
机器学习/深度学习 算法 搜索推荐
使用深度学习进行图像风格转换
在计算机视觉领域,图像风格转换是一项引人注目的技术。它允许将图像的内容与另一个图像的风格相结合,从而创造出独特且令人惊艳的图像效果。近年来,深度学习已经成为实现图像风格转换的主要方法之一。
200 0
|
机器学习/深度学习 搜索推荐 算法
计算机视觉教程6-1:图解双目视觉系统与立体校正原理
计算机视觉教程6-1:图解双目视觉系统与立体校正原理
836 0
计算机视觉教程6-1:图解双目视觉系统与立体校正原理
|
6月前
|
机器学习/深度学习 算法 搜索推荐
基于深度学习的图像风格转换技术
【5月更文挑战第31天】 在数字图像处理领域,风格转换技术已从传统算法演变至以深度学习为核心的智能化方法。本文深入探讨了基于卷积神经网络(CNN)的图像风格转换技术,分析了其核心原理、关键技术及应用前景。通过引入感知损失与风格损失的概念,实现了图像内容与风格的解耦和重组,使得源图像能够获得目标风格特征。此外,文章还讨论了目前技术面临的主要挑战,包括风格迁移的精度、效率以及多样化问题,并提出了潜在的改进方向。
|
6月前
|
机器学习/深度学习 算法 计算机视觉
利用深度学习算法实现图像风格转换技术探究
本文将通过深入分析深度学习算法在图像处理领域的应用,探讨如何利用神经网络实现图像风格转换技术。通过研究不同风格迁移算法的原理和实现方式,揭示其在艺术创作、图像编辑等领域的潜在应用和挑战。
|
6月前
|
机器学习/深度学习 计算机视觉 Python
【Python计算机视觉】项目实战之图像增强imguag对关键点变换、标注框变化(附源码 超详细必看)
【Python计算机视觉】项目实战之图像增强imguag对关键点变换、标注框变化(附源码 超详细必看)
199 0
|
机器学习/深度学习 决策智能 计算机视觉
计算机视觉实战(二)图像基本操作
计算机视觉实战(二)图像基本操作
|
计算机视觉 开发者 Python
图像学基础 | 学习笔记
快速学习图像学基础
图像学基础 | 学习笔记
|
存储 API 计算机视觉
【计算机视觉处理2】 图像的基础知识
在计算机中,图像是以二进制形式存储的。但是我们通常不会以二进制方式操作图像,在处理图像时我们更乐意把图像看作是一个点集。
176 0
|
机器学习/深度学习 机器人 计算机视觉
计算机视觉教程2-8:你知道图像背景虚化效果的原理吗?(附代码)
计算机视觉教程2-8:你知道图像背景虚化效果的原理吗?(附代码)
413 0
计算机视觉教程2-8:你知道图像背景虚化效果的原理吗?(附代码)