图像方面基础知识

简介: 图像方面基础知识

image.png

图像的颜色


色度学理论认为,任何颜色可由红、绿、蓝三种基本颜色混合得到。  图像可用红、绿、蓝三原色来表示。

计算机屏幕上显示出来的画面通常有两种描述方法:一种为图形,另一种为图像。

图形:


由指令集合组成; 指令由位置、形状、颜色等描述。 记录的是坐标值; 颜色隐含,统一描述。 显示时执行命令,转变为屏幕上所显示的形状和颜色。  

图像:


光度值(亮度或彩色); 位置按规则方式排列; 坐标值隐含。

image.png

图像空间分辨率 :


   指图像数字化的空间精细程度。

灰度级分辨率:


   即颜色深度,表示每一像素的颜色值所占的二进制位数。颜色深度越大则能表示的颜色数目越多。

image.png

image.png

image.png

图像处理的目的:


1)提高图像的视感质量,达到赏心悦目的目的。 图像去除噪声,改变图像的亮度、颜色,增强图像中的某些成份、抑制某些成份,对图像进行几何变换等,从而改善图像的质量。

2)提取图像中某些特征, 以便于分析。     常用作模式识别、计算机视觉的预处理等。这些特征包括很多方面,如频域特性、灰度/颜色特性、边界/区域特性、纹理特性、形状特性等。

3)图像识别     在分析的基础上,进行内容识别,例如:汽车牌照识别,人脸识别、虹膜识别、指纹识别等。

4)对图像数据压缩,便于存储和传输。     提高存储量,提高网络的速度。

数字图像技术:


1. 图像获取、表示和表现

2. 图像复原

3. 图像增强

4. 图像分割

5. 图像分析

6. 图像重建

7. 图像压缩编码

图像的存储格式:


按照颜色深度分类,常用图像文件:

黑白图像

8位索引图像

24位真彩色图像

彩色图像:


是指每个像素的信息由RGB三原色构成的图像,其中RGB是由不同的灰度级来描述的。

image.png

8位伪彩色索引图像:


(1)  颜色表红、绿、蓝分量值不全相等。 (2)  像素值是图像颜色表的索引地址。

image.png

真彩色图像表示:


(1)每一像素由RGB三个分量组成。 (2)每个分量各占8位,取值范围为0~255,每个像素24位。

image.png

图像的文件格式:


(1) BMP(BitMaP)格式

(2) GIF(Graphics Interchange Format)格式

(3) TIFF(Tagged Image Format File)格式

(4) JPEG(Joint Photographic Expert Group)格式

GIF主要用于不同平台上交流和传输,而不是作为文件的存储格式。  

最大不能超过64 M,   颜色最多为256色。

TIF文件的设计考虑了扩展性、方便性和可修改性,是最复杂的一种。

要求用更多的代码来控制它,结果导致文件读写速度慢,代码长。

BMP文件组成:


位图文件头结构    BITMAPFILEHEADER 

位图信息头结构BITMAPINFOHEADER 

位图颜色表RGBQUAD 

位图像素数据 

BMP文件头:


typedefstructtagBITMAPFILEHEADER{  WORDbfType; //BMDWORDbfSize;//文件大小WORDbfReserved1;//0WORDbfReserved2;//0DWORDbfOffBits; //位图数据的起始位置,}BITMAPFILEHEADER; 

位图信息头:

typedefstructtagBITMAPINFOHEADER{
DWORDbiSize; 
LONGbiWidth;  
LONGbiHeight; 
WORDbiPlanes;   //WORDbiBitCount;//每个像素所需的位数,
DWORDbiCompression;     //位图压缩类型,DWORDbiSizeImage;      //位图的大小,LONGbiXPelsPerMeter;    //LONGbiYPelsPerMeter;    //DWORDbiClrUsed;     //颜色数DWORDbiClrImportant;    //重要的颜色数} BITMAPINFOHEADER;

颜色表:


typedefstructtagRGBQUAD{
BYTErgbBlue;//蓝色BYTErgbGreen; //绿色BYTErgbRed; //红色BYTErgbReserved;//0} RGBQUAD; 

位图信息-- BITMAPINFO结构:


image.png

image.png

image.png

256位图文件调色板:


调色板 256项;

所占字节数:256*4=1024;

1024/16=64行;

总行数43h=4*16+3=67行;

文件头占 3行;

每行16字节,可以存储4个表项, 64*4=256个表项。

目录
相关文章
|
机器学习/深度学习 搜索推荐 算法
计算机视觉教程6-1:图解双目视觉系统与立体校正原理
计算机视觉教程6-1:图解双目视觉系统与立体校正原理
630 0
计算机视觉教程6-1:图解双目视觉系统与立体校正原理
|
机器学习/深度学习 传感器 编解码
史上最全 | 基于深度学习的3D分割综述(RGB-D/点云/体素/多目)(上)
3D目标分割是计算机视觉中的一个基本且具有挑战性的问题,在自动驾驶、机器人、增强现实和医学图像分析等领域有着广泛的应用。它受到了计算机视觉、图形和机器学习社区的极大关注。传统上,3D分割是用人工设计的特征和工程方法进行的,这些方法精度较差,也无法推广到大规模数据上。在2D计算机视觉巨大成功的推动下,深度学习技术最近也成为3D分割任务的首选。近年来已涌现出大量相关工作,并且已经在不同的基准数据集上进行了评估。本文全面调研了基于深度学习的3D分割的最新进展,涵盖了150多篇论文。论文总结了最常用的范式,讨论了它们的优缺点,并分析了这些分割方法的对比结果。并在此基础上,提出了未来的研究方向。
史上最全 | 基于深度学习的3D分割综述(RGB-D/点云/体素/多目)(上)
|
2月前
|
机器学习/深度学习 算法 计算机视觉
利用深度学习算法实现图像风格转换技术探究
本文将通过深入分析深度学习算法在图像处理领域的应用,探讨如何利用神经网络实现图像风格转换技术。通过研究不同风格迁移算法的原理和实现方式,揭示其在艺术创作、图像编辑等领域的潜在应用和挑战。
|
5月前
|
机器学习/深度学习 计算机视觉 Python
【Python计算机视觉】项目实战之图像增强imguag对关键点变换、标注框变化(附源码 超详细必看)
【Python计算机视觉】项目实战之图像增强imguag对关键点变换、标注框变化(附源码 超详细必看)
75 0
|
9月前
|
机器学习/深度学习 决策智能 计算机视觉
计算机视觉实战(二)图像基本操作
计算机视觉实战(二)图像基本操作
|
9月前
|
机器学习/深度学习 算法 决策智能
计算机视觉实战(十六)光流估计 (附完整代码)
计算机视觉实战(十六)光流估计 (附完整代码)
|
12月前
数字图像的基本概念与分析
数字图像的基本概念与分析
|
机器学习/深度学习 数据采集 编解码
史上最全 | 基于深度学习的3D分割综述(RGB-D/点云/体素/多目)(下)
3D目标分割是计算机视觉中的一个基本且具有挑战性的问题,在自动驾驶、机器人、增强现实和医学图像分析等领域有着广泛的应用。它受到了计算机视觉、图形和机器学习社区的极大关注。传统上,3D分割是用人工设计的特征和工程方法进行的,这些方法精度较差,也无法推广到大规模数据上。在2D计算机视觉巨大成功的推动下,深度学习技术最近也成为3D分割任务的首选。近年来已涌现出大量相关工作,并且已经在不同的基准数据集上进行了评估。本文全面调研了基于深度学习的3D分割的最新进展,涵盖了150多篇论文。论文总结了最常用的范式,讨论了它们的优缺点,并分析了这些分割方法的对比结果。并在此基础上,提出了未来的研究方向。
史上最全 | 基于深度学习的3D分割综述(RGB-D/点云/体素/多目)(下)
|
计算机视觉 开发者 Python
图像学基础 | 学习笔记
快速学习图像学基础
278 0
图像学基础 | 学习笔记