计算机视觉|视频图像的预处理

简介: 计算机视觉|视频图像的预处理

提出问题

1、图像预处理的意义

在分析图像问题时,由于环境和拍摄自身因素影响,使得在需要处的图像存在一定的问题,同时由于操作的要求,需要对图像进行一定的转换,所以,在处理图像之前,要对图像做出预处理,方便后期操作。

解决方案

2、图像预处理的主要方面

2.1图像灰度化

图像灰度化的原理就是在RGB模型中,假定三个通道的值相等,然后用统一的灰度值表征该点的色彩信息,灰度值的范围是0255

图像灰度化的方法主要有平均值法、加权平均法和最大值法三种,由于平均值法和最大值法在灰度化时的效果较加权平均法效果较差,所以这里主要介绍加权平均法。

实际中加权平均法RGB灰度化的公式为:        

以上公式中表示三个通道的权值,且三者之和为1


根据YUV颜色空间和RGB颜色空间的转换关系,确定各权值分别为0.30080.59580.1133时,简化公式如下:

下面是图像灰度化前后的对比:

                 2.1                            2.2

2.2图像去噪声:

在摄像机拍摄图像时,由于环境中光线、镜头表面灰尘以及传输信号问题的影响,不可避免的会存在一些噪声,这些噪声对图像处理既有直接影响,因此,去噪的操作对图像处理必不可少。


图像噪声主要包括两类,一类是椒盐噪声,即由图像传感器、传输通道以及解码操作等环节产生的亮暗点噪声,它们的幅值基本相同且分布较为随机;第二类是高斯噪声,这类噪声的幅度服从高斯分布。

图像过滤噪声,一般有空间域滤波、频率域滤波以及形态学运算等等。空间域滤波是指直接通过原图像中像素点的灰度值进行数据运算去除噪声的方法,常见的空间域滤波方法主要有均值滤波、中值滤波、高斯低通滤波等;频率域滤波则是指将图像从空间域转换到频率域,通过处理相关变换系数去除噪声的方法,其主要方法有傅里叶变换、余弦变换、小波变换等;而形态学运算则是利用形态学的开、闭运算去除噪声的方法。下面主要介绍中指滤波。


中值滤波的本质就是一种基于统计排序理论的非线性滤波法,其基本原理就是将图像中以某像素点为中心的窗口范围内的所有像素点的灰度值(包括该中心像素点)进行排序,然后将灰度序列的中间值赋给该中心像素点。与其他线性滤波考量每个像素不同,中值滤波会忽略那些相对邻域(此处设为n*n窗口)内大部分像素点而言,亮度偏暗或偏亮,且所占区域小于总像素点一半(n2/2)的像素点的影响,从而有效滤除孤立的噪声点。中值滤波法对于某些类型的随机噪声,如图像扫描噪声等等,具有良好的去噪效果,并且对于滤除噪声同时导致的模糊效应也有较好的克服作用,因而其应用非常广泛。


虽然中值滤波法拥有以上诸多优点,但其也存在容易丢失图像细节的缺陷。对此,我们亦可采用基于个数的中值滤波法加以改善。基于个数的中值滤波法实质就是通过设定一阈值T限制邻域内像素点与中心像素点灰度差绝对值的范围,从而将含噪图像中的像素点的属性划分为平坦区域、图像边缘以及噪点这三类。以3*3大小的窗口为例,假设中心像素点的8邻域中,与中心像素点灰度差分的绝对值大于阈值T的相邻像素点的个数为m,则当m≤2,该中心像素点为平坦区域点;2<m<6时,该中心像素点为图像边缘点;m≥6时,该中心像素点是噪点。

例如图2.3

   

2.3



我们分别对图像(a)添加椒盐噪声和高斯白噪声,通过中指滤波得到如下的效果:

 

总结

在处理图象时不能忽略去除噪声和灰度化,对于图像的预处理方法很多,每个方法都有自己的优缺点,这里都只是介绍了其中一种,实际中运用时需要看哪种方法适用于当前情况,权衡之后选择出最好的方法。



目录
相关文章
|
机器学习/深度学习 算法 数据可视化
计算机视觉+深度学习+机器学习+opencv+目标检测跟踪+一站式学习(代码+视频+PPT)-2
计算机视觉+深度学习+机器学习+opencv+目标检测跟踪+一站式学习(代码+视频+PPT)
|
机器学习/深度学习 Ubuntu Linux
计算机视觉+深度学习+机器学习+opencv+目标检测跟踪+一站式学习(代码+视频+PPT)-1
计算机视觉+深度学习+机器学习+opencv+目标检测跟踪+一站式学习(代码+视频+PPT)
|
机器学习/深度学习 编解码 自动驾驶
计算机视觉之图像到图像的翻译
图像到图像的翻译(Image-to-Image Translation)是指将一种图像从一种表示转换为另一种表示的过程。该任务的目标是在保证图像语义信息的前提下,将图像风格、颜色或其他视觉特征进行转换。该技术在计算机视觉领域具有广泛应用,例如图像风格迁移、图像修复、图像增强、超分辨率、语义分割等。
474 4
|
编解码 机器人 测试技术
2024年6月计算机视觉论文推荐:扩散模型、视觉语言模型、视频生成等
6月还有一周就要结束了,我们今天来总结2024年6月上半月发表的最重要的论文,重点介绍了计算机视觉领域的最新研究和进展。
731 8
|
编解码 边缘计算 自然语言处理
2024年5月计算机视觉论文推荐:包括扩散模型、视觉语言模型、图像编辑和生成、视频处理和生成以及图像识别等各个主题
五月发布的计算机视觉领域重要论文涵盖了扩散模型、视觉语言模型、图像生成与编辑及目标检测。亮点包括:1) Dual3D提出双模式推理策略,实现高效文本到3D图像生成;2) CAT3D利用多视图扩散模型创建3D场景,仅需少量图像;3) Hunyuan-DiT是多分辨率的中文理解扩散Transformer,可用于多模态对话和图像生成;4) 通过潜在扩散模型从EEG数据重建自然主义音乐,展示复杂音频重建潜力。此外,还有关于视觉语言模型和图像编辑的创新工作,如BlobGEN用于合成具有控制性的图像。
725 3
|
机器学习/深度学习 并行计算 算法
Ebsynth:利用图像处理和计算机视觉的视频风格转换技术工具
EbSynth 是一款基于视频风格转换技术的工具,专注于将静态艺术风格应用到视频中的每一帧,使视频具有独特的艺术效果。它利用图像处理和计算机视觉技术,将用户提供的参考图像或绘画风格转换为视频效果。
691 2
|
机器学习/深度学习 XML 计算机视觉
OpenCV(Open Source Computer Vision Library)是一个开源的计算机视觉和机器学习库,它提供了大量的函数和工具,用于处理图像和视频数据。
OpenCV(Open Source Computer Vision Library)是一个开源的计算机视觉和机器学习库,它提供了大量的函数和工具,用于处理图像和视频数据。
|
算法 计算机视觉 Python
openCV 3计算机视觉 Python语言实现 笔记 第三章 使用OpenCV 3处理图像
openCV 3计算机视觉 Python语言实现 笔记 第三章 使用OpenCV 3处理图像
168 0
|
机器学习/深度学习 自动驾驶 算法
【计算机视觉+自动驾驶】二、多任务深度学习网络并联式、级联式构建详细讲解(图像解释 超详细必看)
【计算机视觉+自动驾驶】二、多任务深度学习网络并联式、级联式构建详细讲解(图像解释 超详细必看)
939 1
|
机器学习/深度学习 计算机视觉 Python
【Python计算机视觉】项目实战之图像增强imguag对关键点变换、标注框变化(附源码 超详细必看)
【Python计算机视觉】项目实战之图像增强imguag对关键点变换、标注框变化(附源码 超详细必看)
466 0

热门文章

最新文章