【计算机视觉处理3】图像基本处理

简介: 在前面我们了解到opencv中的图像实际上就是一个ndarray数组,我们对ndarray数组进行操作就是对图像进行操作。我们先来看一下切片查找,这是我们非常常用的一个操作。

图像基本处理

1、图像切片

在前面我们了解到opencv中的图像实际上就是一个ndarray数组,我们对ndarray数组进行操作就是对图像进行操作。我们先来看一下切片查找,这是我们非常常用的一个操作。

(1)一维数组的切片

我们来看看切片的语法,对于一维的数组我们可以通过下面的操作获取第0个到第4个元素:

array[0:5]
复制代码

从上面可以知道我们的切片操作是左闭右开的。上面的切片操作我们可以简写一下:

array[:5]
复制代码

如果我们没有设置第一个值,则表示从头开始切片。当然我们还可以省略第二个值,这时含义就是取到最后一个元素,比如下面的操作:

array[3:]
复制代码

我们用一个实际的例子来看看切片操作:

import numpy as np
# 创建一个一维的ndarray数组,数据为[0, 1, 2, 3, 4, 5, 6, 7]
array = np.array([0, 1, 2, 3, 4, 5, 6, 7])
# 取0到4个元素
print(array[0:5])
print(array[:5])
# 取第3个到最后一个元素
print(array[3:])
复制代码

输出内容如下:

[0 1 2 3 4]
[0 1 2 3 4]
[3 4 5 6 7]
复制代码

我们可以把切片操作总结为:

# 左闭右开
array[start: end-1]
复制代码

当我们以第0个开始,获取以最后一个结尾的话,对应的值是可以省略的。

(2)二维数组的切片

在图像处理中,我们更关注二维数组的切片。它的语法和一维数组很相似。为了方便理解,我们直接使用图片来进行切片,比如下面这张图片:

网络异常,图片无法展示
|

二维数组切片的语法如下:

array[start:end-1, start:end-1]
复制代码

现在我们需要明确一点,左边部分是对高的截取,右边部分是对宽的截取。那现在我要截取图片的左半部分的操作应该如下:

import cv2
# 读取图片
img = cv2.imread('xyql.jpg')
# 获取图片的宽,并除2
width = img.shape[1]//2
# 对图片进行切片,截取左半部分
left = img[:, :width]
# 显示图像三步骤
cv2.imshow('left', left)
cv2.waitKey(0)
cv2.destroyAllWindows()
复制代码

其中切片的代码是:

left = img[:, :width]
复制代码

左边的是截取高,我们需要全部截取,因此两个值都可以省略。右边我们只需要截取左半部分,因此左边的值可以省略,右边的值则是我们前面计算到的宽度。下面是效果图:

网络异常,图片无法展示
|

这里需要注意一点,彩色图像其实是三维的,但是我们没有操作第三个维度。

2、图片区域替换

既然我们知道如何切片,那我们就可以对指定区域进行替换。不过需要注意替换和被替换的区域形状要相同,即shape属性要一样。比如我要把图片左上角100*100的区域替换成白色,那我可以进行如下操作:

import cv2
import numpy as np
img = cv2.imread('1.jpg')
# 创建一个100*100的白色图像
replace_img = np.ones((100, 100), dtype=np.uint8)*255
# 将图片左上角100*100区域替换
img[:100, :100] = replace_img
复制代码

运行后会发现报了如下错误:

img[:100, :100] = replace_img
ValueError: could not broadcast input array from shape (100,100) into shape (100,100,3)
复制代码

它的意思是不能将(100, 100)的图像转换成(100, 100, 3)的图像,也就是形状不匹配。在替换时我们需要特别注意这一点,我们将上面的代码进行一些修改:

import cv2
import numpy as np
img = cv2.imread('xyql.jpg')
replace_img = np.ones((100, 100, 3), dtype=np.uint8)*255
img[:100, :100] = replace_img
复制代码

*这样我们就可以成功替换了,效果如下:

网络异常,图片无法展示
|

其实用上面的操作我们可以实现一个“双胞胎”效果,下面我们就来看看吧。

3、实现“双胞胎”效果

我们先准备两张图片,保证相机在没有移动的情况下拍两张图片,比如下面两张:

网络异常,图片无法展示
|

这是我刚拍的两张图片,因为相机没有移动,所以背景应该是一样的。我们可以通过下面的代码把两个梦幻合并到一张图片上:

import cv2
# 读取两张图片
img1 = cv2.imread('mh1.JPG')
img2 = cv2.imread('mh2.JPG')
# 求出宽的中间值
mid = img1.shape[1]//2
# 把mh2的右半边替换到mh1的右半部分
img1[:, mid:] = img2[:, mid:]
# 将拼接后的图片保存到本地
cv2.imwrite('result.jpg', img1)
复制代码

上面代码非常简单,我们只需要关注下面这句:

img1[:, mid:] = img2[:, mid:]
复制代码

img1和img2的shape都是一样的,截取的区域也是一样的,所以进行替换没有上面问题。最后我们通过:

cv2.imwrite('result.jpg', img1)
复制代码

对图片进行保存。因为我们是直接对img1进行操作,因此我们直接保存img1就好了。下面是我们的效果图:

网络异常,图片无法展示
|

这里需要多说一句,我只有一个梦幻。

4、numpy生成数组

在上一篇中我们使用下面的代码生成了一个数组:

im = np.zeros((3, 3, 1), dtype=np.uint8)
复制代码

对于数组numpy来说我们是生成一个数组,但是对opencv来说是生成一张图片。下面我们来看看numpy生成数组的一些操作。

(1)np.ones

我们可以通过numpy的ones函数生成一个元素全为1的数组,比如下面的代码:

np.ones((100, 100), dtype=np.uint8)
复制代码

ones接收两个参数,第一个参数是数组的shape,第二关则是数组元素的类型,其中np.uint8表示【无符号的8位整型】,即范围在(0-255)之间。我们可以用opencv显示一下上面的图片:

import cv2
import numpy as np
# 生成一个100*100的图片,每个元素的值都为1
img = np.ones((100, 100), dtype=np.uint8)
cv2.imwrite('result.jpg', img)
复制代码

效果图如下:

网络异常,图片无法展示
|

因为1很接近0,所以图片的颜色接近于黑色。我们可以通过下面的操作对每个元素进行操作:

import cv2
import numpy as np
img = np.ones((100, 100), dtype=np.uint8) * 127
cv2.imwrite('result.jpg', img)
复制代码

我们生成元素为1的数组后,如何进行乘127的操作,这样就可以对每个元素进行乘127操作。这时候数组的每个元素都是127,下面是显示效果:

网络异常,图片无法展示
|

当然我们的图片是二维的,对opencv来说是一个灰度图。如果想要生成一个彩色图像,我们可以生成一个三维的图像,后续我们会继续讲解。

(2)np.zeros

np.zeros和ones没有上面区别,只是它元素的内容是0。我们来简单看一下:

import numpy as np
img = np.zeros((5, 5), dtype=np.uint8)
print(img)
复制代码

为了方便看,我们直接生成一个简单的数组,输出结果如下:

[[0 0 0 0 0]
 [0 0 0 0 0]
 [0 0 0 0 0]
 [0 0 0 0 0]
 [0 0 0 0 0]]
复制代码

其它的都不再细说了。

目录
相关文章
|
机器学习/深度学习 自然语言处理 文字识别
【计算机视觉】CLIP:连接文本和图像(关于CLIP的一些补充说明)
我们推出了一个名为CLIP的神经网络,它可以有效地从自然语言监督中学习视觉概念。CLIP可以应用于任何视觉分类基准,只需提供要识别的视觉类别名称,类似于GPT-2和GPT-3的“零样本”功能。
|
4月前
|
机器学习/深度学习 编解码 自动驾驶
计算机视觉之图像到图像的翻译
图像到图像的翻译(Image-to-Image Translation)是指将一种图像从一种表示转换为另一种表示的过程。该任务的目标是在保证图像语义信息的前提下,将图像风格、颜色或其他视觉特征进行转换。该技术在计算机视觉领域具有广泛应用,例如图像风格迁移、图像修复、图像增强、超分辨率、语义分割等。
98 4
|
8月前
|
编解码 边缘计算 自然语言处理
2024年5月计算机视觉论文推荐:包括扩散模型、视觉语言模型、图像编辑和生成、视频处理和生成以及图像识别等各个主题
五月发布的计算机视觉领域重要论文涵盖了扩散模型、视觉语言模型、图像生成与编辑及目标检测。亮点包括:1) Dual3D提出双模式推理策略,实现高效文本到3D图像生成;2) CAT3D利用多视图扩散模型创建3D场景,仅需少量图像;3) Hunyuan-DiT是多分辨率的中文理解扩散Transformer,可用于多模态对话和图像生成;4) 通过潜在扩散模型从EEG数据重建自然主义音乐,展示复杂音频重建潜力。此外,还有关于视觉语言模型和图像编辑的创新工作,如BlobGEN用于合成具有控制性的图像。
303 3
|
6月前
|
机器学习/深度学习 XML 计算机视觉
OpenCV(Open Source Computer Vision Library)是一个开源的计算机视觉和机器学习库,它提供了大量的函数和工具,用于处理图像和视频数据。
OpenCV(Open Source Computer Vision Library)是一个开源的计算机视觉和机器学习库,它提供了大量的函数和工具,用于处理图像和视频数据。
|
7月前
|
算法 计算机视觉 Python
openCV 3计算机视觉 Python语言实现 笔记 第三章 使用OpenCV 3处理图像
openCV 3计算机视觉 Python语言实现 笔记 第三章 使用OpenCV 3处理图像
|
8月前
|
机器学习/深度学习 自动驾驶 算法
【计算机视觉+自动驾驶】二、多任务深度学习网络并联式、级联式构建详细讲解(图像解释 超详细必看)
【计算机视觉+自动驾驶】二、多任务深度学习网络并联式、级联式构建详细讲解(图像解释 超详细必看)
349 1
|
8月前
|
机器学习/深度学习 计算机视觉 Python
【Python计算机视觉】项目实战之图像增强imguag对关键点变换、标注框变化(附源码 超详细必看)
【Python计算机视觉】项目实战之图像增强imguag对关键点变换、标注框变化(附源码 超详细必看)
227 0
|
算法 vr&ar 计算机视觉
[笔记]Python计算机视觉编程《二》 基本的图像操作和处理
[笔记]Python计算机视觉编程《二》 基本的图像操作和处理
|
存储 算法 程序员
[笔记]Python计算机视觉编程《一》 基本的图像操作和处理(四)
[笔记]Python计算机视觉编程《一》 基本的图像操作和处理(四)
140 0
|
存储 Serverless C语言
[笔记]Python计算机视觉编程《一》 基本的图像操作和处理(三)
[笔记]Python计算机视觉编程《一》 基本的图像操作和处理(三)

热门文章

最新文章

下一篇
开通oss服务