python-opencv学习笔记(一)

简介:

谷歌大热的深度学习框架tensorflow,虽然也有C的接口,但用的比较多而且较方便的还是基于python的接口,在图像处理时用的比较多的是opencv库,之前一直学的是C语言的接口,为了与tensorflow进行对接,还是有必要看一下opencv的python接口。
基本的I/O脚本:
大多数的CV需要以图像作为输入,同时也会以图像作为输出结果。一个交互式的CV应用程序会议摄像头作为输入源,其他的输入和输出还看是图像文件,视频文件和原始字节(raw byte)。
图像的读写:
OPENCV中的imread()函数和imwrite()函数能支持各种静态文件格式,支持BMP、PNG、JPEG和TIFF格式的文件。
接下来是用Python和NumPy来表示一副图片:
无论用那种格式,每一个像素都会有一个值,但不同格式表示像素的方式会不同,如用NumPy数组创建一个黑色的正方形图像:

import cv2
import numpy as np
img=np.zeros((3,3),dtype=np.uint8)
print(img)

结果:

[[0 0 0]
 [0 0 0]
 [0 0 0]]

每个像素都由一个8位整数老表示,即每个像素值得范围为0~255.
现在用cv2.cvtColor函数将图像转换成RGB格式:

import cv2
import numpy as np
img=np.zeros((3,3),dtype=np.uint8)
img=cv2.cvtColor(img,cv2.COLOR_GRAY2BGR)
print(img)

结果:

[[[0 0 0]
  [0 0 0]
  [0 0 0]]

 [[0 0 0]
  [0 0 0]
  [0 0 0]]

 [[0 0 0]
  [0 0 0]
  [0 0 0]]]

从几个中看出:现在每个像素由三元数组表示,并且每个整形(integer)向量分别表示一个B,G,R通道。其他色彩空间(如HSV)也以同样的表示方式来表示像素,只是取值范围不同(HSV模型表示方式不同),
可以通过shape的属性来查看图像的结构,它会返回行和列。如果一个通道以上会返回通道数:

import cv2
import numpy as np
img=np.zeros((3,3),dtype=np.uint8)
print(img.shape)
img=cv2.cvtColor(img,cv2.COLOR_GRAY2BGR)
print(img.shape)

结果:

(3, 3)
(3, 3, 3)

BGR格式返回了3个通道;
opencv库对图像的转换也非常方便:

import cv2
img=cv2.imread('time.jpg')
cv2.imwrite('mytime.png',img)

只需在imwrite()时改变图片的后缀就行了,
在默认情况下,即使图像文件为灰度格式,imread()函数也会返回BGR格式的图像,BGR与RGB所表示的色彩空间相同,但字节顺序相反。下面是可作为imread()函数的参数:

IMREAD_ANYCOLOR=4
IMREAD_ANYDEPTH=2
IMREAD_COLOR=1
IMREAD_GRAYSCALE=0
IMREAD_LOAD_GDAL=8
IMREAD_UNCHANGED=-1

下面例子是以灰度形式加载图片(这个过程会丢失所有的色彩信息),之后又保持为灰度的PNG图像:

import cv2
img=cv2.imread('mytime.png',cv2.IMREAD_GRAYSCALE)
cv2.imwrite('mytime2.png',img)

原图像:
mytime
转换后的图片:
mytime2
无论采用哪种模式,imread()函数会删除所有alpha(透明度)通道的信息。iimwrite()函数要求图像为BGR或灰度格式,并且每个通道都要有一定bit,输出格式要支持这些通道,例如,bmp格式要求每个通道为8位,而PNG允许每个通道为8位或16位。

目录
相关文章
|
4月前
|
计算机视觉
Opencv学习笔记(十二):图片腐蚀和膨胀操作
这篇文章介绍了图像腐蚀和膨胀的原理、作用以及使用OpenCV实现这些操作的代码示例,并深入解析了开运算和闭运算的概念及其在图像形态学处理中的应用。
245 1
Opencv学习笔记(十二):图片腐蚀和膨胀操作
|
4月前
|
编解码 数据安全/隐私保护 计算机视觉
Opencv学习笔记(十):同步和异步(多线程)操作打开海康摄像头
如何使用OpenCV进行同步和异步操作来打开海康摄像头,并提供了相关的代码示例。
181 1
Opencv学习笔记(十):同步和异步(多线程)操作打开海康摄像头
|
4月前
|
算法 计算机视觉
Opencv学习笔记(六):cv2.resize函数的介绍
这篇文章介绍了OpenCV库中cv2.resize函数的使用方法,包括其参数、插值方式选择以及实际代码示例。
738 1
Opencv学习笔记(六):cv2.resize函数的介绍
|
4月前
|
计算机视觉
Opencv学习笔记(八):如何通过cv2读取视频和摄像头来进行人脸检测(jetson nano)
如何使用OpenCV库通过cv2模块读取视频和摄像头进行人脸检测,并提供了相应的代码示例。
188 1
|
4月前
|
计算机视觉
Opencv学习笔记(五):cv2.putText()和cv2.rectangle()详细理解
这篇文章详细介绍了OpenCV库中的`cv2.putText()`和`cv2.rectangle()`函数的使用方法,并通过一个实战例子展示了如何使用这些函数在图像上绘制文字和矩形框。
424 0
Opencv学习笔记(五):cv2.putText()和cv2.rectangle()详细理解
|
27天前
|
XML 机器学习/深度学习 人工智能
使用 OpenCV 和 Python 轻松实现人脸检测
本文介绍如何使用OpenCV和Python实现人脸检测。首先,确保安装了OpenCV库并加载预训练的Haar特征模型。接着,通过读取图像或视频帧,将其转换为灰度图并使用`detectMultiScale`方法进行人脸检测。检测到的人脸用矩形框标出并显示。优化方法包括调整参数、多尺度检测及使用更先进模型。人脸检测是计算机视觉的基础技术,具有广泛应用前景。
60 10
|
4月前
|
编解码 计算机视觉 Python
Opencv学习笔记(九):通过CV2将摄像头视频流保存为视频文件
使用OpenCV库通过CV2将摄像头视频流保存为视频文件,包括定义视频编码格式、设置保存路径、通过write写入视频文件,并提供了相应的Python代码示例。
231 0
|
4月前
|
缓存 并行计算 Ubuntu
Jetson 学习笔记(十一):jetson agx xavier 源码编译ffmpeg(3.4.1)和opencv(3.4.0)
本文是关于在Jetson AGX Xavier上编译FFmpeg(3.4.1)和OpenCV(3.4.0)的详细教程,包括编译需求、步骤、测试和可能遇到的问题及其解决方案。还提供了Jetson AGX Xavier编译CUDA版本的OpenCV 4.5.0的相关信息。
144 4
Jetson 学习笔记(十一):jetson agx xavier 源码编译ffmpeg(3.4.1)和opencv(3.4.0)
|
4月前
|
网络协议 Java Linux
PyAV学习笔记(一):PyAV简介、安装、基础操作、python获取RTSP(海康)的各种时间戳(rtp、dts、pts)
本文介绍了PyAV库,它是FFmpeg的Python绑定,提供了底层库的全部功能和控制。文章详细讲解了PyAV的安装过程,包括在Windows、Linux和ARM平台上的安装步骤,以及安装中可能遇到的错误和解决方法。此外,还解释了时间戳的概念,包括RTP、NTP、PTS和DTS,并提供了Python代码示例,展示如何获取RTSP流中的各种时间戳。最后,文章还提供了一些附录,包括Python通过NTP同步获取时间的方法和使用PyAV访问网络视频流的技巧。
808 4
PyAV学习笔记(一):PyAV简介、安装、基础操作、python获取RTSP(海康)的各种时间戳(rtp、dts、pts)
|
4月前
|
Python
Socket学习笔记(二):python通过socket实现客户端到服务器端的图片传输
使用Python的socket库实现客户端到服务器端的图片传输,包括客户端和服务器端的代码实现,以及传输结果的展示。
219 3
Socket学习笔记(二):python通过socket实现客户端到服务器端的图片传输

热门文章

最新文章