python-opencv学习笔记(一)

简介:

谷歌大热的深度学习框架tensorflow,虽然也有C的接口,但用的比较多而且较方便的还是基于python的接口,在图像处理时用的比较多的是opencv库,之前一直学的是C语言的接口,为了与tensorflow进行对接,还是有必要看一下opencv的python接口。
基本的I/O脚本:
大多数的CV需要以图像作为输入,同时也会以图像作为输出结果。一个交互式的CV应用程序会议摄像头作为输入源,其他的输入和输出还看是图像文件,视频文件和原始字节(raw byte)。
图像的读写:
OPENCV中的imread()函数和imwrite()函数能支持各种静态文件格式,支持BMP、PNG、JPEG和TIFF格式的文件。
接下来是用Python和NumPy来表示一副图片:
无论用那种格式,每一个像素都会有一个值,但不同格式表示像素的方式会不同,如用NumPy数组创建一个黑色的正方形图像:

import cv2
import numpy as np
img=np.zeros((3,3),dtype=np.uint8)
print(img)

结果:

[[0 0 0]
 [0 0 0]
 [0 0 0]]

每个像素都由一个8位整数老表示,即每个像素值得范围为0~255.
现在用cv2.cvtColor函数将图像转换成RGB格式:

import cv2
import numpy as np
img=np.zeros((3,3),dtype=np.uint8)
img=cv2.cvtColor(img,cv2.COLOR_GRAY2BGR)
print(img)

结果:

[[[0 0 0]
  [0 0 0]
  [0 0 0]]

 [[0 0 0]
  [0 0 0]
  [0 0 0]]

 [[0 0 0]
  [0 0 0]
  [0 0 0]]]

从几个中看出:现在每个像素由三元数组表示,并且每个整形(integer)向量分别表示一个B,G,R通道。其他色彩空间(如HSV)也以同样的表示方式来表示像素,只是取值范围不同(HSV模型表示方式不同),
可以通过shape的属性来查看图像的结构,它会返回行和列。如果一个通道以上会返回通道数:

import cv2
import numpy as np
img=np.zeros((3,3),dtype=np.uint8)
print(img.shape)
img=cv2.cvtColor(img,cv2.COLOR_GRAY2BGR)
print(img.shape)

结果:

(3, 3)
(3, 3, 3)

BGR格式返回了3个通道;
opencv库对图像的转换也非常方便:

import cv2
img=cv2.imread('time.jpg')
cv2.imwrite('mytime.png',img)

只需在imwrite()时改变图片的后缀就行了,
在默认情况下,即使图像文件为灰度格式,imread()函数也会返回BGR格式的图像,BGR与RGB所表示的色彩空间相同,但字节顺序相反。下面是可作为imread()函数的参数:

IMREAD_ANYCOLOR=4
IMREAD_ANYDEPTH=2
IMREAD_COLOR=1
IMREAD_GRAYSCALE=0
IMREAD_LOAD_GDAL=8
IMREAD_UNCHANGED=-1

下面例子是以灰度形式加载图片(这个过程会丢失所有的色彩信息),之后又保持为灰度的PNG图像:

import cv2
img=cv2.imread('mytime.png',cv2.IMREAD_GRAYSCALE)
cv2.imwrite('mytime2.png',img)

原图像:
mytime
转换后的图片:
mytime2
无论采用哪种模式,imread()函数会删除所有alpha(透明度)通道的信息。iimwrite()函数要求图像为BGR或灰度格式,并且每个通道都要有一定bit,输出格式要支持这些通道,例如,bmp格式要求每个通道为8位,而PNG允许每个通道为8位或16位。

目录
相关文章
|
23天前
|
计算机视觉 索引
OpenCV4学习笔记(2):显示相机视频流的帧率
这篇文章是OpenCV4学习笔记的第二部分,介绍了如何通过OpenCV4在显示相机视频流时计算并显示其帧率,使用`getTickCount`和`getTickFrequency`函数来测量帧时间,并用`putText`在图像上绘制帧率信息。
OpenCV4学习笔记(2):显示相机视频流的帧率
|
22天前
|
计算机视觉 Windows Python
windows下使用python + opencv读取含有中文路径的图片 和 把图片数据保存到含有中文的路径下
在Windows系统中,直接使用`cv2.imread()`和`cv2.imwrite()`处理含中文路径的图像文件时会遇到问题。读取时会返回空数据,保存时则无法正确保存至目标目录。为解决这些问题,可以使用`cv2.imdecode()`结合`np.fromfile()`来读取图像,并使用`cv2.imencode()`结合`tofile()`方法来保存图像至含中文的路径。这种方法有效避免了路径编码问题,确保图像处理流程顺畅进行。
118 1
|
2月前
|
机器学习/深度学习 人工智能 算法
Python在计算机视觉(CV)中扮演重要角色,得益于其丰富的库如OpenCV、Pillow和Scikit-image。
【7月更文挑战第5天】Python在计算机视觉(CV)中扮演重要角色,得益于其丰富的库如OpenCV、Pillow和Scikit-image。CV涉及图像处理、模式识别和机器学习,用于图像理解和生成。Python的跨平台特性和活跃社区使其成为CV的理想工具。基本流程包括图像获取、预处理、特征提取、分类识别及图像生成。例如,面部识别通过预处理图像,使用如`cv2.CascadeClassifier`进行检测;物体检测类似,但需适应不同目标;图像生成则利用GAN创造新图像。
48 4
|
3天前
|
存储 Python 容器
Python编程基础第二天学习笔记
Python编程的第二天学习是建立在基础概念上的深化和扩展,强调了基本语法、数据类型、控制结构和函数的重要性。通过实践这些概念,可以增强对Python编程语言的理解,并为后续的高级学习打下坚实的基础。继续实践并逐渐探索更复杂的编程任务将有助于巩固和扩展这些基础知识。
22 7
|
22天前
|
算法 计算机视觉 Python
python利用opencv进行相机标定获取参数,并根据畸变参数修正图像附有全部代码(流畅无痛版)
该文章详细介绍了使用Python和OpenCV进行相机标定以获取畸变参数,并提供了修正图像畸变的全部代码,包括生成棋盘图、拍摄标定图像、标定过程和畸变矫正等步骤。
python利用opencv进行相机标定获取参数,并根据畸变参数修正图像附有全部代码(流畅无痛版)
|
1月前
|
存储 索引 Python
Python学习笔记----列表、元组和字典的基础操作
这篇文章是一份Python学习笔记,涵盖了列表、元组和字典的基础操作,包括它们的创建、修改、删除、内置函数和方法等。
Python学习笔记----列表、元组和字典的基础操作
|
22天前
|
存储 编解码 API
python多种方法压缩图片,opencv、PIL、tinypng、pngquant压缩图片
python多种方法压缩图片,opencv、PIL、tinypng、pngquant压缩图片
20 1
|
22天前
|
算法 定位技术 vr&ar
一文了解PnP算法,python opencv中的cv2.solvePnP()的使用,以及使用cv2.sovlePnP()方法标定相机和2D激光雷达
一文了解PnP算法,python opencv中的cv2.solvePnP()的使用,以及使用cv2.sovlePnP()方法标定相机和2D激光雷达
100 0
一文了解PnP算法,python opencv中的cv2.solvePnP()的使用,以及使用cv2.sovlePnP()方法标定相机和2D激光雷达
|
1月前
|
Python
Python学习笔记---函数
这篇文章是一份Python函数学习的笔记,涵盖了使用函数的优势、内置函数的调用、自定义函数的定义、函数参数的不同类型(必须参数、关键字参数、默认参数、可变参数)、有返回值和无返回值的函数、形参和实参、变量作用域、返回函数、递归函数、匿名函数、偏函数以及输入和输出函数等多个函数相关的主题。
|
1月前
|
索引 Python
Python学习笔记----操作字符串
这篇文章是一份Python字符串操作的学习笔记,涵盖了字符串相加、序列相加、字符串长度和字符的查找、统计、分割、连接、替换、去除空白、大小写转换以及判断字符串是否由字母和数字组成等常用方法。
Python学习笔记----操作字符串