OpenCV入门
作者:ZackSock
1、什么是OpenCV?
OpenCV是一个跨平台且开源的计算机视觉和机器学习库,全称Open Source Computer Vision Library 。由Intel公司开源。其中主体库的代码是Intel用C/C++编写的,部分贡献库代码由社区程序员提供。
OpenCV不仅支持多个平台,同时还提供了多种语言的接口,包括Java、Python、Ruby等。本次课程使用的Python语言。
详细内容可以查看OpenCV的官网:[opencv.org/][https://o…
2、OpenCV能做什么?
OpenCV中实现了了很多计算机视觉算法,包括基本的图片运算、阈值处理、图像滤波、形态学操作等。除此之外,OpenCV还提供了级联分类器可以用于人脸检测。
不仅是图片,OpenCV同时提供了视频处理相关的操作,下面我们来看看一些案例。
(1)边缘检测
边缘检测的算法有很多,其中Canny算法是当前最优算法,下面图片就是使用Canny算法实现的边缘检测:
可以看到手机的边缘被完整的展现出来了。对于人像或者其它复杂的图片Canny也有比较好的表现,下面是人像的边缘检测图:
(2)人脸检测
在OpenCV的官网提供了人脸的特征文件,我们可以使用Haar级联分类器快速实现人脸检测的操作,下面是使用OpenCV实现的人脸检测:
检测效果还是比较不错的。
(3)图像腐蚀
腐蚀是最基本的形态学操作之一,我们可以通过腐蚀操作来消除图片中的一些细小的裂缝,比如下面就是简单的腐蚀操作的例子:
除了上面这些,OpenCV还要许多其它操作,在后续的文章中会陆续介绍到,下面我们在Python中来安装一下OpenCV。
3、在Python中安装OpenCV
在Python中想要使用OpenCV非常简单,我们只需要使用pip安装一个模块就好了,语句如下:
pip install opencv-python 复制代码
上面安装的就是OpenCV的主体库,也就是Intel公司提供的。我们可以通过下面语句安装贡献库:
pip install opencv-contrib-python 复制代码
不安装贡献库不影响我们使用主体库的基本功能。
在Python文件中,我们通过下面语句导入OpenCV:
import cv2 复制代码
导入后我们就可以使用它了。
4、图片的读取
读取图片的函数格式如下:
retval = cv2.imread(filename, flags=None) 复制代码
- retval:返回的图片对象(numpy.ndarray类型),如果读取失败返回None。
- filename:文件名称,为必选参数。
- flags:读取标记,用来控制文件读取的类型,我们可以选择不给它传值。
现阶段我们可以把retval简单理解为图片对象。至于flags常用的值可以看下表:
值 | 含义 |
cv2.IMREAD_UNCHANGED | 格式不变 |
cv2.IMREAD_GRAYSCALE | 灰度图 |
cv2.IMREAD_COLOR | 3通道BGR图,flags的默认值 |
暂时我们不需要理解各个参数的含义,现阶段我们不会使用flags参数。下面我们使用imread函数读取一张图片:
import cv2 retval = cv2.imread('im.jpg') 复制代码
上面就是读取图片的操作了。
5、显示图片
读取图片是最基本的操作,后续的图像操作都需要先获取图片对象,比如接下来要说的显示图片。
显示图片的操作通常伴随着等待和销毁,这么说你可能不理解,下面我们来看显示图片的代码:
import cv2 im = cv2.imread('im.jpg') # 显示图片 cv2.imshow(im, 'im') cv2.waitKey(0) cv2.destroyAllWindows() 复制代码
上面起主要作用的是imshow函数,它的函数格式如下:
imshow(winname, mat) 复制代码
参数的解释如下:
- winname:显示图片的窗口的名称
- mat:图片对象,就是我们通过imread获取的图片对象。
我们可以调用imshow函数显示图片,但imshow函数只会为我们显示一瞬间。我们看到的效果也就是一闪而过的窗口,因此需要配合我们的waitKey函数。waitKey的函数格式如下:
key = waitKey(delay=None) 复制代码
它的作用是等待用户输入,它会返回一个键盘的ASCII值。配合waitKey函数我们就能让窗口显示。
其中delay参数的函数是等待的毫秒数。我们可以选择不给或者给0,这就表示一直等待。
至于destroyAllWindows函数则是一个常规操作,因为OpenCV是由C/C++编写的,所以我们需要手动回收窗口的内存。