OpenCV常用的 7 个示例：从读取到人脸检测（Python版）-阿里云开发者社区

OpenCV

OpenCV是计算机视觉领域最流行的库之一。它最初是用 C 和 C++ 编写的。现在也可以在 Python 中使用。它最初是由英特尔开发的。该库是一个跨平台的开源库。免费使用。OpenCV 库是一个高度优化的库，其主要重点是实时应用程序。

OpenCV 库是2500多个优化算法的组合。它可以用来检测和识别不同的人脸，在图像中或实时识别物体，使用视频和网络摄像头分类不同的人类行为，跟踪摄像机的运动，跟踪像汽车、人类等移动物体，实时计数物体，将图像拼接在一起产生高分辨率图像，从图像数据库中找到类似的图像，从使用闪光灯拍摄的图像中去除红眼，提高图像质量，跟踪眼球运动，跟踪人脸等

它拥有大约4.7万活跃用户社区，估计下载量超过1800万次。许多大公司，如谷歌，亚马逊，特斯拉，微软，本田等使用OpenCV，使他们的产品更好，更智能。

先决条件

在开始编写代码之前，我们需要在我们的设备上安装 OpenCV 。如果你是专业的编程人员并且知道每一个 IDE，那么去 Pycharm 并且在设置中从它的包管理器中安装 OpenCV-python。

如果您是初学者或中级程序员，或者只是想关注该博客，那么我们将使用代码编辑器而不是IDE。只需转到Visual Studio Code网站并根据您的操作系统下载最新版本即可。现在，我们将创建一个虚拟环境，在其中将安装 OpenCV。打开终端，然后使用cd定位到桌面。使用名为opencv的mkdir创建一个文件夹然后在以下命令中运行。

python -m venv env

现在使用 env\scripts\activate 命令激活环境，你会看到在 C:\Users\username\Desktop\opencv 前出现一个带小括号的 (env)。现在只需使用 pip 安装 OpenCV。

pip install opencv-python

我们将在这个博客中涵盖7个主题：

读、写和展示一个图像
读取视频与集成网络摄像头
缩放和裁剪图像
使用函数的基本图像滤波器
绘制不同的形状
在图像上写文字
检测和裁剪人脸

读、写和展示一个图像

为了使用 OpenCV 读取图像，我们使用函数 imread() ，为了显示图像，我们使用函数 imshow() ，为了写入图像，我们使用函数 imwrite()。让我们看看每一个的语法。

imread()：

img = cv2.imread("PATH_TO_IMAGE.jpg/png")
Example
img = imread("images/dog0.jpg")

imshow()：

cv2.imshow("WINDOW NAME",IMG_VAR)
Example
imshow("Dog Image",img)

imwrite():

cv2.imwrite(FILENAME, IMAGE)
filename: A string representing the file name. The filename must include image format like .jpg, .png, etc.
image: It is the image that is to be saved.
Example
cv2.imwrite('images/img',img)

读取视频与集成网络摄像头

读取视频文件与读取 OpenCV 中的图像文件非常相似。不同之处在于我们使用 cv2.videocapture()

语法

video = cv2.VideoCapture("FILEPATH.mp4")
Example
video = cv2.VideoCapture("video/dog/dog.mp4")

视频是许多帧图像在一起的集合，每一帧都是一个图像。要使用 OpenCV 观看视频，我们只需要使用 while 循环显示视频的每一帧。

while True:
   success , img = cap.read()
   cv2.imshow("Video",img)
   if cv2.waitKey(1) & 0xff==ord('q'):##key 'q' will break the loop
       break

为了与网络摄像头集成，我们需要传递网络摄像头的端口值，而不是路径到视频。如果你使用的是笔记本电脑，没有连接任何外部摄像头，那么简单地传递0，如果你连接了任何外部摄像头，那么传递一个摄像头端口值。

cap = cv2.VideoCapture(0)
cap.set(3,640)  ## Frame width
cap.set(4,480)  ## Frame Height
cap.set(10,100) ## Brightness
while True:
   success, img = cap.read()
   cv2.imshow("Video",img)
   if cv2.waitKey(1) & 0xff == ord('q'):
        break

缩放和裁剪图像

缩放是一个改变图像形状的过程。在 Opencv，我们可以使用 resize 函数来调整图像的形状。

语法

cv2.resize(IMG,(WIDTH,HEIGHT))
IMG: image which we want to resize
WIDTH: new width of the resize image
HEIGHT: new height of the resize image
Example
cv2.resize(img,(224,224))

要调整图像的大小，我们首先需要知道图像的形状。我们可以利用 shape 找到图像的形状，然后根据当前图像的形状，我们可以增大或减小图像的大小。让我们举个例子来看看。

import cv2
img = cv2.imread("images/img0.jpg") ##Choose any image
print(img.shape)
imgResize = cv2.resize(img,(224,224)) ##Decrease size
imgResize2 = cv2.resize(img,(1024,1024)) ##Increase size
cv2.imshow("Image",img)
cv2.imshow("Image Resize",imgResize)
cv2.imshow("Image Increase size",imgResize2)
print(imgResize.shape)
cv2.waitKey(0)

如果您不想把图像宽度和高度写死，您也可以根据现有的形状，然后根据比例改变图像的宽度和高度。

import cv2
img = cv2.imread("images/img0.jpg") ##Choose any image
print(img.shape)
shape = img.shape
imgResize = cv2.resize(img,(shape[0]//2,shape[1]//2))##Decrease size
imgResize2 = cv2.resize(img,(shape[0]*2,shape[1]*2)) ##Increase size
cv2.imshow("Image",img)
cv2.imshow("Image Resize",imgResize)
cv2.imshow("Image Increase size",imgResize2)
print(imgResize.shape)
cv2.waitKey(0)

裁剪图像

裁剪是获取部分图像的过程。在 OpenCV 中，我们可以通过定义裁剪后的矩形坐标来执行裁剪。

语法

imgCropped = img[y1:y2, x1:x2](x1,y1): top-left vertex
(x2,y2): bottom-right vertex
Example
imgCropped = img[0:100,200:200]

使用裁剪方法，让我们尝试从图像中提取 Monalisa 的脸。

import cv2
img = cv2.imread("images/img0.jpg")
imgCropped = img[50:250,120:330]
cv2.imshow("Image cropped",imgCropped)
cv2.imshow("Image",img)
cv2.waitKey(0)

您还可以使用绘画模式来查找(x1，y1)、(x2，y2)的正确坐标。

这里有个小任务：

任务：右键单击图像并保存它; 尝试从图像中获取国王卡。

提示：使用绘画模式找到正确的坐标，最后，使用调整大小，以增加裁剪图像的大小。

使用函数的基本图像滤波器

我们可以在图像上使用许多基本的滤波器，比如将图片转换成灰度、模糊等等。

从 Img 到 gray

为了将图像从彩色图像转换为灰度图像，我们可以使用函数 cv2.cvtColor，在这里我们传递 cv2.COLOR_BGR2GRAY 作为参数。

语法

imgGray = cv2.cvtColor(IMG,cv2.CODE)
IMG: Original image
CODE: Conversion code for Gray(COLOR_BGR2GRAY)
Example
imgGray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)

从 Img 到 HSV

为了将图像转换为 HSV 颜色空间，我们可以使用函数 cv2.cvtColor，这里我们传递 cv2.COLOR_BGR2HSV 作为参数。它主要用于目标跟踪。

语法

imgGray = cv2.cvtColor(IMG,cv2.CODE)
IMG: Original image
CODE: Conversion code for Gray(COLOR_BGR2HSV)
Example
imgHsv = cv2.cvtColor(img,cv2.COLOR_BGR2HSV)

模糊图像

模糊用于去除图像中的噪声，也称为平滑。它是对图像应用低通滤波器的过程。在 OpenCV 中对图像进行模糊，我们常用 GaussianBlur。

语法

imgBlur = cv2.GaussianBlur(img,(sigmaX,sigmaY),kernalSize)
kernalsize − A Size object representing the size of the kernel.
sigmaX − A variable representing the Gaussian kernel standard deviation in X direction.
sigmaY - same as sigmaX
Exmaple
imgBlur = cv2.GaussianBlur(img,(3,3),0)

边缘检测

在 OpenCV 中，我们使用 Canny算子来检测图像中的边缘。也有不同的边缘检测器，但最著名的是 Canny算子。Canny算子边缘检测是一种边缘检测算子，它使用多级算法来检测图像中的大范围边缘，是由 John F. Canny 在1986年提出的。

语法

imgCanny = cv2.Canny(img,threshold1,threshold2)
threshold1,threshold2:Different values of threshold different for every images
Example
imgCanny = cv2.Canny(img,100,150)

膨胀

膨胀被用来增加图像中边缘的大小。首先，我们定义了奇数(5,5)的核矩阵大小。然后使用内核，我们对图像执行膨胀。下面我们对 Canny 算子的输出图像进行了膨胀。

语法

kernel = np.ones((5,5),np.uint8) ## DEFINING KERNEL OF 5x5
imgDialation = cv2.dilate(imgCanny,kernel,iterations=1) ##DIALATION

腐蚀

侵蚀与膨胀正好相反。该算法用于减小图像中边缘的大小。首先，我们定义了奇数(5,5)的核矩阵大小。然后使用内核，我们对图像执行腐蚀。下面我们对 Canny 算子的输出图像进行腐蚀处理。

kernel = np.ones((5,5),np.uint8) ## DEFINING KERNEL OF 5x5
imgDialation = cv2.erode(imgCanny,kernel,iterations=1) ##EROSION

现在，在同一个程序中使用上述基本函数处理 Monalisa 图像。

绘制不同的形状

我们可以使用 OpenCV 绘制不同的形状，像矩形，圆形，线等。

长方形：

要在图像上绘制一个矩形，我们使用 cv2.rectangle 函数。在函数中，我们将宽度、高度、 x、 y、 RGB 中的颜色、深度作为参数传递。

语法

cv2.rectangle(img,(w,h),(x,y),(R,G,B),THICKNESS)
w: width
h: height
x: distance from x axis
y: distance from y axis
R,G,B: color in RGB form (255,255,0)
THICKNESS: thickness of rectangel(integer)Example
cv2.rectangle(img,(100,300),(200,300),(255,0,255),2)

圆形：

为了绘制一个圆形，我们使用 cv2.circle 函数。我们传递 x，y，半径大小，RGB 颜色，深度作为参数。

语法

cv2.circle(img,(x,y),radius,(R,G,B),THICKNESS)
x: distance from x axis
y: distance from y axis
radius: size of radius(integer)
R,G,B: color in RGB form (255,255,0)
THICKNESS: thickness of rectangel(integer)Example
cv2.circle(img,(200,130),90,(255,255,0),2)

直线：

要绘制一条直线，我们使用 cv2.line 函数传递起始点(x1，y1)、终点(x2，y2)、 RGB 格式的颜色、深度作为参数。

语法

cv2.line(img,(x1,y1),(x2,y2),(R,G,B),THICKNESS)x1,y1: start point of line (integer)
x2,y2: end point of line (integer)
R,G,B: color in RGB form (255,255,0)
THICKNESS: thickness of rectangel(integer)Example
cv2.line(img,(110,260),(300,260),(0,255,0),3)

在图像上写文字

在 OpenCV 中，我们有一个函数 cv2.puttext，用于在特定位置在图像上写入文本。它以图像、文本、 x、 y、颜色、字体、字号、粗细作为输入参数。

语法

cv2.putText(img,text,(x,y),FONT,FONT_SCALE,(R,G,B),THICKNESS)
img: image to put text on
text: text to put on image
X: text distance from X axis
Y: text distance from Y axis
FONT: Type of FONT (ALL FONT TYPES)
FONT_SCALE: Scale of Font(Integer)
R,G,B: color in RGB form (255,255,0)
THICKNESS: thickness of rectangel(integer)Example
cv2.putText(img,"HELLO",(120,250),cv2.FONT_HERSHEY_COMPLEX,1,(255,255,255),2)

检测和裁剪人脸

人脸检测在人脸识别系统中非常有用。在 OpenCV 中，我们有许多预先训练的 haar 级联分类器可用于不同的任务。以下网址可以查看 OpenCV GitHub 上的分类器列表：https://github.com/opencv/opencv/tree/master/data/haarca

scades。

我们使用 haarcascade_frontalface_default.xml 分类器来检测图像中的人脸。它将返回图像的四个坐标(w，h，x，y)。使用这些坐标，我们要在脸上画一个矩形，然后使用相同的坐标，继续裁剪人脸。最后使用 imwrite，把裁剪后的图像保存到目录中。

import cv2
# Load the cascade
face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')# Read the input image
img = cv2.imread('images/img0.jpg')# Convert into grayscale
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)# Detect faces
faces = face_cascade.detectMultiScale(gray, 1.3, 4)# Draw rectangle around the faces
for (x, y, w, h) in faces:
    cv2.rectangle(img, (x, y), (x+w, y+h), (255, 0, 0), 2)
    # Cropping Face
    crop_face = img[y:y + h, x:x + w]
    #Saving Cropped Face
    cv2.imwrite(str(w) + str(h) + '_faces.jpg', crop_face)
cv2.imshow('img', img)
cv2.imshow("imgcropped",crop_face)
cv2.waitKey()

OpenCV常用的 7 个示例：从读取到人脸检测（Python版）

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件