OpenCV+深度学习预训练模型，简单搞定图像识别 | 教程

2018-01-08 10384

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

视觉智能开放平台，图像通用资源包5000点

视觉智能开放平台，分割抠图1万点

视觉智能开放平台，视频资源包5000点

简介：

本文来自AI新媒体量子位（QbitAI）

1b08f0283d953f27050da12a9c91f7641fd1c7ac

OpenCV是一个2000年发布的开源计算机视觉库，有进行物体识别、图像分割、人脸识别、动作识别等多种功能，可以在Linux、Windows、Android、Mac OS等操作系统上运行，以轻量级、高效著称，且提供多种语言接口。

而OpenCV最近一次版本更新，为我们带来了更好的深度学习支持，在OpenCV中使用预训练的深度学习模型变得非常容易。

pyimagesearch网站今天发布了一份用OpenCV+深度学习预训练模型做图像识别的教程，量子位编译整理如下：

最近，OpenCV 3.3刚刚正式发布，对深度学习（dnn模块）提供了更好的支持，dnn模块目前支持Caffe、TensorFlow、Torch、PyTorch等深度学习框架。

另外，新版本中使用预训练深度学习模型的API同时兼容C++和Python，让系列操作变得非常简便：

从硬盘加载模型；
对输入图像进行预处理；
将图像输入网络，获取输出的分类。

当然，我们不能、也不该用OpenCV训练深度学习模型，但这个新版本让我们能把用深度学习框架训练好了的模型拿来，高效地用在OpenCV之中。

这篇文章就展示了如何用ImageNet上预训练的深度学习模型来识别图像。

OpenCV 3.3中的深度学习

自OpenCV 3.1版以来，dnn模块一直是opencv_contrib库的一部分，在3.3版中，它被提到了主仓库中。

用OpenCV 3.3，可以很好地利用深度学习预训练模型，将它们作为分类器。

新版OpenCV兼容以下热门网络架构：

AlexNet
GoogLeNet v1（也叫Inception-5h）
ResNet-34/50/…
SqueezeNet v1.1
VGG-based FCN
ENet
VGG-based SSD
MobileNet-based SSD

该模块的主要贡献者Rynikov Alexander，对这个模块有远大的计划，不过，他写的release notes是俄语的，感兴趣的同学请自行谷歌翻译着读：https://habrahabr.ru/company/intel/blog/333612/

我认为，dnn模块会对OpenCV社区产生很大的影响。

函数和框架

在OpenCV中使用深度学习预训练模型，首先要安装OpenCV 3.3，安装过程量子位就不再详细描述了……

下面是我们将用到的一些函数。

在dnn中从磁盘加载图片：

cv2.dnn.blobFromImage
 cv2.dnn.blobFromImages

用“create”方法直接从各种框架中导出模型：

cv2.dnn.createCaffeImporter
cv2.dnn.createTensorFlowImporter
cv2.dnn.createTorchImporter

使用“读取”方法从磁盘直接加载序列化模型：

cv2.dnn.readNetFromCaffe
cv2.dnn.readNetFromTensorFlow
cv2.dnn.readNetFromTorch
cv2.dnn.readhTorchBlob

从磁盘加载完模型之后，可以用.forward方法来向前传播我们的图像，获取分类结果。

用OpenCV和深度学习给图像分类

接下来，我们来学习如何用Python、OpenCV和一个预训练过的Caffe模型来进行图像识别。

下文用到的深度学习模型是在ImageNet上预训练过的GoogleLeNet。GoogleLeNet出自Szegedy等人2014年的论文Going Deeper with Convolutions，详情见：https://arxiv.org/abs/1409.4842

首先，打开一个新文件，将其命名为deep_learning_with_opencv.py，插入如下代码，来导入我们需要的包：

63966a84c9469701715cc07243a1fb1e97cd7e54

然后拆解命令行参数：

5320ffb9854096fde703c93e39896fc966e80aa4

其中第8行ap = argparse.ArgumentParser()是用来创建参数解析器的，接下来的代码用来创建4个命令行参数：

—image：输入图像的路径；
—prototxt：Caffe部署prototxt的路径
—model：预训练的Caffe模型，例如网络权重等；
—labels：ImageNet标签的路径，例如syn-sets。

我们在创建参数之后，将它们解析并存在一个变量args中，供稍后使用。

接下来，加载输入图像和标签：

5f13b6004c89c9b2d11ab87edfd89ab4a37d5d94

第20行从磁盘加载了图像，第23行和24行加载了这些标签：

64b78abe812d2c80c1d5c45ce1e7a4e561a0d900

搞定了标签之后，我们来看一下dnn模块：

063d7b0e03be65ac2a1e6b64e3fc12d4ec4f6319

注意上面代码中的注释，我们使用cv2.dnn.blobFromImage执行mean subtraction来对输入图像进行归一化，从而产生一个已知的blob形状。

然后从磁盘加载我们的模型：

2270e3622cb910fc8d50d342c349458056cba453

我们用cv2.dnn.readNetFromCaffe来加载Caffe模型定义prototxt，以及预训练模型。

接下来，我们以blob为输入，在神经网络中完成一次正向传播：

a7566d32f3b47c5d7014b99c77e65a94fc01f822

请注意：我们不是在训练CNN，而是在使用预训练模型，因此只需要将blob从网络中传递过去，来获取结果，不需要反向传播。

最后，我们来为输入图像取出5个排名最高的预测结果：

21ca367f040e9b10021729dd3ed5a2691b848008

我们可以用NumPy来选取排名前5的结果，然后将他们显示出来：

15c00dd20ab09621f327d218957711b91431a531

分类结果

我们已经在OpenCV中用Python代码实现了深度学习图像识别，现在，可以拿一些图片来试一试。

打开你的终端，执行以下命令：

6c258506f17b27d1c372128130a809a04e306b08

就会得到这样的结果：

80d5e7bb73784a8a5b391abaee0681d57478746c

OpenCV和GoogleLeNet正确地认出了比格小猎犬，排名第一的结果是正确的，之后的4项结果相关度也很高。

在CPU上运行这个算法，得到结果也只需要不到一秒钟。

再来一张：

0703003ebdfac625899c05496911290392fc8aec

结果如下：

5bd135aea6821292c8d3a9afaec9732e343433c1

再来：

ad26c007863f5ea4f3cc8126c5df92592205b6f4

结果依然不错：

73ebcfef2fba5df28ef5ab203262ab5ea3bba6c1

最后一个例子：

f76b038a158010f94659d850c7e36363d2330b53

也认得不错：

776918e9e0183bf5366e6487656df0dbaabc3f08

OpenCV+深度学习预训练模型，简单搞定图像识别 | 教程

OpenCV 3.3中的深度学习

函数和框架

用OpenCV和深度学习给图像分类

分类结果

相关链接

图像理解

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

OpenCV+深度学习预训练模型，简单搞定图像识别 | 教程

OpenCV 3.3中的深度学习

函数和框架

用OpenCV和深度学习给图像分类

分类结果

相关链接

图像理解

热门文章

最新文章

相关课程

相关电子书

相关实验场景