想尝试搭建图像识别系统?这里有一份TensorFlow速成教程

简介:
本文来自AI新媒体量子位(QbitAI)

640?wx_fmt=png&wxfrom=5&wx_lazy=10?wx_fmt=gif&wxfrom=5&wx_lazy=1

从我们见到的各种图像识别软件来看,机器似乎能认出人脸、猫、狗、花草、各种汽车等等日常生活中出现的物体,但实际上,这有一个前提:你要用这些类别的图像,对它进行过训练。

确切地说,该叫它“图像分类”。

建立一个图像分类器并不复杂,技术博客Source Dexter上最近发表的一篇文章,介绍了该如何快速用TensorFlow实现图像分类。

以下是量子位节选自这篇文章的内容:

在进入正题之前,我们先讲一些基本概念。

图像分类是怎样实现的?

向一个训练过的系统输入图像,我们会得到一组概率值:每个训练过的类别都有一个,然后,系统会将图像归到概率最高的类。

比如说你训练了一个系统,来识别猫和狗。当你输入一张图像时,系统会输出这张图像属于猫的概率和属于狗的概率。

不过,这种分类器也有一个缺陷:如果你输入一张蛇的图片,它也只能判断这张图片包含猫的概率高,还是包含狗的概率高一点。

神经网络和深度神经网络

概括地说,神经网络是计算单元的连接,能够从提供给它的一组数据中进行学习。

把多层神经网络堆叠在一起,我们就得到了深度神经网络。建立、训练和运行深度神经网络的过程,称为深度学习。

量子位之前发布的文章详细介绍了包括神经网络在内的《25个深度学习基础概念》,可以点击查看。

TensorFlow

TensorFlow是一个数学库,也是深度学习领域使用最广的开源框架,由Google开发。

在这篇文章中,我们将用TensorFlow预训练模型来设置我们的分类器。

想要设置这个分类器,还有几个先决条件:

  • 你的机器上安装并设置好了TensorFlow;
  • 你会用Python。

从零开始训练一个深度学习的分类器需要几周、甚至几个月的时间,这取决于你用什么硬件。为了避免这种麻烦,我们将使用预先训练的模型。 Tensorflow预训练的模型通常能够识别大约1000类不同的物体。

接下来,我们开始设置自己的图像分类器:

第1步:下载预训练模型、计算图和脚本

clone这个存储区,并用以下命令进入:

git clone https://github.com/akshaypai/tfClassifier

cd tfClassifier

第2步:运行脚本找到最佳预测

你可以提供要分类的图像,来运行这个脚本。默认情况下,将显示概率最高的结果。

Python classifier.py --image_file file_path_to_image

如果想获得前几个分类结果,可以使用以下参数。

Python classifier.py --image_file file_path_to_image --num_top_predictions number_of_top_results

示例:以下是我们输入石榴图像,获得的结果。

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

python classifier.py --image_file ~/Pictures/fruit.jpg

pomegranate (score = 0.98216)

分类器说,这个图像是石榴,可能性是98%。

第3步:运行脚本来获取前n个识别出的类

现在让我们尝试给出一个具有更多属性的图像,如下面的房子的形象:

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

python classifier.py --image_file ~/Pictures/house.jpg --num_top_predictions 5picket fence, paling (score = 0.95750)


worm fence, snake fence, snake-rail fence, Virginia fence (score = 0.03615)

beacon, lighthouse, beacon light, pharos (score = 0.00018)

boathouse (score = 0.00013)

patio, terrace (score = 0.00007)

从上面的结果可以看出,分类器认为这张图片中包含栅栏的可能性是95%,还有可能包含另一个栅栏、庭院/露台等。

用TensorFlow预训练的模型对图像进行分类,就是这么简单。不过,预训练模型能识别的类是有限的,如果你希望分类器来区分你需要的类别,需要重新训练这个模型。

下面,我们再介绍一下如何对模型进行重新训练。

第1步:设置图像文件夹

这一步涉及设置文件夹结构,好让TensorFlow能轻松获取这些类别。比如说你想训练神经网络,识别5种花:玫瑰、郁金香、蒲公英、可可花、万寿菊。

创建文件夹结构时:

为每种花创建一个文件夹,该文件夹的名称是类别的名称(在我们举的例子中,是这种花的名称);

将花的图像添加到其各自的文件夹中。例如把玫瑰的所有图像放进“玫瑰”文件夹。

将所有文件夹添加到另一个父文件夹中,比如说“花”。

添加完之后,你将看到这样的文件夹结构:

~/flowers

~/flowers/roses/img1.jpg

~/flowers/roses/img2.jpg

...

~/flowers/tulips/tulips_img1.jpg

~/flowers/tulips/tulips_img2.jpg

~/flowers/tulips/tulips_img3.jpg

...

所有文件夹都这样设置,文件夹结构就准备好了。

第2步:运行重新训练脚本

用下面的命令来运行脚本:

python retrain.py --model_dir ./inception --image_dir ~/flowers --output_graph ./output --how_many_training_steps 500

命令行参数:

-model_dir:该参数给出了预训练模型的位置。预先训练的模型存储在git存储库的inception文件夹下。

-image_dir:在上一步中创建的图像文件夹的路径。

-output_graph:存储新训练图的位置。

-how_many_training_steps:training steps表示要执行的迭代次数,默认是4000。找到正确的次数需要经过不断试错,一旦找到最好设置,就可以开始用了。

下列参数可以用来提高模型的准确度:

random_crop:随机裁剪能够让你专注于图像的主要部分。

Random_scale:和裁剪类似,但可以随机扩展图像大小。

flip_left_right:翻转。

以上,就是重新训练深度学习模型所需的步骤,这样就可以识别自定义的物体了。

【完】

本文作者:李林 
原文发布时间:2017-05-30 
相关实践学习
基于函数计算实现AI推理
本场景基于函数计算建立一个TensorFlow Serverless AI推理平台。
相关文章
|
24天前
|
机器学习/深度学习 传感器 自动驾驶
基于深度学习的图像识别技术在自动驾驶系统中的应用
【2月更文挑战第29天】 随着人工智能技术的飞速发展,深度学习作为其核心分支之一,在图像识别领域取得了显著成就。本文聚焦于探讨深度学习技术在自动驾驶系统中的应用,重点分析了卷积神经网络(CNN)在车辆环境感知中的关键作用。文章首先概述了深度学习的基础理论和关键技术,随后详细阐述了CNN如何通过多层次特征提取实现精确的图像分析,以及这些技术如何帮助自动驾驶系统实时理解复杂道路情况。最后,文章讨论了当前技术面临的挑战与未来的发展方向,为相关领域的研究提供参考。
|
21天前
|
机器学习/深度学习 数据采集 监控
基于深度学习的图像识别技术在智能监控系统中的应用
随着人工智能技术的飞速发展,深度学习作为其核心分支之一,在图像处理和分析领域取得了显著成就。本文将探讨一种基于深度学习的图像识别技术,并分析其在智能监控系统中的应用。该技术通过构建复杂的神经网络模型,实现了对监控视频中异常行为的准确识别与实时反应。实验结果表明,与传统算法相比,该方法在准确率和处理速度上都有明显提升,有效增强了监控系统的智能化水平。
15 3
|
3月前
|
机器学习/深度学习 算法 算法框架/工具
深度学习实战:基于TensorFlow与OpenCV的手语识别系统
深度学习实战:基于TensorFlow与OpenCV的手语识别系统
131 0
|
22天前
|
机器学习/深度学习 传感器 自动驾驶
基于深度学习的图像识别技术在自动驾驶系统中的应用
【2月更文挑战第31天】 随着人工智能技术的飞速发展,深度学习已成为推动自动驾驶系统革新的核心动力之一。特别是在图像识别领域,深度学习模型已经显示出了卓越的性能和广阔的应用前景。本文旨在探讨基于深度学习的图像识别技术如何被集成进自动驾驶系统中,以及这一集成对提高系统准确性、可靠性的影响。我们将详细分析卷积神经网络(CNN)等先进深度学习架构在处理车载摄像头捕获的复杂交通场景中的作用,并讨论数据增强、迁移学习等策略在提升模型泛化能力方面的重要性。此外,我们还将评估这些技术在真实世界条件下的性能及其面临的挑战。
|
4天前
|
机器学习/深度学习 自动驾驶 算法
基于深度学习的图像识别技术在自动驾驶系统中的应用
【4月更文挑战第9天】 随着人工智能技术的不断进步,深度学习已成为推动多个领域革新的核心动力。特别是在图像识别领域,通过模仿人类视觉系统的处理机制,深度学习模型已展现出超越传统算法的性能。本文将探讨深度学习在图像识别中的关键技术,并重点分析这些技术如何被应用于自动驾驶系统中以实现车辆环境的实时理解与决策。我们将从卷积神经网络(CNN)的基础结构出发,讨论其在特征提取、物体检测和分类中的作用,以及如何通过增强学习和迁移学习等策略来优化模型性能。此外,我们还将评估当前技术面临的挑战,如数据集偏差、实时处理需求以及模型泛化能力,并提出可能的解决方案。
|
6天前
|
机器学习/深度学习 自动驾驶 安全
基于深度学习的图像识别技术在自动驾驶系统中的应用
【4月更文挑战第7天】 随着人工智能技术的飞速发展,尤其是深度学习在图像处理领域的突破性进展,自动驾驶系统得到了前所未有的推动。本文旨在探讨如何将基于深度学习的图像识别技术有效集成到自动驾驶系统中,以提高其准确性和可靠性。文章首先介绍了深度学习的基本概念及其在图像识别中的关键作用,随后详细分析了自动驾驶系统对图像识别技术的具体需求,接着提出了一种改进的卷积神经网络模型,并通过实验验证了该模型在复杂环境下的性能表现。最后,本文还讨论了在实际部署过程中可能遇到的挑战及潜在的解决方案。
12 0
|
9天前
|
机器学习/深度学习 传感器 数据采集
基于深度学习的图像识别技术在自动驾驶系统中的应用
【4月更文挑战第4天】随着人工智能技术的飞速发展,深度学习已经成为计算机视觉领域的核心推动力。尤其是在图像识别任务中,深度神经网络表现出了超越传统算法的性能。本文将探讨深度学习模型在自动驾驶汽车图像识别系统中的应用,重点分析卷积神经网络(CNN)的结构、训练过程以及优化策略,并讨论其在处理实时交通场景中的效率和准确性。此外,文章还将涉及数据增强、迁移学习等先进技术如何进一步提升模型的泛化能力和鲁棒性。
|
21天前
|
机器学习/深度学习 自动驾驶 安全
基于深度学习的图像识别在自动驾驶系统中的应用
随着人工智能技术的飞速发展,深度学习作为其核心分支之一,在图像识别领域取得了突破性进展。本文旨在探讨基于深度学习的图像识别技术在自动驾驶系统中的应用及其优化策略。首先,简述了深度学习在图像处理中的基础原理和关键技术;随后,分析了自动驾驶系统中图像识别的重要性及面临的挑战;最后,提出了几种提升图像识别效率和准确性的方法,并讨论了它们在实际系统中的应用情况。通过实验数据验证,这些方法显著提高了自动驾驶系统的安全性能和可靠性。
|
21天前
|
机器学习/深度学习 数据采集 自动驾驶
利用深度学习优化图像识别在自动驾驶系统中的应用
在自动驾驶技术迅猛发展的当下,图像识别作为其核心技术之一,对于提升车辆的环境感知能力至关重要。本文聚焦于探讨如何通过深度学习算法优化图像识别过程,以增强自动驾驶系统的准确性和实时反应能力。文中介绍了卷积神经网络(CNN)在图像处理中的关键作用,分析了数据预处理、模型训练策略以及模型压缩等技术对性能的影响。此外,还探讨了迁移学习在缺乏标注数据时的应用,以及对抗性网络在提高模型鲁棒性方面的潜力。通过实验评估,本文展示了这些技术在真实世界数据集上的应用效果,并对未来自动驾驶系统中图像识别技术的发展趋势进行了展望。
22 1
|
23天前
|
机器学习/深度学习 自动驾驶 算法
基于深度学习的图像识别技术在自动驾驶系统中的应用
【2月更文挑战第30天】 随着人工智能技术的飞速发展,深度学习在图像识别领域取得了突破性进展。特别是在自动驾驶系统中,精确的图像识别是实现智能化、自动化的关键。本文将探讨深度学习技术如何提升自动驾驶车辆的图像识别能力,以及这一技术在实际运用中所面临的挑战与解决方案。通过分析当前最先进的卷积神经网络(CNN)模型,我们展示了其在复杂环境下对行人、障碍物和交通标志等的高效识别能力,并讨论了数据增强、迁移学习等优化策略在提高模型泛化能力方面的作用。