手把手教你用PyTorch实现图像分类器(第一部分)

简介: 通过3篇短文,介绍如何实现图像分类器的概念基础——这是一种能够理解图像内容的算法。
TB1m.4sO9zqK1RjSZFpXXakSXXa.jpg

本文为 AI 研习社编译的技术博客,原标题 :

Implementing an Image Classifier with PyTorch: Part 1

作者 | Jose Nieto

翻译 | 酱番梨、Succi         

校对 | 酱番梨        审核 | 酱番梨       整理 | 立鱼王

原文链接:

https://medium.com/udacity/implementing-an-image-classifier-with-pytorch-part-1-cf5444b8e9c9

TB1qq4NO5LaK1RjSZFxXXamPFXa.jpg

经过几个月富有挑战性但是受益良多的学习,我最近从Udacity的Python Nanodegree program AI编程专业毕业。最后一个项目是用PyTorch创建一个102种不同类型的花的图像分类器。

在做这个final project的时候,很多同学都遇到了类似的问题和挑战。当我接近完成的时候,我决定与大家分享一些在未来对他人有益的建议和见解。

通过3篇短文,介绍如何实现图像分类器的概念基础——这是一种能够理解图像内容的算法。

本文的目标不是提供手把手的指导,而是帮助理解整个过程。如果你正在考虑学习机器学习或人工智能,你将不得不做类似的项目,并理解本系列文章中介绍的概念。

文章主要进行概念上的解释,不需要知道如何编写代码。此外,下面所包含的PyTorch细节是次要的,主要以PyTorch作为示例。

这个过程的第一步是加载一个pre-trained神经网络。在讨论这一步时,我将解释为什么要“reuse”网络(即使用“pre-trained”网络),阐明哪些部分可以重用,哪些部分不能重用,并提供如何根据需要定制pre-trained网络的指导。

   加载预训练的网络

reuse是一种十分合理的策略,尤其是众所周知并且得到广泛认可的标准。在示例中,出发点是torchvision提供的一种模型结构。

本文的目标是加载其中的一个pre-trained网络,并且将其中的分类器替换为自己的分类器,从而可以训练自己的分类器。

虽然这个想法是合理的,但我发现它也会产生一些问题,因为加载一个预先训练的网络并不能节省训练分类器的时间。

“所以你可能会想,使用预训练网络有什么意义?”

当我们人类看到图像时,可以识别线条和形状。正因为如此,我们才能将图像内容与之前看到过的内容联系起来。我们希望我们的分类器能够做一些类似的事情,但是图像不是一段微不足道的数据。图像通常由数千个独立的像素组成,每个像素都有一种颜色,这种颜色由三个不同的值组合定义 : Red,Green, Blue。

TB18DhtOZbpK1RjSZFyXXX_qFXa.jpg

从左到右:原始,红色,绿色,蓝色 

如果我们希望我们的分类器能够处理该数据量,我们将需要处理每个图像中包含的所有信息,并以其可以理解的格式将其提供给分类器。这就是预训练网络发挥作用的地方。  

这些预先训练的网络主要由一组特征检测器和分类器组成,其中特征检测器被训练以从每个图像中提取信息,并且训练分类器以理解特征层提供的输入。

我们已经在已在ImageNet上培训过功能检测器,并且证明它可以有很好的表现。因此,我们希望保持原样。为了防止在我们训练分类器时,要素图层被修改,我们需要“冻结”它们。这个小代码片段可以帮助解决这个问题:  

TB1KStSO4naK1RjSZFtXXbC2VXa.png

如果使用分类器会怎么样? 为什么我们不能重复使用它?   要回答这个问题,让我们以架构VGG16为例,来看看它的默认分类器:  

TB13ztPO4naK1RjSZFBXXcW7VXa.png

首先,我们无法保证这一定是有效的。并且令人怀疑的是,这些默认层和元素,激活函数和丢失值对于我们的特定情况而言恰好是最佳的。  

当我们看到它的最后一层有1000个元素的输出时,情况就变得很明显了。在我们的例子中,我们处理102种不同类型的花,因此我们的分类器的输出必须是102 。

从上面VGG16中的默认分类器,我们还可以注意到它的输入层有25088个元素,因为这是此特定预训练模型中特征检测器的输出大小。我们的分类器的输入大小也必须与要素图层的输出相匹配。 

   结论

由上文我们可以得知,预先训练好的网络非常有益,因为它们使我们能够专注于我们的用例细节,同时重复使用众所周知的泛型来进行示例中的图像预处理。

我们还了解到,分类器输出的大小必须与我们希望能够识别的不同类型的数量相同。

最后,我们已经看到要素图层的输出和自定义分类器的输入也必须匹配大小。

在我的下一篇文章中,我们将探讨如何避免在分类器训练过程中常见的陷阱,并学习如何调整超参数以提高模块的准确性。

我的文章对你有用吗?期待你的评论!

想要继续查看该篇文章相关链接和参考文献?雷锋网雷锋网雷锋网(公众号:雷锋网)

点击【手把手教你用PyTorch实现图像分类器(第一部分)】即可访问:

https://ai.yanxishe.com/page/TextTranslation/1353

AI入门、大数据、机器学习免费教程

35本世界顶级原本教程限时开放,这类书单由知名数据科学网站 KDnuggets 的副主编,同时也是资深的数据科学家、深度学习技术爱好者的Matthew Mayo推荐,他在机器学习和数据科学领域具有丰富的科研和从业经验。

点击链接即可获取:https://ai.yanxishe.com/page/resourceDetail/417

目录
相关文章
|
7月前
|
机器学习/深度学习 PyTorch 算法框架/工具
Pytorch CIFAR10图像分类 Swin Transformer篇(一)
Pytorch CIFAR10图像分类 Swin Transformer篇(一)
|
7月前
|
机器学习/深度学习 数据可视化 算法
Pytorch CIFAR10图像分类 Swin Transformer篇(二)
Pytorch CIFAR10图像分类 Swin Transformer篇(二)
|
7月前
|
机器学习/深度学习 PyTorch 算法框架/工具
【PyTorch实战演练】使用Cifar10数据集训练LeNet5网络并实现图像分类(附代码)
【PyTorch实战演练】使用Cifar10数据集训练LeNet5网络并实现图像分类(附代码)
464 0
|
7月前
|
机器学习/深度学习 数据采集 PyTorch
PyTorch搭建卷积神经网络(ResNet-50网络)进行图像分类实战(附源码和数据集)
PyTorch搭建卷积神经网络(ResNet-50网络)进行图像分类实战(附源码和数据集)
282 1
|
7月前
|
机器学习/深度学习 数据可视化 PyTorch
Pytorch CIFAR10图像分类 ZFNet篇
Pytorch CIFAR10图像分类 ZFNet篇
|
机器学习/深度学习 数据采集 PyTorch
PyTorch应用实战二:实现卷积神经网络进行图像分类
PyTorch应用实战二:实现卷积神经网络进行图像分类
244 0
|
机器学习/深度学习 人工智能 PyTorch
【图像分类】基于OpenVINO实现PyTorch ResNet50图像分类
【图像分类】基于OpenVINO实现PyTorch ResNet50图像分类
316 0
|
机器学习/深度学习 人工智能 数据挖掘
【Deep Learning B图像分类实战】2023 Pytorch搭建AlexNet、VGG16、GoogleNet等共5个模型实现COIL20数据集图像20分类完整项目(项目已开源)
亮点:代码开源+结构清晰规范+准确率高+保姆级解析+易适配自己数据集+附原始论文+适合新手
390 0
|
机器学习/深度学习 PyTorch 算法框架/工具
计算机视觉PyTorch实现图像分类(二) - AlexNet
计算机视觉PyTorch实现图像分类(二) - AlexNet
175 0
|
机器学习/深度学习 数据采集 数据可视化
PyTorch深度学习实战 | 搭建卷积神经网络进行图像分类与图像风格迁移
PyTorch是当前主流深度学习框架之一,其设计追求最少的封装、最直观的设计,其简洁优美的特性使得PyTorch代码更易理解,对新手非常友好。 本文为实战篇,介绍搭建卷积神经网络进行图像分类与图像风格迁移。
487 0
PyTorch深度学习实战 | 搭建卷积神经网络进行图像分类与图像风格迁移