手把手教你学会深度学习框架 — PyTorch

简介: PyTorch是一个基于Python语言的深度学习框架,专门针对 GPU 加速的深度神经网络(DNN)的程序开发。基本上,它所有的程序都是用python写的,这就使得它的源码看上去比较简洁,在机器学习领域中有广泛的应用。

PyTorch是一个灵活的深度学习框架,它允许通过动态神经网络(即if条件语句和while循环语句那样利用动态控制流的网络)自动分化。它支持GPU加速、分布式训练、多种优化以及更多的、更简洁的特性。

神经网络是计算图形的一个子类。计算图形接收输入数据,并且数据被路由到那些可能由对数据进行处理的节点进行转换。在深度学习中,神经网络中的神经元通常用参数和可微函数进行数据变换,从而可以通过梯度下降来优化参数以最大程度的减少损失。更广泛来说,函数可以是随机的,并且图形的结构可以是动态的。因此,虽然神经网络可以很好地适合数据流开发,但是PyTorchAPI却围绕着命令行式的编程,这是一种更常见的考虑程序的方式。这使得读取复杂程序的代码和理由变得更容易,而不必浪费大量的性能;PyTorch实际上运行的速度相当快,并带有很多优化,你可以放心地忘记你是个最终用户。

该文件的其余部分是基于官方的MNIST示例,并且应该仅仅是在学习了官方初级教程之后再看。为了提高可读性,代码放在了带有注释的区块中,因此不会被分割成不同的函数或者是文件,因为通常要用于清晰的、模块化的代码。

66fa11a606ed15b859029f3aeb735f66d31fc244 

这些是非常标准的程序或者是包导入代码,特别是用于解决计算机视觉问题的视觉模块:

92099746c1d2b453281c795c0bf54ae80a547822 

argparse是一种处理在Python中命令行参数的标准方法。

它是一种编写与设备无关的代码的好方法(在可用时受益于GPU加速,但当不可用时则返回到CPU)是选择并保存适当的torch.device,它可以用来决定应该存储张量的位置。更多资料请参阅官方文档PyTorch方法是将设备放置在用户的控制之下,这对于简单的例子来说可能看起来是件讨厌的事情,但是它使得更容易计算出张量的位置是对调试有用还是使得手动使用设备变得高效。

对于可重复的实验,有必要为任何使用随机数生成的进行随机种子设置。注意,cuDNN使用非确定性算法,并且可以使用torch.backends.cudnn.enabled = False来进行禁用。

3bf0b4fb3836278e8c966ad628cfdcaa9f0cbcdf 

由于torchvision模型在~/.torch/models/下面进行保存的,我在~/.torch/datasets保存torchvision数据集。通常来说,如果结束重用几个数据集,那么将数据集与代码分离开来存放是非常值得的。torchvision.transforms包含很多给单个图片的方便转换的功能,如修剪和正常化。

DataLoader含有许多可选方案,但是在batch_sizeshuffle参数之外,num_workerspin_memory对于效率也是值得了解一下的。num_workers > 0使用了子进程来进行异步加载数据,而不是在这个过程中使用主进程块。pin_memory使用pinned RAM来加速RAM到GPU的传输。

19b42e745ac38dfaefa5fc1cdfa6154ac1cf3708 

网络初始化通常包括一些成员变量和可训练参数的层,以及可能分开的可训练参数和不可训练的缓冲器。前向传递之后,使用那些来自纯函数F的函数(不包含参数)的结合。有些人倾向具有完全功能的网络(例如,保持参数分离和使用F.conv2d,而不是nn.Conv2d)或者是那些完全分层的网络(例如,nn.ReLU,而不是F.relu)。

.to(device)是将设备参数(和缓冲器)发送到GPU的简便方法,如果设备被设置为GPU,则不做任何操作(当设备被设置为CPU)时。在将网络参数传递给优化器之前,将它们传递给合适的设备是非常重要的,否则优化器将不会正确跟踪参数。

神经网络(nn.Module)和优化器(optim.Optimizer)都具有保存和加载其内部状态的能力,并且.load_state_dict(state_dict)是推荐这么做的方法,你将需要重新加载这两个状态以恢复之前保存的状态字典的训练。保存整个对象可能会容易出错。

这里没有指出的一些要点是,正向传递可以使用控制流,例如,成员变量,或者甚至数据本身可以决定if语句的执行。在中间打印出张量也是非常有效的,这会使调试变得更加容易。最后,前向传递可以使用多个参数。用一个简短的代码片段来说明这一点:

b904fff87fc632ddc151fa919b788d58acd9d250 

默认情况下,网络模块设置为训练模式—这影响了一些模块的运行效果,最明显的是流失和批量标准化。无论如何,最好通过.train()来进行手动设置参数,它将训练标志继承到所有的子模块。

在用loss.backward()收集一组新的梯度并用optimiser.step()进行反向传播之前,有必要手动地集中那些用优化器.zero_grad()优化过了参数的梯度。默认情况下,PyTorch逐渐增加梯度,这是非常方便的,尤其是当你没有足够的资源来计算所有你一次性需要的梯度的时候。

PyTorch使用基于磁带的自动梯度系统—它按一定的顺序收集对张量进行的操作,然后对它们进行重放以进行逆向模式求导。这就是为什么它是超级灵活的原因,并且允许任意的计算图形。如果张量中没有一个需要梯度(当构造张量时,你必须设置requires_grad=True),则不存储任何图形!然而,网络往往趋向那些具有需要梯度的参数,所以从一个网络的输出所做的任何计算都将存储在图形中。因此,如果要想存储由此产生的数据,那么你需要手动禁用梯度,或者更常见地,将其存储为Python数字(通过使用PyTorch标量上的.item())或numpy数组。请在autograd上参阅官方文档以了解更多信息。

切割计算图形的一种方法是使用.detach(),当通过截断反向传播时间来训练RNNs时,可以使用这个方法来隐藏状态。当一个成分是另一个网络的输出时,它也很方便的区分一个损耗,但是这个网络不应该在损失方面被优化 — 例如在GAN训练中从生成器的输出中训练一个鉴别器,或者使用值函数作为基线(例如A2C)的算法训练一个演员评论算法的策略,另一种防止梯度计算的技术在GAN训练中是有效的(训练来自鉴别器的生成器),以及通常在微调中是通过网络参数并设置param.requires_grad = False进行循环。

除了在控制台或者在日志文件中的日志记录结果外,检查点模型参数(和优化器状态)是非常重要的,用于以防万一。你还可以使用torch.save()来保存普通的Python对象,但其它标准选择包括在内置的配置中。

b404d3d3c2c65eca79134535c9a7eb557236cd37 

其他:

CUDA调试错误,通常是逻辑问题,会在CPU上产生更明白易懂的错误消息。如果你正在计划使用GPU,最好的方式是能在CPU和GPU之间轻松地切换。一个更普遍的开发技巧是能够设置你的代码,以便在启动一个合适的工作任务之前快速运行所有的逻辑来检查代码—示例是准备一个小的、合成的数据集,运行一个训练、测试周期等等。如果是一个CUDA错误,或者你真的不能切换到CPU模式,那么设置CUDA_LAUNCH_BLOCKING=1将使CUDA内核同步启动,从而会提供更清楚明确的错误消息。

对于torch.multiprocessing的记录,甚至只是一次性运行多个PyTorch脚本。因为PyTorch使用多线程的BLAS库来加速CPU上的线性代数运算,因此它通常会使用多个内核。如果想同时使用多个处理进程或者多个脚本来运行多个程序,那么你可以手动地通过将环境变量OMP_NUM_THREADS设置为1或另一个小的数字参数来实现—这减少了CPU大幅震动的机会。官方文档中有特别用于多处理技术的注释。

数十款阿里云产品限时折扣中,赶紧点击领劵开始云上实践吧!

本文由北邮@爱可可-爱生活 老师推荐,阿里云云栖社区组织翻译。

文章原标题《PyTorch - The Hitchiker's Guide to PyTorch' by Kai Arulkumaran GitHub:》

作者: Alberto Artasanchez

译者:奥特曼,审校:袁虎。

文章为简译,更为详细的内容,请查看原文

相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
相关文章
|
4天前
|
机器学习/深度学习 存储 人工智能
MNN:阿里开源的轻量级深度学习推理框架,支持在移动端等多种终端上运行,兼容主流的模型格式
MNN 是阿里巴巴开源的轻量级深度学习推理框架,支持多种设备和主流模型格式,具备高性能和易用性,适用于移动端、服务器和嵌入式设备。
43 18
MNN:阿里开源的轻量级深度学习推理框架,支持在移动端等多种终端上运行,兼容主流的模型格式
|
2月前
|
机器学习/深度学习 监控 PyTorch
深度学习工程实践:PyTorch Lightning与Ignite框架的技术特性对比分析
在深度学习框架的选择上,PyTorch Lightning和Ignite代表了两种不同的技术路线。本文将从技术实现的角度,深入分析这两个框架在实际应用中的差异,为开发者提供客观的技术参考。
53 7
|
3月前
|
机器学习/深度学习 算法 PyTorch
深度学习笔记(十三):IOU、GIOU、DIOU、CIOU、EIOU、Focal EIOU、alpha IOU、SIOU、WIOU损失函数分析及Pytorch实现
这篇文章详细介绍了多种用于目标检测任务中的边界框回归损失函数,包括IOU、GIOU、DIOU、CIOU、EIOU、Focal EIOU、alpha IOU、SIOU和WIOU,并提供了它们的Pytorch实现代码。
409 1
深度学习笔记(十三):IOU、GIOU、DIOU、CIOU、EIOU、Focal EIOU、alpha IOU、SIOU、WIOU损失函数分析及Pytorch实现
|
2月前
|
机器学习/深度学习 自然语言处理 并行计算
DeepSpeed分布式训练框架深度学习指南
【11月更文挑战第6天】随着深度学习模型规模的日益增大,训练这些模型所需的计算资源和时间成本也随之增加。传统的单机训练方式已难以应对大规模模型的训练需求。
197 3
|
4月前
|
机器学习/深度学习 PyTorch 调度
在Pytorch中为不同层设置不同学习率来提升性能,优化深度学习模型
在深度学习中,学习率作为关键超参数对模型收敛速度和性能至关重要。传统方法采用统一学习率,但研究表明为不同层设置差异化学习率能显著提升性能。本文探讨了这一策略的理论基础及PyTorch实现方法,包括模型定义、参数分组、优化器配置及训练流程。通过示例展示了如何为ResNet18设置不同层的学习率,并介绍了渐进式解冻和层适应学习率等高级技巧,帮助研究者更好地优化模型训练。
254 4
在Pytorch中为不同层设置不同学习率来提升性能,优化深度学习模型
|
3月前
|
机器学习/深度学习 算法 数据可视化
如果你的PyTorch优化器效果欠佳,试试这4种深度学习中的高级优化技术吧
在深度学习领域,优化器的选择对模型性能至关重要。尽管PyTorch中的标准优化器如SGD、Adam和AdamW被广泛应用,但在某些复杂优化问题中,这些方法未必是最优选择。本文介绍了四种高级优化技术:序列最小二乘规划(SLSQP)、粒子群优化(PSO)、协方差矩阵自适应进化策略(CMA-ES)和模拟退火(SA)。这些方法具备无梯度优化、仅需前向传播及全局优化能力等优点,尤其适合非可微操作和参数数量较少的情况。通过实验对比发现,对于特定问题,非传统优化方法可能比标准梯度下降算法表现更好。文章详细描述了这些优化技术的实现过程及结果分析,并提出了未来的研究方向。
43 1
|
4月前
|
机器学习/深度学习 数据挖掘 PyTorch
🎓PyTorch深度学习入门课:编程小白也能玩转的高级数据分析术
踏入深度学习领域,即使是编程新手也能借助PyTorch这一强大工具,轻松解锁高级数据分析。PyTorch以简洁的API、动态计算图及灵活性著称,成为众多学者与工程师的首选。本文将带你从零开始,通过环境搭建、构建基础神经网络到进阶数据分析应用,逐步掌握PyTorch的核心技能。从安装配置到编写简单张量运算,再到实现神经网络模型,最后应用于图像分类等复杂任务,每个环节都配有示例代码,助你快速上手。实践出真知,不断尝试和调试将使你更深入地理解这些概念,开启深度学习之旅。
55 1
|
4月前
|
机器学习/深度学习 人工智能 PyTorch
深度学习领域中pytorch、onnx和ncnn的关系
PyTorch、ONNX 和 NCNN 是深度学习领域中的三个重要工具或框架,它们在模型开发、转换和部署过程中扮演着不同但相互关联的角色。
244 12
|
3月前
|
机器学习/深度学习 数据采集 自然语言处理
【NLP自然语言处理】基于PyTorch深度学习框架构建RNN经典案例:构建人名分类器
【NLP自然语言处理】基于PyTorch深度学习框架构建RNN经典案例:构建人名分类器
|
4月前
|
机器学习/深度学习 数据挖掘 TensorFlow
解锁Python数据分析新技能,TensorFlow&PyTorch双引擎驱动深度学习实战盛宴
在数据驱动时代,Python凭借简洁的语法和强大的库支持,成为数据分析与机器学习的首选语言。Pandas和NumPy是Python数据分析的基础,前者提供高效的数据处理工具,后者则支持科学计算。TensorFlow与PyTorch作为深度学习领域的两大框架,助力数据科学家构建复杂神经网络,挖掘数据深层价值。通过Python打下的坚实基础,结合TensorFlow和PyTorch的强大功能,我们能在数据科学领域探索无限可能,解决复杂问题并推动科研进步。
75 0