Pytorch 最全入门介绍,Pytorch入门看这一篇就够了(一):https://developer.aliyun.com/article/1424818
3.2 数据加载和处理
在深度学习项目中,除了模型设计之外,数据的加载和处理也是非常重要的一部分。PyTorch提供了torch.utils.data.DataLoader
类,可以帮助我们方便地进行数据的加载和处理。
3.2.1 DataLoader介绍
DataLoader
类提供了对数据集的并行加载,可以有效地加载大量数据,并提供了多种数据采样方式。常用的参数有:
- dataset:加载的数据集(Dataset对象)
- batch_size:batch大小
- shuffle:是否每个epoch时都打乱数据
- num_workers:使用多进程加载的进程数,0表示不使用多进程
以下是一个简单的使用示例:
from torch.utils.data import DataLoader from torchvision import datasets, transforms # 数据转换 transform = transforms.Compose([ transforms.ToTensor(), transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5)) ]) # 下载并加载训练集 trainset = datasets.CIFAR10(root='./data', train=True, download=True, transform=transform) trainloader = DataLoader(trainset, batch_size=4, shuffle=True, num_workers=2) # 下载并加载测试集 testset = datasets.CIFAR10(root='./data', train=False, download=True, transform=transform) testloader = DataLoader(testset, batch_size=4, shuffle=False, num_workers=2)
3.2.2 自定义数据集
除了使用内置的数据集,我们也可以自定义数据集。自定义数据集需要继承Dataset
类,并实现__len__
和__getitem__
两个方法。
以下是一个自定义数据集的简单示例:
from torch.utils.data import Dataset, DataLoader class MyDataset(Dataset): def __init__(self, x_tensor, y_tensor): self.x = x_tensor self.y = y_tensor def __getitem__(self, index): return (self.x[index], self.y[index]) def __len__(self): return len(self.x) x = torch.arange(10) y = torch.arange(10) + 1 my_dataset = MyDataset(x, y) loader = DataLoader(my_dataset, batch_size=4, shuffle=True, num_workers=0) for x, y in loader: print("x:", x, "y:", y)
这个例子中,我们创建了一个简单的数据集,包含10个数据。然后我们使用DataLoader
加载数据,并设置了batch大小和shuffle参数。
以上就是PyTorch中数据加载和处理的主要方法,通过这些方法,我们可以方便地对数据进行加载和处理。
3.3 模型的保存和加载
在深度学习模型的训练过程中,我们经常需要保存模型的参数以便于将来重新加载。这对于中断的训练过程的恢复,或者用于模型的分享和部署都是非常有用的。
PyTorch提供了简单的API来保存和加载模型。最常见的方法是使用torch.save
来保存模型的参数,然后通过torch.load
来加载模型的参数。
3.3.1 保存和加载模型参数
以下是一个简单的示例:
# 保存 torch.save(model.state_dict(), PATH) # 加载 model = TheModelClass(*args, **kwargs) model.load_state_dict(torch.load(PATH)) model.eval()
在保存模型参数时,我们通常使用.state_dict()
方法来获取模型的参数。.state_dict()
是一个从参数名字映射到参数值的字典对象。
在加载模型参数时,我们首先需要实例化一个和原模型结构相同的模型,然后使用.load_state_dict()
方法加载参数。
请注意,load_state_dict()
函数接受一个字典对象,而不是保存对象的路径。这意味着在你传入load_state_dict()
函数之前,你必须反序列化你的保存的state_dict
。
在加载模型后,我们通常调用.eval()
方法将dropout和batch normalization层设置为评估模式。否则,它们会在评估模式下保持训练模式。
3.3.2 保存和加载整个模型
除了保存模型的参数,我们也可以保存整个模型。
# 保存 torch.save(model, PATH) # 加载 model = torch.load(PATH) model.eval()
保存整个模型会将模型的结构和参数一起保存。这意味着在加载模型时,我们不再需要手动创建模型实例。但是,这种方式需要更多的磁盘空间,并且可能在某些情况下导致代码的混乱,所以并不总是推荐的。
以上就是PyTorch中模型的保存和加载的基本方法。适当的保存和加载模型可以帮助我们更好地进行模型的训练和评估。
4. PyTorch GPT加速
掌握了PyTorch的基础和高级用法之后,我们现在要探讨一些PyTorch的进阶技巧,帮助我们更好地理解和使用这个强大的深度学习框架。
4.1 使用GPU加速
PyTorch支持使用GPU进行计算,这可以大大提高训练和推理的速度。使用GPU进行计算的核心就是将Tensor和模型转移到GPU上。
4.1.1 判断是否支持GPU
首先,我们需要判断当前的环境是否支持GPU。这可以通过torch.cuda.is_available()
来实现:
print(torch.cuda.is_available()) # 输出:True 或 False
4.1.2 Tensor在CPU和GPU之间转移
如果支持GPU,我们可以使用.to(device)
或.cuda()
方法将Tensor转移到GPU上。同样,我们也可以使用.cpu()
方法将Tensor转移到CPU上:
# 判断是否支持CUDA device = torch.device("cuda" if torch.cuda.is_available() else "cpu") # 创建一个Tensor x = torch.rand(3, 3) # 将Tensor转移到GPU上 x_gpu = x.to(device) # 或者 x_gpu = x.cuda() # 将Tensor转移到CPU上 x_cpu = x_gpu.cpu()
4.1.3 将模型转移到GPU上
类似的,我们也可以将模型转移到GPU上:
model = Model() model.to(device)
当模型在GPU上时,我们需要确保输入的Tensor也在GPU上,否则会报错。
注意,将模型转移到GPU上后,模型的所有参数和缓冲区都会转移到GPU上。
以上就是使用GPU进行计算的基本方法。通过合理的使用GPU,我们可以大大提高模型的训练和推理速度。
4.2 使用torchvision进行图像操作
torchvision是一个独立于PyTorch的包,提供了大量的图像数据集,图像处理工具和预训练模型等。
4.2.1 torchvision.datasets
torchvision.datasets模块提供了各种公共数据集,如CIFAR10、MNIST、ImageNet等,我们可以非常方便地下载和使用这些数据集。例如,下面的代码展示了如何下载和加载CIFAR10数据集:
from torchvision import datasets, transforms # 数据转换 transform = transforms.Compose([ transforms.ToTensor(), transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5)) ]) # 下载并加载训练集 trainset = datasets.CIFAR10(root='./data', train=True, download=True, transform=transform) trainloader = torch.utils.data.DataLoader(trainset, batch_size=4, shuffle=True, num_workers=2) # 下载并加载测试集 testset = datasets.CIFAR10(root='./data', train=False, download=True, transform=transform) testloader = torch.utils.data.DataLoader(testset, batch_size=4, shuffle=False, num_workers=2)
4.2.2 torchvision.transforms
torchvision.transforms模块提供了各种图像转换的工具,我们可以使用这些工具进行图像预处理和数据增强。例如,上面的代码中,我们使用了Compose函数来组合了两个图像处理操作:ToTensor(将图像转换为Tensor)和Normalize(标准化图像)。
4.2.3 torchvision.models
torchvision.models模块提供了预训练的模型,如ResNet、VGG、AlexNet等。我们可以非常方便地加载这些模型,并使用这些模型进行迁移学习。
import torchvision.models as models # 加载预训练的resnet18模型 resnet18 = models.resnet18(pretrained=True)
以上就是torchvision的基本使用,它为我们提供了非常丰富的工具,可以大大提升我们处理图像数据的效率。
4.3 使用TensorBoard进行可视化
TensorBoard 是一个可视化工具,它可以帮助我们更好地理解,优化,和调试深度学习模型。PyTorch 提供了对 TensorBoard 的支持,我们可以非常方便地使用 TensorBoard 来监控模型的训练过程,比较不同模型的性能,可视化模型结构,等等。
4.3.1 启动 TensorBoard
要启动 TensorBoard,我们需要在命令行中运行 tensorboard --logdir=runs
命令,其中 runs
是保存 TensorBoard 数据的目录。
4.3.2 记录数据
我们可以使用 torch.utils.tensorboard
模块来记录数据。首先,我们需要创建一个 SummaryWriter
对象,然后通过这个对象的方法来记录数据。
from torch.utils.tensorboard import SummaryWriter # 创建一个 SummaryWriter 对象 writer = SummaryWriter('runs/experiment1') # 使用 writer 来记录数据 for n_iter in range(100): writer.add_scalar('Loss/train', np.random.random(), n_iter) writer.add_scalar('Loss/test', np.random.random(), n_iter) writer.add_scalar('Accuracy/train', np.random.random(), n_iter) writer.add_scalar('Accuracy/test', np.random.random(), n_iter) # 关闭 writer writer.close()
4.3.3 可视化模型结构
我们也可以使用 TensorBoard 来可视化模型结构。
# 添加模型 writer.add_graph(model, images)
4.3.4 可视化高维数据
我们还可以使用 TensorBoard 的嵌入功能来可视化高维数据,如图像特征、词嵌入等。
# 添加嵌入 writer.add_embedding(features, metadata=class_labels, label_img=images)
以上就是 TensorBoard 的基本使用方法。通过使用 TensorBoard,我们可以更好地理解和优化我们的模型。
5. PyTorch实战案例
在这一部分中,我们将通过一个实战案例来详细介绍如何使用PyTorch进行深度学习模型的开发。我们将使用CIFAR10数据集来训练一个卷积神经网络(Convolutional Neural Network,CNN)。
5.1 数据加载和预处理
首先,我们需要加载数据并进行预处理。我们将使用torchvision包来下载CIFAR10数据集,并使用transforms模块来对数据进行预处理。
import torch from torchvision import datasets, transforms # 定义数据预处理操作 transform = transforms.Compose([ transforms.RandomHorizontalFlip(), # 数据增强:随机翻转图片 transforms.RandomCrop(32, padding=4), # 数据增强:随机裁剪图片 transforms.ToTensor(), # 将PIL.Image或者numpy.ndarray数据类型转化为torch.FloadTensor,并归一化到[0.0, 1.0] transforms.Normalize((0.4914, 0.4822, 0.4465), (0.2023, 0.1994, 0.2010)) # 标准化(这里的均值和标准差是CIFAR10数据集的) ]) # 下载并加载训练数据集 trainset = datasets.CIFAR10(root='./data', train=True, download=True, transform=transform) trainloader = torch.utils.data.DataLoader(trainset, batch_size=64, shuffle=True, num_workers=2) # 下载并加载测试数据集 testset = datasets.CIFAR10(root='./data', train=False, download=True, transform=transform) testloader = torch.utils.data.DataLoader(testset, batch_size=64, shuffle=False, num_workers=2)
在这段代码中,我们首先定义了一系列的数据预处理操作,然后使用datasets.CIFAR10
来下载CIFAR10数据集并进行预处理,最后使用torch.utils.data.DataLoader
来创建数据加载器,它可以帮助我们在训练过程中按照批次获取数据。
5.2 定义网络模型
接下来,我们定义我们的卷积神经网络模型。在这个案例中,我们将使用两个卷积层和两个全连接层。
import torch.nn as nn import torch.nn.functional as F class Net(nn.Module): def __init__(self): super(Net, self).__init__() self.conv1 = nn.Conv2d(3, 6, 5) # 输入通道数3,输出通道数6,卷积核大小5 self.pool = nn.MaxPool2d(2, 2) # 最大池化,核大小2,步长2 self.conv2 = nn.Conv2d(6, 16, 5) # 输入通道数6,输出通道数16,卷积核大小5 self.fc1 = nn.Linear(16 * 5 * 5, 120) # 全连接层,输入维度16*5*5,输出维度120 self.fc2 = nn.Linear(120, 84) # 全连接层,输入维度120,输出维度84 self.fc3 = nn.Linear(84, 10) # 全连接层,输入维度84,输出维度10(CIFAR10有10类) def forward(self, x): x = self.pool(F.relu(self.conv1(x))) # 第一层卷积+ReLU激活函数+池化 x = self.pool(F.relu(self.conv2(x))) # 第二层卷积+ReLU激活函数+池化 x = x.view(-1, 16 * 5 * 5) # 将特征图展平 x = F.relu(self.fc1(x)) # 第一层全连接+ReLU激活函数 x = F.relu(self.fc2(x)) # 第二层全连接+ReLU激活函数 x = self.fc3(x) # 第三层全连接 return x # 创建网络 net = Net()
在这个网络模型中,我们使用nn.Module
来定义我们的网络模型,然后在__init__
方法中定义网络的层,最后在forward
方法中定义网络的前向传播过程。
5.3 定义损失函数和优化器
现在我们已经有了数据和模型,下一步我们需要定义损失函数和优化器。损失函数用于衡量模型的预测与真实标签的差距,优化器则用于优化模型的参数以减少损失。
在这个案例中,我们将使用交叉熵损失函数(Cross Entropy Loss)和随机梯度下降优化器(Stochastic Gradient Descent,SGD)。
import torch.optim as optim # 定义损失函数 criterion = nn.CrossEntropyLoss() # 定义优化器 optimizer = optim.SGD(net.parameters(), lr=0.001, momentum=0.9)
在这段代码中,我们首先使用nn.CrossEntropyLoss
来定义损失函数,然后使用optim.SGD
来定义优化器。我们需要将网络的参数传递给优化器,然后设置学习率和动量。
5.4 训练网络
一切准备就绪后,我们开始训练网络。在训练过程中,我们首先通过网络进行前向传播得到输出,然后计算输出与真实标签的损失,接着通过后向传播计算梯度,最后使用优化器更新模型参数。
for epoch in range(2): # 在数据集上训练两遍 running_loss = 0.0 for i, data in enumerate(trainloader, 0): # 获取输入数据 inputs, labels = data # 梯度清零 optimizer.zero_grad() # 前向传播 outputs = net(inputs) # 计算损失 loss = criterion(outputs, labels) # 反向传播 loss.backward() # 更新参数 optimizer.step() # 打印统计信息 running_loss += loss.item() if i % 2000 == 1999: # 每2000个批次打印一次 print('[%d, %5d] loss: %.3f' % (epoch + 1, i + 1, running_loss / 2000)) running_loss = 0.0 print('Finished Training')
在这段代码中,我们首先对数据集进行两轮训练。在每轮训练中,我们遍历数据加载器,获取一批数据,然后通过网络进行前向传播得到输出,计算损失,进行反向传播,最后更新参数。我们还在每2000个批次后打印一次损失信息,以便我们了解训练过程。
5.5 测试网络
训练完成后,我们需要在测试集上测试网络的性能。这可以让我们了解模型在未见过的数据上的表现如何,以评估其泛化能力。
# 加载一些测试图片 dataiter = iter(testloader) images, labels = dataiter.next() # 打印图片 imshow(torchvision.utils.make_grid(images)) # 显示真实的标签 print('GroundTruth: ', ' '.join('%5s' % classes[labels[j]] for j in range(4))) # 让网络做出预测 outputs = net(images) # 预测的标签是最大输出的标签 _, predicted = torch.max(outputs, 1) # 显示预测的标签 print('Predicted: ', ' '.join('%5s' % classes[predicted[j]] for j in range(4))) # 在整个测试集上测试网络 correct = 0 total = 0 with torch.no_grad(): for data in testloader: images, labels = data outputs = net(images) _, predicted = torch.max(outputs.data, 1) total += labels.size(0) correct += (predicted == labels).sum().item() print('Accuracy of the network on the 10000 test images: %d %%' % ( 100 * correct / total))
在这段代码中,我们首先加载一些测试图片,并打印出真实的标签。然后我们让网络对这些图片做出预测,并打印出预测的标签。最后,我们在整个测试集上测试网络,并打印出网络在测试集上的准确率。
5.6 保存和加载模型
在训练完网络并且对其进行了测试后,我们可能希望保存训练好的模型,以便于将来使用,或者继续训练。
# 保存模型 torch.save(net.state_dict(), './cifar_net.pth')
在这段代码中,我们使用torch.save
函数,将训练好的模型参数(通过net.state_dict()
获得)保存到文件中。
当我们需要加载模型时,首先需要创建一个新的模型实例,然后使用load_state_dict
方法将参数加载到模型中。
# 加载模型 net = Net() # 创建新的网络实例 net.load_state_dict(torch.load('./cifar_net.pth')) # 加载模型参数
需要注意的是,load_state_dict
方法加载的是模型的参数,而不是模型本身。因此,在加载模型参数之前,你需要先创建一个模型实例,这个模型需要与保存的模型具有相同的结构。
6. 总结
这篇文章通过详细且实践性的方式介绍了 PyTorch 的使用,包括环境安装、基础知识、张量操作、自动求导机制、神经网络创建、数据处理、模型训练、测试以及模型的保存和加载。
我们利用 PyTorch 从头到尾完成了一个完整的神经网络训练流程,并在 CIFAR10 数据集上测试了网络的性能。在这个过程中,我们深入了解了 PyTorch 提供的各种功能和工具。
希望这篇文章能对你学习 PyTorch 提供帮助,对于想要更深入了解 PyTorch 的读者,我建议参考 PyTorch 的官方文档以及各种开源教程。实践是最好的学习方法,只有通过大量的练习和实践,才能真正掌握 PyTorch 和深度学习。
谢谢你的阅读,希望你在深度学习的道路上越走越远!