【基础实操】借用torch自带网络进行训练自己的图像数据-阿里云开发者社区

【基础实操】借用torch自带网络进行训练自己的图像数据

2024-02-28 126

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【基础实操】借用torch自带网络进行训练自己的图像数据

前言

在本文里将为大家带来如何进行使用pytorch中的自带的深度网络进行训练自己的数据。本文讲解可分两部分，第一部分为大家介绍如何进行目录式的读取自己的数据；第二部分为大家介绍如何进行更改为其他网络进行调试。(alexnet\densenet\mnasnet\moblienet\resnet\shufflenet\squeezenet\vgg)

目录式读取

由于大家在做图像分类的时候，一般是往把搜集到的同类图像放置在同一个文件夹内，因此我们在这里采用目录式读取自己制作的数据集进行训练网络。

数据组成：

在这里我采用鲜花数据集为基础数据集并对此数据集进行修改。在鲜花数据集中我们确定总数据类别为5类，在训练集中每一类中的图像数为500涨，在测试集中的每一类的图像数为150张，对训练测试内的图像进行修改大小为224x224x3。

参考pytorch官网示例，我们可以将示例修改进行如下修改：

ini

复制代码

import torch
import torchvision
from torch import nn
from torch.utils.data import DataLoader
train_root = './datas/train/'
test_root = './datas/test/'
# 将文件夹的内容载入dataset
train_dataset = torchvision.datasets.ImageFolder(root=train_root, transform=torchvision.transforms.ToTensor())
test_dataset = torchvision.datasets.ImageFolder(root=test_root, transform=torchvision.transforms.ToTensor())
train_dataloader = DataLoader(train_dataset, batch_size=64)
test_dataloader = DataLoader(test_dataset, batch_size=64)

这这一步的时候我们可捎带的将超参数进行设置一下，如下设置：

ini

复制代码

learning_rate = 0.1
batch_size = 64
epochs = 100
# Initialize the loss function
loss_fn = nn.CrossEntropyLoss()

由于训练集是需要训练而测试集不需要进行训练，那么可参考官网的示例分别对训练集的操作和测试集的操作保持不变如下：

scss

复制代码

def train_loop(dataloader, model, loss_fn, optimizer):
    size = len(dataloader.dataset)
    for batch, (X, y) in enumerate(dataloader):
        # Compute prediction and loss
        pred = model(X)
        loss = loss_fn(pred, y)
        # Backpropagation
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
        if batch % 100 == 0:
            loss, current = loss.item(), batch * len(X)
            print(f"loss: {loss:>7f}  [{current:>5d}/{size:>5d}]")
def test_loop(dataloader, model, loss_fn):
    size = len(dataloader.dataset)
    num_batches = len(dataloader)
    test_loss, correct = 0, 0
    with torch.no_grad():
        for X, y in dataloader:
            pred = model(X)
            test_loss += loss_fn(pred, y).item()
            correct += (pred.argmax(1) == y).type(torch.float).sum().item()
    test_loss /= num_batches
    correct /= size
    print(f"Test Error: \n Accuracy: {(100 * correct):>0.1f}%, Avg loss: {test_loss:>8f} \n")

更改网络

在pytorch的自带网络大家可与自行将复制出来，这样可与避免因自己的更改导致后续因为再次使用出现不必要的BUG，pytorch自带的models路径为：

envs\pytorch\Lib\site-packages\torchvision\models

大家可与设置model为自己需要调用的网络,在这里我们以vgg网络系列的vgg11为例子为大家介绍如何进行训练网络。我们依旧保持官网示例中的SGD训练函数作为optimizer，然后将各参数导入到train和test中进行训练自己的数据。由于网络比较多，我在这里就不一一为大家介绍了。

大家可与移步我的Github

css

复制代码

from myNets.vgg import vgg11  # 可更换为其他
if __name__ == "__main__":
    model = vgg11(num_classes=5)  # 可更换为其他
    optimizer = torch.optim.SGD(model.parameters(), lr=learning_rate)
    for t in range(epochs):
        print(f"Epoch {t + 1}\n-------------------------------")
        train_loop(train_dataloader, model, loss_fn, optimizer)
        test_loop(test_dataloader, model, loss_fn)
    print("Done!")

拓展

在上一期：【实操】涨点神器你还不会，快点进来学习Label Smooth我们介绍了Label Smooth操作，大家可与尝试自行更改进行综合比对测试使用不同的Label Smooth操作对结果的影响，也可更换其他的学习率的衰减函数进行测试。

【基础实操】借用torch自带网络进行训练自己的图像数据

前言

目录式读取

更改网络

拓展

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

【基础实操】借用torch自带网络进行训练自己的图像数据

前言

目录式读取

更改网络

拓展

热门文章

最新文章

相关课程

相关电子书

相关实验场景