ResNet残差网络Pytorch实现——对花的种类进行训练

简介: ResNet残差网络Pytorch实现——对花的种类进行训练

✌ 使用ResNet进行对花的种类进行训练

import os
import json
import torch
import torch.nn as nn
import torch.optim as optim
from torchvision import transforms,datasets
from tqdm import tqdm
# 加载设备,使用cpu还是显卡
device=torch.device('cuda:0' if torch.cuda.is_available() else 'cpu')
print('using {} device'.format(device))
# 图片处理,对应train和验证集
data_transform={
    'train':transforms.Compose([transforms.RandomResizedCrop(224),  # 将图片裁剪为224*224
                                transforms.RandomHorizontalFlip(),  # 将图片随机反转
                                transforms.ToTensor(),  # 转化为ToTensor
                                # 进行标准化
                                transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])]),
    'val':transforms.Compose([transforms.Resize(256), # 调整图片大小
                              transforms.CenterCrop(224), # 中心裁剪224*224
                              transforms.ToTensor(),
                              transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])])
}
# os.getcwd()获得当前位置的绝对路径
# os.path.join()将两个路径进行拼接
img_path=os.path.join(os.getcwd(),'flower_data')
# 加载训练数据,同时对需要训练的图片进行处理
train_dataset=datasets.ImageFolder(root=os.path.join(img_path,'train'),
                                   transform=data_transform['train'])
# 加载验证集
val_dataset=datasets.ImageFolder(root=os.path.join(img_path,'val'),
                                transform=data_transform['val'])
# 定义每个训练批次的数据数量,对应每次训练16张图片
batch_size=16
# 训练数据的加载器
# 根据批次大小进行将数据进行分批
# 一般来说训练数据需要打乱,而验证集不需要
train_loader=torch.utils.data.DataLoader(train_dataset,
                                         batch_size,
                                         shuffle=True)
# 验证数据的加载器
val_loader=torch.utils.data.DataLoader(val_dataset,
                                       batch_size,
                                       shuffle=False)
# 训练和验证的数据大小
train_num=len(train_dataset)
val_num=len(val_dataset)
print('using {} images for training, {} images for validation.'.format(train_num,val_num))
# train_dataset.class_to_idx会返回'A':0,'B':1,'C':2,即每个类别对应的数值映射
flower_list=train_dataset.class_to_idx
# 将其逆置,为了预测时根据预测结果的分类找出对应的字符真实分类,如果不做,最终预测只知道是0,1,2这种,不知道花的真实类别
# data_dataset加载图片会根据图片所在的文件夹确定其分类
cla_dict=dict((value,key) for key,value in flower_list.items())
# 将字典转成json串
json_str=json.dumps(cla_dict,indent=4)
# 将json串写入到文件
with open('class_indices.json','w') as json_file:
    json_file.write(json_str)
# 创建网络
net=resnet34()
# 模型参数路径
model_weight_path='./resnet34-pre.pth'
# 加载模型参数
net.load_state_dict(torch.load(model_weight_path,map_location=device))
# 取出全连接层进行替换,因为模型中默认是1000分类,而本题中是5分类,
# 所以要取出全连接层获得全连接层的输入层加上现在的新输出5分类,构建新的全连接层
in_channel=net.fc.in_features
net.fc=nn.Linear(in_channel,5)
net.to(device)
# 交叉熵损失函数
loss_function=nn.CrossEntropyLoss()
# 获得可以更新梯度的参数
params=[p for p in net.parameters() if p.requires_grad]
# 定义优化器
optimizer=optim.Adam(params,lr=0.0001)
# 训练轮数,将所有的数据训练epochs次
epochs=3
# 最好的准确度
best_acc=0
# 训练的模型参数路径
save_path='./resNet34.pth'
# 训练集的批数
train_steps=len(train_loader)
for epoch in range(epochs):
    # 开启训练模式
    net.train()
    running_loss=0
    train_bar=tqdm(train_loader)
    for data in train_bar:
        # 获得每个训练批的数据和标签
        images,labels=data
        optimizer.zero_grad()
        output=net(images.to(device))
        loss=loss_function(output,labels.to(device))
        loss.backward()
        optimizer.step()
        running_loss+=loss.item()
        train_bar.desc = "train epoch[{}/{}] loss:{:.3f}".format(epoch + 1,
                                                                     epochs,
                                                                  loss)
    # 开启验证模式
    net.eval()
    acc=0
    # 不需要进行梯度下降求导
    with torch.no_grad():
        val_bar=tqdm(val_loader)
        for data in val_bar:
            images,labels=data
            output=net(images.to(device))
            # touch.max()返回指定维度的最大值和该值所在的索引                                                
            y_pred=torch.max(output,dim=1)[1]
            # 计算预测正确的个数
            acc+=torch.eq(y_pred,labels.to(device)).sum().item()
            val_bar.desc = "valid epoch[{}/{}]".format(epoch + 1,
                                                           epochs)
    val_accurate=acc/val_num
    print('[epoch %d] train_loss: %.3f  val_accuracy: %.3f' %
              (epoch + 1, running_loss / train_steps, val_accurate))
    # 如果当前的准确率>最高的准确率就将其取代,保存当前训练的参数
    if val_accurate>best_acc:
        best_acc=val_accurate
        torch.save(net.state_dict(),save_path)


目录
相关文章
|
12月前
|
机器学习/深度学习 PyTorch 算法框架/工具
目标检测实战(一):CIFAR10结合神经网络加载、训练、测试完整步骤
这篇文章介绍了如何使用PyTorch框架,结合CIFAR-10数据集,通过定义神经网络、损失函数和优化器,进行模型的训练和测试。
508 2
目标检测实战(一):CIFAR10结合神经网络加载、训练、测试完整步骤
|
2月前
|
机器学习/深度学习 人工智能 算法
AI 基础知识从 0.6 到 0.7—— 彻底拆解深度神经网络训练的五大核心步骤
本文以一个经典的PyTorch手写数字识别代码示例为引子,深入剖析了简洁代码背后隐藏的深度神经网络(DNN)训练全过程。
530 56
|
6月前
|
机器学习/深度学习 存储 算法
NoProp:无需反向传播,基于去噪原理的非全局梯度传播神经网络训练,可大幅降低内存消耗
反向传播算法虽是深度学习基石,但面临内存消耗大和并行扩展受限的问题。近期,牛津大学等机构提出NoProp方法,通过扩散模型概念,将训练重塑为分层去噪任务,无需全局前向或反向传播。NoProp包含三种变体(DT、CT、FM),具备低内存占用与高效训练优势,在CIFAR-10等数据集上达到与传统方法相当的性能。其层间解耦特性支持分布式并行训练,为无梯度深度学习提供了新方向。
219 1
NoProp:无需反向传播,基于去噪原理的非全局梯度传播神经网络训练,可大幅降低内存消耗
|
12月前
|
机器学习/深度学习 数据可视化 计算机视觉
目标检测笔记(五):详细介绍并实现可视化深度学习中每层特征层的网络训练情况
这篇文章详细介绍了如何通过可视化深度学习中每层特征层来理解网络的内部运作,并使用ResNet系列网络作为例子,展示了如何在训练过程中加入代码来绘制和保存特征图。
296 1
目标检测笔记(五):详细介绍并实现可视化深度学习中每层特征层的网络训练情况
|
9月前
|
机器学习/深度学习 算法 PyTorch
昇腾910-PyTorch 实现 ResNet50图像分类
本实验基于PyTorch,在昇腾平台上使用ResNet50对CIFAR10数据集进行图像分类训练。内容涵盖ResNet50的网络架构、残差模块分析及训练代码详解。通过端到端的实战讲解,帮助读者理解如何在深度学习中应用ResNet50模型,并实现高效的图像分类任务。实验包括数据预处理、模型搭建、训练与测试等环节,旨在提升模型的准确率和训练效率。
392 54
|
8月前
|
机器学习/深度学习 文件存储 异构计算
YOLOv11改进策略【模型轻量化】| 替换骨干网络为EfficientNet v2,加速训练,快速收敛
YOLOv11改进策略【模型轻量化】| 替换骨干网络为EfficientNet v2,加速训练,快速收敛
815 18
YOLOv11改进策略【模型轻量化】| 替换骨干网络为EfficientNet v2,加速训练,快速收敛
|
8月前
|
机器学习/深度学习 数据可视化 API
DeepSeek生成对抗网络(GAN)的训练与应用
生成对抗网络(GANs)是深度学习的重要技术,能生成逼真的图像、音频和文本数据。通过生成器和判别器的对抗训练,GANs实现高质量数据生成。DeepSeek提供强大工具和API,简化GAN的训练与应用。本文介绍如何使用DeepSeek构建、训练GAN,并通过代码示例帮助掌握相关技巧,涵盖模型定义、训练过程及图像生成等环节。
|
8月前
|
机器学习/深度学习 文件存储 异构计算
RT-DETR改进策略【模型轻量化】| 替换骨干网络为EfficientNet v2,加速训练,快速收敛
RT-DETR改进策略【模型轻量化】| 替换骨干网络为EfficientNet v2,加速训练,快速收敛
155 1
|
11月前
|
机器学习/深度学习 自然语言处理 语音技术
Python在深度学习领域的应用,重点讲解了神经网络的基础概念、基本结构、训练过程及优化技巧
本文介绍了Python在深度学习领域的应用,重点讲解了神经网络的基础概念、基本结构、训练过程及优化技巧,并通过TensorFlow和PyTorch等库展示了实现神经网络的具体示例,涵盖图像识别、语音识别等多个应用场景。
358 8
|
机器学习/深度学习 人工智能 算法
鸟类识别系统Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+ResNet50算法模型+图像识别
鸟类识别系统。本系统采用Python作为主要开发语言,通过使用加利福利亚大学开源的200种鸟类图像作为数据集。使用TensorFlow搭建ResNet50卷积神经网络算法模型,然后进行模型的迭代训练,得到一个识别精度较高的模型,然后在保存为本地的H5格式文件。在使用Django开发Web网页端操作界面,实现用户上传一张鸟类图像,识别其名称。
420 12
鸟类识别系统Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+ResNet50算法模型+图像识别

热门文章

最新文章

推荐镜像

更多