PyTorch实现多目标分类的全流程代码实践-开发者社区-阿里云

目标分类笔记(一): 利用包含多个网络多种训练策略的框架来完成多目标分类任务（从数据准备到训练测试部署的完整流程）

2024-10-18 705

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 这篇博客文章介绍了如何使用包含多个网络和多种训练策略的框架来完成多目标分类任务，涵盖了从数据准备到训练、测试和部署的完整流程，并提供了相关代码和配置文件。

一、目标分类介绍

目标分类是一种监督学习任务，其目标是根据输入数据的特征将其分配到预定义的类别中。这种分类方法在许多实际应用中都有广泛的应用，如垃圾邮件检测、图像识别、情感分析等。

目标分类的基本流程包括：数据预处理（如清洗、标准化）、特征提取、模型选择和训练、模型评估和优化。其中，模型的选择和训练是关键步骤，常见的分类算法有决策树、支持向量机、神经网络等。

目标分类的优点是可以自动地进行分类，无需人工干预，同时也可以通过调整模型参数来提高分类的准确性。但是，目标分类也存在一些挑战，如数据的不平衡问题、过拟合问题等。

1.1 二分类和多分类的区别

二分类是指将样本分为两个类别，多分类是指将样本分为多个类别。在机器学习中，常见的分类算法有决策树、支持向量机、神经网络等。其中，决策树是一种基于规则的分类算法，支持向量机是一种基于间隔最大化的分类算法，神经网络是一种基于非线性映射的分类算法。对于多分类问题，可以采用一对多的模型，即将一个二分类器用于多个类别的预测；也可以采用多对多的模型，即将多个二分类器用于多个类别的预测。

1.2 单标签和多标签输出的区别

单标签输出是指模型的输出只有一个预测值，即 f (x) = y。多标签输出是指模型的输出具有多个预测值，即 f (x_1,x_2,…,x_n) = y_1, y_2,…,y_n。在多标签分类中，每个输入样本需要零个或多个标签作为输出，同时需要输出。

二、代码获取

支持自定义数据集训练
支持网络架构：resnet18,resnet50,mobilenet_v2,googlenet
整套训练代码和测试代码（Pytorch版本）
支持多种优化器选择
支持选择多种损失函数：交叉熵、labelSmoothing、BCE等
所有的配置文件写在yaml文件，更方便管理

在这里插入图片描述

三、数据集准备

在这里插入图片描述

四、环境搭建

安装python、torch、torchvision和pip安装requirements
安装python可以通过anaconda安装虚拟环境，python == 3.7.11
torch和torchvision版本是torch 1.8.0+cpu和torchvision 0.9.0+cpu

如果安装gpu就去这里面下载对应的torch和torchvision的版本就行，需要先安装cuda
https://download.pytorch.org/whl/torch_stable.html

参考这篇博客：点击

4.1 环境测试

在这里插入图片描述

五、模型训练

在这里插入图片描述
然后运行python train.py即可开始训练。

六、模型测试

在这里插入图片描述

设置以上五个地方。由于网络真实预测的时候，可能会出现一张图片包含多种分类的目标。考虑到这种情况就不能简单的用argmax来获取最大值的索引了，所以我们应该通过设置阈值来记录相应类别的索引，然后再根据索引回溯到我们原始的目标信息。
修改后的代码如下：

      # 单标签分类
      pred_index = np.argmax(prob_scores, axis=1)
      pred_score = np.max(prob_scores, axis=1)

修改为

    def filter_array(self, arr, threshold):
        # 获取满足条件的索引和值
        arr = arr.flatten()
        indices = np.where(arr >= threshold)[0]
        values = arr[indices]
        return indices, values

    pred_index,pred_score = self.filter_array(prob_scores, threshold)

这里的阈值可以直接通过参数来进行设置。

在这里插入图片描述

6.1 多标签训练-单标签输出结果

如果只需要输出单个目标，需要修改成以下地方
在这里插入图片描述

6.2 多标签训练-多标签输出结果

修改成这样
在这里插入图片描述

目标分类笔记(一): 利用包含多个网络多种训练策略的框架来完成多目标分类任务（从数据准备到训练测试部署的完整流程）