【Pytorch神经网络理论篇】 08 Softmax函数（处理分类问题）

2023-05-10 312

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： oftmax函数本质也为激活函数，主要用于多分类问题，且要求分类互斥，分类器最后的输出单元需要Softmax 函数进行数值处理。

同学你好！本文章于2021年末编写，获得广泛的好评！

故在2022年末对本系列进行填充与更新，欢迎大家订阅最新的专栏，获取基于Pytorch1.10版本的理论代码(2023版)实现，

Pytorch深度学习·理论篇(2023版)目录地址为：

CSDN独家 | 全网首发 | Pytorch深度学习·理论篇(2023版)目录

本专栏将通过系统的深度学习实例，从可解释性的角度对深度学习的原理进行讲解与分析，通过将深度学习知识与Pytorch的高效结合，帮助各位新入门的读者理解深度学习各个模板之间的关系，这些均是在Pytorch上实现的，可以有效的结合当前各位研究生的研究方向，设计人工智能的各个领域，是经过一年时间打磨的精品专栏！

https://v9999.blog.csdn.net/article/details/127587345

欢迎大家订阅(2023版)理论篇

以下为2021版原文~~~~

1.1 Softmax函数简介

oftmax函数本质也为激活函数，主要用于多分类问题，且要求分类互斥，分类器最后的输出单元需要Softmax 函数进行数值处理。

Tip：在搭建网络模型的时候，需要用Softmax将目标分成几个，则在最后一层放几个节点

1.1.1Softmax函数构成

C为：分类的类别数

1.1.2 Softmax傻瓜式解释

将所有的值用e的n次方计算出来，求和之后计算每一个值的占比，保证其和为100%，即为概率

Tip：若多分类任务中的每个类之间不是互斥，则将其转化为多个二分类来组成

1.2 Softmax函数的原理剖析

1.3 Softmax代码部分

1.3.1 常用的Softmax结构

torch.nn.Softmax(dim)	计算Softmax，参数代表计算维度
torch.nn.Softmax2d()	对每个图片进行Softmax处理

torch.nn.LogSoftmax(logits,name=None)

对Softmax取对数，常与NULLLoss联合使用，实现交叉熵损失的计算

1.3.2 Softmax代码实现

import torch
#定义模拟数据
# logits：神经网络的计算结果，一共两个数据，每个数据的结果中包括三个数值，其为三个分类的结果
logits = torch.autograd.Variable(torch.tensor([[2,0.5,6],[0.1,0,3]]))
# labels：神经网络的计算结果对应的标签，每个数值代表一个数据分类的编号，且相互互斥
labels = torch.autograd.Variable(torch.LongTensor([2,1]))
print(logits)
# 输出 tensor([[2.0000, 0.5000, 6.0000],[0.1000, 0.0000, 3.0000]])
print(labels)
# 输出 tensor([2, 1])
#计算 Softmax
print('Softmax：',torch.nn.Softmax(dim=1)(logits))
# 输出 Softmax： tensor([[0.0179, 0.0040, 0.9781],[0.0498, 0.0451, 0.9051]])
### LogSoftmax() + NULLoss() = CrossEntropyLoss()
#计算 LogSoftmax：对Softmax取对数
logsoftmax = torch.nn.LogSoftmax(dim=1)(logits)
print('LogSoftmax：',logsoftmax)
# 输出 LogSoftmax： tensor([[-4.0222, -5.5222, -0.0222],[-2.9997, -3.0997, -0.0997]])
#计算 NULLoss
output = torch.nn.NLLLoss()(logsoftmax,labels)
print('NULLoss：',output)
# 输出 NULLoss： tensor(1.5609)
#计算 CrossEntropyLoss
CrossEntropyLoss_return = torch.nn.CrossEntropyLoss()(logits,labels)
print('CrossEntropyLoss：',CrossEntropyLoss_return)
# 输出 CrossEntropyLoss： tensor(1.5609)

【Pytorch神经网络理论篇】 08 Softmax函数（处理分类问题）

同学你好！本文章于2021年末编写，获得广泛的好评！

故在2022年末对本系列进行填充与更新，欢迎大家订阅最新的专栏，获取基于Pytorch1.10版本的理论代码(2023版)实现，

Pytorch深度学习·理论篇(2023版)目录地址为：