文档备案控制台

开发者社区人工智能文章正文

PyTorch的nn.Linear()详解

2023-05-08 1211

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 从输入输出的张量的shape角度来理解，相当于一个输入为[batch_size, in_features]的张量变换成了[batch_size, out_features]的输出张量。

1. nn.Linear()

nn.Linear()：用于设置网络中的全连接层，需要注意的是全连接层的输入与输出都是二维张量

一般形状为[batch_size, size]，不同于卷积层要求输入输出是四维张量。其用法与形参说明如下：

in_features指的是输入的二维张量的大小，即输入的[batch_size, size]中的size。

out_features指的是输出的二维张量的大小，即输出的二维张量的形状为[batch_size，output_size]，当然，它也代表了该全连接层的神经元个数。

从输入输出的张量的shape角度来理解，相当于一个输入为[batch_size, in_features]的张量变换成了[batch_size, out_features]的输出张量。

用法示例：

import torch as t
from torch import nn
from torch.nn import functional as F
# 假定输入的图像形状为[3,64,64]
x = t.randn(10, 3, 64, 64)      # 10张 3个channel 大小为64x64的图片
x = nn.Conv2d(3, 64, kernel_size=3, stride=3, padding=0)(x)
print(x.shape)
# 之前的特征图尺寸为多少，只要设置为(1,1)，那么最终特征图大小都为(1,1) 
# x = F.adaptive_avg_pool2d(x, [1,1])    # [b, 64, h, w] => [b, 64, 1, 1]
# print(x.shape)
# 将四维张量转换为二维张量之后，才能作为全连接层的输入
x = x.view(x.size(0), -1)
print(x.shape)
# in_features由输入张量的形状决定，out_features则决定了输出张量的形状 
connected_layer = nn.Linear(in_features = 64*21*21, out_features = 10)
# 调用全连接层
output = connected_layer(x) 
print(output.shape)
torch.Size([10, 64, 21, 21])
torch.Size([10, 28224])
torch.Size([10, 10])

文章标签：

算法框架/工具

PyTorch

关键词：

pytorch nn.linear

LiBiGo

目录

相关文章

zzy的aly

|

PyTorch 算法框架/工具

Pytorch学习笔记(六):view()和nn.Linear()函数详解

这篇博客文章详细介绍了PyTorch中的`view()`和`nn.Linear()`函数，包括它们的语法格式、参数解释和具体代码示例。`view()`函数用于调整张量的形状，而`nn.Linear()`则作为全连接层，用于固定输出通道数。

zzy的aly

1346 0 0

Pytorch学习笔记(六):view()和nn.Linear()函数详解

zcongfly

|

存储 PyTorch 算法框架/工具

【chat-gpt问答记录】关于pytorch中的线性层nn.Linear()

【chat-gpt问答记录】关于pytorch中的线性层nn.Linear()

zcongfly

683 0 0

二进制人工智能

|

PyTorch 算法框架/工具数据格式

【Pytorch】nn.Linear，nn.Conv

二进制人工智能

621 0 0

【Pytorch】nn.Linear，nn.Conv

Deephub

|

机器学习/深度学习 JavaScript PyTorch

9个主流GAN损失函数的数学原理和Pytorch代码实现：从经典模型到现代变体

生成对抗网络（GAN）的训练效果高度依赖于损失函数的选择。本文介绍了经典GAN损失函数理论，并用PyTorch实现多种变体，包括原始GAN、LS-GAN、WGAN及WGAN-GP等。通过分析其原理与优劣，如LS-GAN提升训练稳定性、WGAN-GP改善图像质量，展示了不同场景下损失函数的设计思路。代码实现覆盖生成器与判别器的核心逻辑，为实际应用提供了重要参考。未来可探索组合优化与自适应设计以提升性能。

Deephub

1194 7 7

9个主流GAN损失函数的数学原理和Pytorch代码实现：从经典模型到现代变体

Deephub

|

9月前

|

机器学习/深度学习存储 PyTorch

Neural ODE原理与PyTorch实现：深度学习模型的自适应深度调节

Neural ODE将神经网络与微分方程结合，用连续思维建模数据演化，突破传统离散层的限制，实现自适应深度与高效连续学习。

Deephub

822 3 3

Neural ODE原理与PyTorch实现：深度学习模型的自适应深度调节

安全风信子

|

8月前

|

边缘计算人工智能 PyTorch

130_知识蒸馏技术：温度参数与损失函数设计 - 教师-学生模型的优化策略与PyTorch实现

随着大型语言模型（LLM）的规模不断增长，部署这些模型面临着巨大的计算和资源挑战。以DeepSeek-R1为例，其671B参数的规模即使经过INT4量化后，仍需要至少6张高端GPU才能运行，这对于大多数中小型企业和研究机构来说成本过高。知识蒸馏作为一种有效的模型压缩技术，通过将大型教师模型的知识迁移到小型学生模型中，在显著降低模型复杂度的同时保留核心性能，成为解决这一问题的关键技术之一。

安全风信子

682 6 6

Deephub

|

10月前

|

PyTorch 算法框架/工具异构计算

PyTorch 2.0性能优化实战：4种常见代码错误严重拖慢模型

我们将深入探讨图中断（graph breaks）和多图问题对性能的负面影响，并分析PyTorch模型开发中应当避免的常见错误模式。

Deephub

539 9 10

Deephub

|

12月前

|

机器学习/深度学习存储 PyTorch

PyTorch + MLFlow 实战：从零构建可追踪的深度学习模型训练系统

本文通过使用 Kaggle 数据集训练情感分析模型的实例，详细演示了如何将 PyTorch 与 MLFlow 进行深度集成，实现完整的实验跟踪、模型记录和结果可复现性管理。文章将系统性地介绍训练代码的核心组件，展示指标和工件的记录方法，并提供 MLFlow UI 的详细界面截图。

Deephub

545 2 2

PyTorch + MLFlow 实战：从零构建可追踪的深度学习模型训练系统

Deephub

|

机器学习/深度学习 PyTorch 算法框架/工具

提升模型泛化能力：PyTorch的L1、L2、ElasticNet正则化技术深度解析与代码实现

本文将深入探讨L1、L2和ElasticNet正则化技术，重点关注其在PyTorch框架中的具体实现。关于这些技术的理论基础，建议读者参考相关理论文献以获得更深入的理解。

Deephub

385 4 4

提升模型泛化能力：PyTorch的L1、L2、ElasticNet正则化技术深度解析与代码实现

热门文章

最新文章

pytorch学习一(扩展篇)：miniconda下载、安装、配置环境变量。miniconda创建多版本python环境。整理常用命令（亲测ok）

使用Pytorch中从头实现去噪扩散概率模型（DDPM）

PyTorch 编辑器的选择及配置

神工鬼斧惟肖惟妙，M1 mac系统深度学习框架Pytorch的二次元动漫动画风格迁移滤镜AnimeGANv2+Ffmpeg(图片+视频)快速实践

pytorch中optimizer为不同参数设置不同的学习率

基于Pytorch查看本地或者远程服务器GPU及使用方法

利用Pytorch实现一个完整的基于深度学习的人脸表情识别项目

PyTorch中的自动微分机制：深入理解反向传播

Pytorch学习笔记（1）：基本概念、安装、张量操作、逻辑回归

李宏毅2021春季机器学习课程视频笔记1：Introduction, Colab & PyTorch Tutorials, HW1

144_推理时延优化：Profiling与瓶颈分析 - 使用PyTorch Profiler诊断推理延迟，优化矩阵运算的独特瓶颈

130_知识蒸馏技术：温度参数与损失函数设计 - 教师-学生模型的优化策略与PyTorch实现

66_框架选择：PyTorch vs TensorFlow

23_Transformer架构详解：从原理到PyTorch实现

TensorFlow与PyTorch深度对比分析：从基础原理到实战选择的完整指南

PyTorch深度学习 ? 带你从入门到精通！！！

Transformer自回归关键技术：掩码注意力原理与PyTorch完整实现

编码器-解码器架构详解：Transformer如何在PyTorch中工作

Neural ODE原理与PyTorch实现：深度学习模型的自适应深度调节

【DQN实现避障控制】使用Pytorch框架搭建神经网络，基于DQN算法、优先级采样的DQN算法、DQN + 人工势场实现避障控制研究（Matlab、Python实现）

相关电子书

更多

低代码开发师（初级）实战教程

冬季实战营第三期：MySQL数据库进阶实战

阿里巴巴DevOps 最佳实践手册

推荐镜像

更多

pytorch-wheels

下一篇

阿里云正式发布 Agentic 代码安全：AI驱动的双Agent协同引擎