文档备案控制台

开发者社区人工智能文章正文

【Pytorch】nn.Linear，nn.Conv

2022-12-29 621

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

nn.Linear

nn.Conv1d

当nn.Conv1d的kernel_size=1时，效果与nn.Linear相同，不过输入数据格式不同：
https://blog.csdn.net/l1076604169/article/details/107170146

import torch


def count_parameters(model):
    """Count the number of parameters in a model."""
    return sum([p.numel() for p in model.parameters()])


conv = torch.nn.Conv1d(3, 32, kernel_size=1)
print(count_parameters(conv))
# 128

linear = torch.nn.Linear(3, 32)
print(count_parameters(linear))
# 128

print(conv.weight.shape)
# torch.Size([32, 3, 1])
print(linear.weight.shape)
# torch.Size([32, 3])

# use same initialization
linear.weight = torch.nn.Parameter(conv.weight.squeeze(2))
linear.bias = torch.nn.Parameter(conv.bias)

tensor = torch.randn(128, 256, 3)   # [batch, feature_num,feature_size]
permuted_tensor = tensor.permute(0, 2, 1).clone().contiguous()  # [batch, feature_size,feature_num]

out_linear = linear(tensor)
print(out_linear.mean())
# tensor(0.0344, grad_fn=<MeanBackward0>)
print(out_linear.shape)
# torch.Size([128, 256, 32])


out_conv = conv(permuted_tensor)
print(out_conv.mean())
# tensor(0.0344, grad_fn=<MeanBackward0>)
print(out_conv.shape)
# torch.Size([128, 32, 256])

nn.Conv2d

nn.Conv3d

文章标签：

算法框架/工具

PyTorch

数据格式

关键词：

pytorch nn.linear

二进制人工智能

目录

相关文章

zzy的aly

|

PyTorch 算法框架/工具

Pytorch学习笔记(六):view()和nn.Linear()函数详解

这篇博客文章详细介绍了PyTorch中的`view()`和`nn.Linear()`函数，包括它们的语法格式、参数解释和具体代码示例。`view()`函数用于调整张量的形状，而`nn.Linear()`则作为全连接层，用于固定输出通道数。

zzy的aly

1346 0 0

Pytorch学习笔记(六):view()和nn.Linear()函数详解

zcongfly

|

存储 PyTorch 算法框架/工具

【chat-gpt问答记录】关于pytorch中的线性层nn.Linear()

【chat-gpt问答记录】关于pytorch中的线性层nn.Linear()

zcongfly

683 0 0

LiBiGo

|

PyTorch 算法框架/工具

PyTorch的nn.Linear()详解

从输入输出的张量的shape角度来理解，相当于一个输入为[batch_size, in_features]的张量变换成了[batch_size, out_features]的输出张量。

LiBiGo

1211 0 0

Deephub

|

机器学习/深度学习 JavaScript PyTorch

9个主流GAN损失函数的数学原理和Pytorch代码实现：从经典模型到现代变体

生成对抗网络（GAN）的训练效果高度依赖于损失函数的选择。本文介绍了经典GAN损失函数理论，并用PyTorch实现多种变体，包括原始GAN、LS-GAN、WGAN及WGAN-GP等。通过分析其原理与优劣，如LS-GAN提升训练稳定性、WGAN-GP改善图像质量，展示了不同场景下损失函数的设计思路。代码实现覆盖生成器与判别器的核心逻辑，为实际应用提供了重要参考。未来可探索组合优化与自适应设计以提升性能。

Deephub

1194 7 7

9个主流GAN损失函数的数学原理和Pytorch代码实现：从经典模型到现代变体

Deephub

|

9月前

|

机器学习/深度学习存储 PyTorch

Neural ODE原理与PyTorch实现：深度学习模型的自适应深度调节

Neural ODE将神经网络与微分方程结合，用连续思维建模数据演化，突破传统离散层的限制，实现自适应深度与高效连续学习。

Deephub

822 3 3

Neural ODE原理与PyTorch实现：深度学习模型的自适应深度调节

安全风信子

|

8月前

|

边缘计算人工智能 PyTorch

130_知识蒸馏技术：温度参数与损失函数设计 - 教师-学生模型的优化策略与PyTorch实现

随着大型语言模型（LLM）的规模不断增长，部署这些模型面临着巨大的计算和资源挑战。以DeepSeek-R1为例，其671B参数的规模即使经过INT4量化后，仍需要至少6张高端GPU才能运行，这对于大多数中小型企业和研究机构来说成本过高。知识蒸馏作为一种有效的模型压缩技术，通过将大型教师模型的知识迁移到小型学生模型中，在显著降低模型复杂度的同时保留核心性能，成为解决这一问题的关键技术之一。

安全风信子

682 6 6

Deephub

|

10月前

|

PyTorch 算法框架/工具异构计算

PyTorch 2.0性能优化实战：4种常见代码错误严重拖慢模型

我们将深入探讨图中断（graph breaks）和多图问题对性能的负面影响，并分析PyTorch模型开发中应当避免的常见错误模式。

Deephub

539 9 10

Deephub

|

12月前

|

机器学习/深度学习存储 PyTorch

PyTorch + MLFlow 实战：从零构建可追踪的深度学习模型训练系统

本文通过使用 Kaggle 数据集训练情感分析模型的实例，详细演示了如何将 PyTorch 与 MLFlow 进行深度集成，实现完整的实验跟踪、模型记录和结果可复现性管理。文章将系统性地介绍训练代码的核心组件，展示指标和工件的记录方法，并提供 MLFlow UI 的详细界面截图。

Deephub

545 2 2

PyTorch + MLFlow 实战：从零构建可追踪的深度学习模型训练系统

Deephub

|

机器学习/深度学习 PyTorch 算法框架/工具

提升模型泛化能力：PyTorch的L1、L2、ElasticNet正则化技术深度解析与代码实现

本文将深入探讨L1、L2和ElasticNet正则化技术，重点关注其在PyTorch框架中的具体实现。关于这些技术的理论基础，建议读者参考相关理论文献以获得更深入的理解。

Deephub

385 4 4

提升模型泛化能力：PyTorch的L1、L2、ElasticNet正则化技术深度解析与代码实现

热门文章

最新文章

pytorch学习一(扩展篇)：miniconda下载、安装、配置环境变量。miniconda创建多版本python环境。整理常用命令（亲测ok）

使用Pytorch中从头实现去噪扩散概率模型（DDPM）

PyTorch 编辑器的选择及配置

神工鬼斧惟肖惟妙，M1 mac系统深度学习框架Pytorch的二次元动漫动画风格迁移滤镜AnimeGANv2+Ffmpeg(图片+视频)快速实践

pytorch中optimizer为不同参数设置不同的学习率

基于Pytorch查看本地或者远程服务器GPU及使用方法

利用Pytorch实现一个完整的基于深度学习的人脸表情识别项目

PyTorch中的自动微分机制：深入理解反向传播

Pytorch学习笔记（1）：基本概念、安装、张量操作、逻辑回归

李宏毅2021春季机器学习课程视频笔记1：Introduction, Colab & PyTorch Tutorials, HW1

144_推理时延优化：Profiling与瓶颈分析 - 使用PyTorch Profiler诊断推理延迟，优化矩阵运算的独特瓶颈

130_知识蒸馏技术：温度参数与损失函数设计 - 教师-学生模型的优化策略与PyTorch实现

66_框架选择：PyTorch vs TensorFlow

23_Transformer架构详解：从原理到PyTorch实现

TensorFlow与PyTorch深度对比分析：从基础原理到实战选择的完整指南

PyTorch深度学习 ? 带你从入门到精通！！！

Transformer自回归关键技术：掩码注意力原理与PyTorch完整实现

编码器-解码器架构详解：Transformer如何在PyTorch中工作

Neural ODE原理与PyTorch实现：深度学习模型的自适应深度调节

【DQN实现避障控制】使用Pytorch框架搭建神经网络，基于DQN算法、优先级采样的DQN算法、DQN + 人工势场实现避障控制研究（Matlab、Python实现）

相关电子书

更多

低代码开发师（初级）实战教程

冬季实战营第三期：MySQL数据库进阶实战

阿里巴巴DevOps 最佳实践手册

推荐镜像

更多

pytorch-wheels

下一篇

阿里云正式发布 Agentic 代码安全：AI驱动的双Agent协同引擎