torch.nn.Linear的使用方法

简介: torch.nn.Linear的使用方法

0. 前言

按照国际惯例,首先声明:本文只是我自己学习的理解,虽然参考了他人的宝贵见解,但是内容可能存在不准确的地方。如果发现文中错误,希望批评指正,共同进步。

Linear类是torch.nn中最基础的模块之一,其作用是用于构建线性全连接神经元网络。本文说明其计算原理及使用方法。

在PyTorch中,全连接层(Fully Connected Layer)通常通过torch.nn.Linear模块来实现。全连接层是神经网络中的基本构建块之一,它将输入数据与一组可学习的权重进行矩阵乘法,然后可能添加一个偏置项,生成输出。

1. torch.nn.Linear定义

torch.nn.Linear的工作原理基于线性代数中的矩阵乘法和向量加法。在神经网络中,一个线性层可以表示为输入数据与权重矩阵的乘积,再加上一个可选的偏置项。数学上,对于一个输入向量x和一个权重矩阵A,以及一个偏置向量b,线性层的输出y可以通过以下公式计算:

此部分也可以参见PyTorch官网:

Linear的作用是用于线性计算: 其中 为输出, 为输入, 为权重, 为偏置。

在调用Linear模块时,需要输入的参数有3个:

- in_features:输入数据的size(关于这个size的定义后面还会提到)

- out_features:输出数据的size

- bias:设定为True则会生成偏置,如果设定为False偏置为0

关于权重和偏置的初始值,设定为从 的随机值。

2. 使用实例

在PyTorch中,使用torch.nn.Linear的步骤如下:

2.1 导入模块

首先需要导入PyTorch的相关模块。

import torch
from torch import nn
2.2 实例化Linear对象

使用nn.Linear类创建一个线性层对象。在实例化时,需要指定两个参数:in_featuresout_featuresin_features表示输入数据的特征维度(或说是上一层神经元的个数),out_features表示输出数据的特征维度(或说是这一层神经元的个数)。

linear_layer = nn.Linear(in_features=5, out_features=3)

这将创建一个从5维输入到3维输出的线性层。

2.3 前向传播(Forward)

在模型的前向传播过程中,我们将输入数据传递给线性层以得到输出。

input_data = torch.randn(10, 5)  # 假设我们有10个样本,每个样本有5个特征
output_data = linear_layer(input_data)
2.4 训练和优化

线性层通常作为更大的神经网络的一部分进行训练。在训练过程中,我们会使用优化器(如torch.optim.SGDtorch.optim.Adam)来更新线性层的权重和偏置。

optimizer = torch.optim.SGD(linear_layer.parameters(), lr=0.01)
 
for epoch in range(num_epochs):
    # 前向传播
    output = linear_layer(input_data)
 
    # 计算损失
    loss = some_loss_function(output, target_data)
 
    # 反向传播和优化
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()

需要注意的是,在实际使用中,可能还需要考虑将模型和数据移动到GPU上以加速计算,这可以通过.to(device)方法实现,其中device是代表GPU的torch.device对象。

这里可以通过.state_dict()方法打印出权重数据,用手算验证PyTorch输出结果。

这里值得注意的一点是:in_features和out_features并不是真正的输入输出数据的“大小”,而是输入输出数据的“最后一个维度的大小”,例如下面这段代码:

import torch
 
linear = torch.nn.Linear(in_features=3, out_features=1, bias=False)
 
b = torch.tensor([[1,1,1]], dtype=torch.float32)
c = torch.tensor([[1,1,1],
                  [1,1,1],
                  [1,1,1]], dtype=torch.float32)
 
out2 = linear(b)
out3 = linear(c)
 
print(out2)
print(out3)
 
------------------输出-----------------------
tensor([[0.3057]], grad_fn=<MmBackward0>)
tensor([[0.3057],
        [0.3057],
        [0.3057]], grad_fn=<MmBackward0>)


相关文章
|
机器学习/深度学习 PyTorch 算法框架/工具
RGCN的torch简单案例
RGCN 是指 Relational Graph Convolutional Network,是一种基于图卷积神经网络(GCN)的模型。与传统的 GCN 不同的是,RGCN 可以处理具有多种关系(边)类型的图数据,从而更好地模拟现实世界中的实体和它们之间的复杂关系。 RGCN 可以用于多种任务,例如知识图谱推理、社交网络分析、药物发现等。以下是一个以知识图谱推理为例的应用场景: 假设我们有一个知识图谱,其中包含一些实体(如人、物、地点)以及它们之间的关系(如出生于、居住在、工作于)。图谱可以表示为一个二元组 (E, R),其中 E 表示实体的集合,R 表示关系的集合,每个关系 r ∈ R
1378 0
|
2月前
|
PyTorch 算法框架/工具
Pytorch学习笔记(六):view()和nn.Linear()函数详解
这篇博客文章详细介绍了PyTorch中的`view()`和`nn.Linear()`函数,包括它们的语法格式、参数解释和具体代码示例。`view()`函数用于调整张量的形状,而`nn.Linear()`则作为全连接层,用于固定输出通道数。
115 0
Pytorch学习笔记(六):view()和nn.Linear()函数详解
|
2月前
|
机器学习/深度学习 PyTorch TensorFlow
Pytorch学习笔记(二):nn.Conv2d()函数详解
这篇文章是关于PyTorch中nn.Conv2d函数的详解,包括其函数语法、参数解释、具体代码示例以及与其他维度卷积函数的区别。
271 0
Pytorch学习笔记(二):nn.Conv2d()函数详解
|
2月前
|
PyTorch 算法框架/工具
Pytorch学习笔记(三):nn.BatchNorm2d()函数详解
本文介绍了PyTorch中的BatchNorm2d模块,它用于卷积层后的数据归一化处理,以稳定网络性能,并讨论了其参数如num_features、eps和momentum,以及affine参数对权重和偏置的影响。
239 0
Pytorch学习笔记(三):nn.BatchNorm2d()函数详解
|
2月前
|
PyTorch 算法框架/工具
Pytorch学习笔记(四):nn.MaxPool2d()函数详解
这篇博客文章详细介绍了PyTorch中的nn.MaxPool2d()函数,包括其语法格式、参数解释和具体代码示例,旨在指导读者理解和使用这个二维最大池化函数。
176 0
Pytorch学习笔记(四):nn.MaxPool2d()函数详解
|
2月前
|
机器学习/深度学习 PyTorch 算法框架/工具
Pytorch学习笔记(八):nn.ModuleList和nn.Sequential函数详解
PyTorch中的nn.ModuleList和nn.Sequential函数,包括它们的语法格式、参数解释和具体代码示例,展示了如何使用这些函数来构建和管理神经网络模型。
142 1
|
PyTorch 算法框架/工具
PyTorch中 nn.Conv2d与nn.ConvTranspose2d函数的用法
PyTorch中 nn.Conv2d与nn.ConvTranspose2d函数的用法
529 2
PyTorch中 nn.Conv2d与nn.ConvTranspose2d函数的用法
|
机器学习/深度学习 PyTorch 算法框架/工具
pytorch中nn.ReLU()和F.relu()有什么区别?
pytorch中nn.ReLU()和F.relu()有什么区别?
594 0
|
机器学习/深度学习 PyTorch 算法框架/工具
Pytorch torch.nn库以及nn与nn.functional有什么区别?
Pytorch torch.nn库以及nn与nn.functional有什么区别?
115 0
|
机器学习/深度学习 PyTorch 算法框架/工具