PyTorch实现随机傅里叶特征映射的示例代码

简介: 这里我们定义了一个名为RFFeatureMap的类,它继承自PyTorch的nn.Module类。该类接受输入维度input_dim、输出维度output_dim和高斯核参数sigma作为参数。在初始化函数中,我们生成了随机正弦和余弦函数的系数omega和随机偏移量b,并将它们保存在该类的实例变量中。在前向函数中,我们首先将输入x转换为形状为(batch_size, input_dim)的张量。然后我们通过点乘x和omega的转置,加上偏移量b,并应用余弦函数,计算出特征映射z。最后我们返回特征映射z。
import torch
import numpy as np
class RFFeatureMap(torch.nn.Module):
    def __init__(self, input_dim, output_dim, sigma=1.0):
        super().__init__()
        self.input_dim = input_dim
        self.output_dim = output_dim
        self.sigma = sigma
        # 随机生成特征映射所需的正弦和余弦函数的系数
        self.omega = torch.randn(output_dim, input_dim) * self.sigma
        self.b = torch.rand(output_dim) * 2 * np.pi
    def forward(self, x):
        # 计算特征映射
        x = x.view(-1, self.input_dim)
        z = torch.cos(torch.mm(x, self.omega.t()) + self.b)
        return z

这里我们定义了一个名为RFFeatureMap的类,它继承自PyTorch的nn.Module类。该类接受输入维度input_dim、输出维度output_dim和高斯核参数sigma作为参数。在初始化函数中,我们生成了随机正弦和余弦函数的系数omega和随机偏移量b,并将它们保存在该类的实例变量中。

在前向函数中,我们首先将输入x转换为形状为(batch_size, input_dim)的张量。然后我们通过点乘xomega的转置,加上偏移量b,并应用余弦函数,计算出特征映射z。最后我们返回特征映射z


下面是一个示例代码,演示如何使用PyTorch生成随机数作为输入数据,并使用上面提供的RFFeatureMap类对其进行降维:


import torch
# 定义随机数生成器
rng = torch.Generator()
rng.manual_seed(0)
# 定义输入数据的维度和数量
input_dim = 100
num_samples = 1000
# 生成随机输入数据
x = torch.randn(num_samples, input_dim, generator=rng)
# 定义特征映射的维度
output_dim = 50
# 创建随机傅里叶特征映射
rf_map = RFFeatureMap(input_dim, output_dim)
# 对输入数据进行特征映射
z = rf_map(x)
# 打印输出数据的形状
print(z.shape)  # 输出: torch.Size([1000, 50])

在此示例中,我们首先定义了一个随机数生成器rng,并使用其生成了一个大小为(num_samples, input_dim)的随机输入张量x。然后我们定义了输出维度output_dim,并创建了一个RFFeatureMap实例rf_map,该实例将输入维度从input_dim降至output_dim

最后,我们使用特征映射rf_map对输入张量x进行处理,并将输出结果保存在变量z中。最终,我们打印出z的形状,结果为(num_samples, output_dim),表明成功地将输入数据从input_dim降至output_dim维。


-----------------介绍一下上面的x = torch.randn(num_samples, input_dim, generator=rng)中的generator=rng


在PyTorch中,torch.randn()函数可以用于生成服从标准正态分布的随机数张量。该函数接受张量的形状作为输入,并返回一个张量,其中的元素都是从标准正态分布中抽取的随机数。

在上述代码中,我们通过传递generator=rng参数来指定了一个随机数生成器rng,用于生成随机数张量x。这个随机数生成器是一个PyTorch中的torch.Generator类的实例,用于控制随机数生成的过程,使得每次运行程序时生成的随机数序列都是确定的。

在某些情况下,例如在训练深度神经网络时,我们需要确保每次运行程序时都生成不同的随机数序列。这时候,我们可以在每次生成随机数张量时都使用不同的随机数生成器实例,这样可以避免不同运行时的随机数相同的问题。

因此,我们可以在每次生成随机数张量时,通过generator参数指定一个新的torch.Generator实例,从而生成不同的随机数序列。例如:


# 使用不同的随机数生成器生成两个随机数张量
x1 = torch.randn(10, generator=torch.Generator())
x2 = torch.randn(10, generator=torch.Generator())

在这个例子中,我们分别使用了两个不同的torch.Generator实例来生成两个大小为(10,)的随机数张量。这样可以确保每次生成的随机数序列都是不同的。


-----------如果要确定相同怎么办?


如果需要在多次运行程序时生成相同的随机数序列,可以通过设置随机数生成器的种子(seed)来实现。

在PyTorch中,可以使用torch.manual_seed()函数来设置全局随机数生成器的种子,该种子将影响所有使用该生成器生成的随机数。例如,我们可以在程序的开头调用torch.manual_seed(0)函数来设置全局随机数生成器的种子为0,这样每次运行程序时都将生成相同的随机数序列。

在上述代码中,我们使用了一个torch.Generator实例rng作为随机数生成器,并通过rng.manual_seed(0)函数设置了该生成器的种子为0。因此,在生成随机数张量x时,我们传递了generator=rng参数,以确保每次运行程序时都生成相同的随机数序列。

下面是一个示例代码,演示如何在PyTorch中生成相同的随机数序列:


import torch
# 设置全局随机数生成器的种子
torch.manual_seed(0)
# 创建随机数生成器
rng = torch.Generator()
rng.manual_seed(0)
# 生成随机数张量
x = torch.randn(10, generator=rng)
# 打印生成的随机数张量
print(x)

在这个例子中,我们首先使用torch.manual_seed(0)函数设置全局随机数生成器的种子为0。然后我们创建了一个torch.Generator实例rng,并使用rng.manual_seed(0)函数设置了该生成器的种子为0。最后,我们使用rng生成器生成了一个大小为(10,)的随机数张量,并打印了该张量的值。由于种子相同,因此每次运行程序时都将生成相同的随机数张量。

相关文章
|
8月前
|
机器学习/深度学习 PyTorch 算法框架/工具
使用PyTorch处理多维特征输入的完美指南
使用PyTorch处理多维特征输入的完美指南
使用PyTorch处理多维特征输入的完美指南
|
机器学习/深度学习 PyTorch 算法框架/工具
使用Pytorch处理多维特征的输入
下图这个预测一个人在一年之后得糖尿病的概率的例子,这个时候我们的输入将会有很多的指标。你可以把它看成是我们体检的各种值。最后一排的外代表了他是否会得糖尿病。
198 0
|
机器学习/深度学习 数据可视化 PyTorch
使用Pytorch和Matplotlib可视化卷积神经网络的特征(下)
使用Pytorch和Matplotlib可视化卷积神经网络的特征
363 0
使用Pytorch和Matplotlib可视化卷积神经网络的特征(下)
|
机器学习/深度学习 数据可视化 自动驾驶
使用Pytorch和Matplotlib可视化卷积神经网络的特征(上)
使用Pytorch和Matplotlib可视化卷积神经网络的特征
207 0
使用Pytorch和Matplotlib可视化卷积神经网络的特征(上)
|
机器学习/深度学习 并行计算 PyTorch
【PyTorch基础教程7】多维特征input
之前的一维特征input,只有一个x和权重w相乘,多维的情况则是xi依次与逐个wi相乘(ps:每行x都这样算,每行即每个样本),可以用向量形式表示:
175 0
【PyTorch基础教程7】多维特征input
|
3月前
|
算法 PyTorch 算法框架/工具
Pytorch学习笔记(九):Pytorch模型的FLOPs、模型参数量等信息输出(torchstat、thop、ptflops、torchsummary)
本文介绍了如何使用torchstat、thop、ptflops和torchsummary等工具来计算Pytorch模型的FLOPs、模型参数量等信息。
471 2
|
1月前
|
机器学习/深度学习 人工智能 PyTorch
Transformer模型变长序列优化:解析PyTorch上的FlashAttention2与xFormers
本文探讨了Transformer模型中变长输入序列的优化策略,旨在解决深度学习中常见的计算效率问题。文章首先介绍了批处理变长输入的技术挑战,特别是填充方法导致的资源浪费。随后,提出了多种优化技术,包括动态填充、PyTorch NestedTensors、FlashAttention2和XFormers的memory_efficient_attention。这些技术通过减少冗余计算、优化内存管理和改进计算模式,显著提升了模型的性能。实验结果显示,使用FlashAttention2和无填充策略的组合可以将步骤时间减少至323毫秒,相比未优化版本提升了约2.5倍。
61 3
Transformer模型变长序列优化:解析PyTorch上的FlashAttention2与xFormers
|
3月前
|
机器学习/深度学习 自然语言处理 监控
利用 PyTorch Lightning 搭建一个文本分类模型
利用 PyTorch Lightning 搭建一个文本分类模型
96 7
利用 PyTorch Lightning 搭建一个文本分类模型
|
3月前
|
机器学习/深度学习 自然语言处理 数据建模
三种Transformer模型中的注意力机制介绍及Pytorch实现:从自注意力到因果自注意力
本文深入探讨了Transformer模型中的三种关键注意力机制:自注意力、交叉注意力和因果自注意力,这些机制是GPT-4、Llama等大型语言模型的核心。文章不仅讲解了理论概念,还通过Python和PyTorch从零开始实现这些机制,帮助读者深入理解其内部工作原理。自注意力机制通过整合上下文信息增强了输入嵌入,多头注意力则通过多个并行的注意力头捕捉不同类型的依赖关系。交叉注意力则允许模型在两个不同输入序列间传递信息,适用于机器翻译和图像描述等任务。因果自注意力确保模型在生成文本时仅考虑先前的上下文,适用于解码器风格的模型。通过本文的详细解析和代码实现,读者可以全面掌握这些机制的应用潜力。
197 3
三种Transformer模型中的注意力机制介绍及Pytorch实现:从自注意力到因果自注意力
|
4月前
|
机器学习/深度学习 PyTorch 调度
在Pytorch中为不同层设置不同学习率来提升性能,优化深度学习模型
在深度学习中,学习率作为关键超参数对模型收敛速度和性能至关重要。传统方法采用统一学习率,但研究表明为不同层设置差异化学习率能显著提升性能。本文探讨了这一策略的理论基础及PyTorch实现方法,包括模型定义、参数分组、优化器配置及训练流程。通过示例展示了如何为ResNet18设置不同层的学习率,并介绍了渐进式解冻和层适应学习率等高级技巧,帮助研究者更好地优化模型训练。
269 4
在Pytorch中为不同层设置不同学习率来提升性能,优化深度学习模型