如何将[array([5, 0, 0, 0, 0, 0], dtype=uint32), array([0, 1, 0, 4, 0, 0], dtype=uint32), array([0, 0, 0, 3, 3, 3], dtype=uint32)] 转换成一个torch张量

简介: 在这个代码中,我先使用 torch.randperm() 函数生成一个长度为原始张量大小的随机索引序列,并用这个索引序列对原始张量进行重排,得到了打乱后的张量 shuffled_tensor。然后,我使用 torch.split() 函数将 shuffled_tensor 拆分成 3 份子张量,并打印出来以验证是否拆分成功。

要将这个数组转换成 PyTorch 张量,可以使用 torch.tensor() 函数。需要注意的是,这个数组包含多个数组,因此需要先将它们合并成一个数组。可以使用 np.concatenate() 函数来完成这一步。

以下是实现代码:


import numpy as np
import torch
# 定义原始数组
arr = [np.array([5, 0, 0, 0, 0, 0], dtype=np.uint32),
       np.array([0, 1, 0, 4, 0, 0], dtype=np.uint32),
       np.array([0, 0, 0, 3, 3, 3], dtype=np.uint32)]
# 将多个数组合并成一个数组
arr_merged = np.concatenate(arr)
# 将数组转换为 PyTorch 张量
tensor = torch.tensor(arr_merged)
# 打印张量
print(tensor)

输出结果应该是一个包含所有元素的 PyTorch 张量。注意,这个张量的形状会自动根据原始数组的维度进行推断。


----------------执行上面代码后,报错TypeError: can't convert np.ndarray of type numpy.uint32. The only supported types are: float64, float32, float16, complex64, complex128, int64, int32, int16, int8, uint8, and bool,


这个错误说明 PyTorch 中不支持 uint32 类型的数据。解决这个问题的方法是,在将数组转换为 PyTorch 张量之前,先将它们的数据类型转换为 PyTorch 支持的类型。可以使用 astype() 函数来完成这一步。以下是修改后的代码:


import numpy as np
import torch
# 定义原始数组
arr = [np.array([5, 0, 0, 0, 0, 0], dtype=np.uint32),
       np.array([0, 1, 0, 4, 0, 0], dtype=np.uint32),
       np.array([0, 0, 0, 3, 3, 3], dtype=np.uint32)]
# 将多个数组合并成一个数组,并将数据类型转换为 PyTorch 支持的类型
arr_merged = np.concatenate(arr).astype(np.float32)
# 将数组转换为 PyTorch 张量
tensor = torch.tensor(arr_merged)
# 打印张量
print(tensor)

在这个代码中,我使用了 astype() 函数将原始数组中的数据类型从 uint32 转换为 PyTorch 支持的 float32 类型。然后将合并后的数组转换为 PyTorch 张量,就不会再报类型不支持的错误了。



----------------如何将 tensor([[1., 0., 0., 0., 0., 0.],         [2., 1., 0., 4., 0., 0.],         [3., 0., 0., 3., 3., 3.],         [4., 0., 0., 0., 0., 0.],         [5., 1., 0., 4., 0., 0.],         [6., 0., 0., 3., 3., 3.],         [7., 0., 0., 0., 0., 0.],         [8., 1., 0., 4., 0., 0.],         [9., 0., 0., 3., 3., 3.]]) 拆分成3份,并随机打乱


要将 PyTorch 张量拆分成多个子张量并随机打乱,可以使用 torch.split() 函数和 torch.shuffle() 函数。具体步骤如下:

  1. 使用 torch.split() 函数将原始张量拆分成多个子张量。需要确定每个子张量的大小,可以根据原始张量的形状和要拆分成的份数来计算。
  2. 使用 torch.shuffle() 函数将拆分后的子张量打乱。需要注意的是,torch.shuffle() 函数只能对第一维进行打乱,因此需要先对子张量进行维度调整。

以下是实现代码:


import torch
import random
# 定义原始张量
tensor = torch.tensor([[1., 0., 0., 0., 0., 0.],
                       [2., 1., 0., 4., 0., 0.],
                       [3., 0., 0., 3., 3., 3.],
                       [4., 0., 0., 0., 0., 0.],
                       [5., 1., 0., 4., 0., 0.],
                       [6., 0., 0., 3., 3., 3.],
                       [7., 0., 0., 0., 0., 0.],
                       [8., 1., 0., 4., 0., 0.],
                       [9., 0., 0., 3., 3., 3.]])
# 计算每份子张量的大小
split_size = tensor.shape[0] // 3
# 使用 torch.split() 函数将张量拆分成多个子张量
sub_tensors = torch.split(tensor, split_size)
# 打印拆分后的子张量
print("Sub-tensors before shuffle:")
for sub_tensor in sub_tensors:
    print(sub_tensor)
# 使用 torch.shuffle() 函数将子张量打乱
for i in range(len(sub_tensors)):
    # 将子张量维度调整为 (size, -1) 的形式,以便使用 torch.shuffle() 函数
    sub_tensors[i] = sub_tensors[i].view(split_size, -1)
    sub_tensors[i] = torch.shuffle(sub_tensors[i], dim=0)
# 将子张量维度调整回 (n, m) 的形式
sub_tensors = [sub_tensor.view(-1, tensor.shape[1]) for sub_tensor in sub_tensors]
# 打印打乱后的子张量
print("Sub-tensors after shuffle:")
for sub_tensor in sub_tensors:
    print(sub_tensor)

在这个代码中,我先使用 torch.split() 函数将原始张量 tensor 拆分成 3 份,然后对每个子张量使用 torch.shuffle() 函数进行随机打乱。最后将打乱后的子张量打印出来,以验证是否打乱成功。


如果需要先对 PyTorch 张量进行随机打乱,然后再将其拆分成多个子张量,可以按照以下步骤操作:

  1. 使用 torch.randperm() 函数生成一个长度为原始张量大小的随机索引序列。
  2. 使用随机索引序列对原始张量进行重排,得到打乱后的张量。
  3. 使用 torch.split() 函数将打乱后的张量拆分成多个子张量。同样需要确定每个子张量的大小。

以下是实现代码:


import torch
import random
# 定义原始张量
tensor = torch.tensor([[1., 0., 0., 0., 0., 0.],
                       [2., 1., 0., 4., 0., 0.],
                       [3., 0., 0., 3., 3., 3.],
                       [4., 0., 0., 0., 0., 0.],
                       [5., 1., 0., 4., 0., 0.],
                       [6., 0., 0., 3., 3., 3.],
                       [7., 0., 0., 0., 0., 0.],
                       [8., 1., 0., 4., 0., 0.],
                       [9., 0., 0., 3., 3., 3.]])
# 使用 torch.randperm() 函数生成随机索引序列,并用其对张量进行重排
shuffle_indices = torch.randperm(tensor.shape[0])
shuffled_tensor = tensor[shuffle_indices]
# 计算每份子张量的大小
split_size = shuffled_tensor.shape[0] // 3
# 使用 torch.split() 函数将张量拆分成多个子张量
sub_tensors = torch.split(shuffled_tensor, split_size)
# 打印拆分后的子张量
print("Sub-tensors after shuffle:")
for sub_tensor in sub_tensors:
    print(sub_tensor)


在这个代码中,我先使用 torch.randperm() 函数生成一个长度为原始张量大小的随机索引序列,并用这个索引序列对原始张量进行重排,得到了打乱后的张量 shuffled_tensor。然后,我使用 torch.split() 函数将 shuffled_tensor 拆分成 3 份子张量,并打印出来以验证是否拆分成功。

相关文章
|
2月前
|
Python
使用array()函数创建数组
使用array()函数创建数组。
29 3
|
2月前
|
存储 安全 Swift
在Swift中,数组(Array)
在Swift中,数组(Array)
38 3
|
2月前
|
JavaScript 前端开发
总结TypeScript 的一些知识点:TypeScript Array(数组)(下)
一个数组的元素可以是另外一个数组,这样就构成了多维数组(Multi-dimensional Array)。
|
2月前
|
存储 JavaScript 前端开发
总结TypeScript 的一些知识点:TypeScript Array(数组)(上)
数组对象是使用单独的变量名来存储一系列的值。
|
2月前
|
Ruby
|
9月前
|
存储 Java 索引
【面试题精讲】ArrayList 和 Array(数组)的区别?
【面试题精讲】ArrayList 和 Array(数组)的区别?
|
7天前
|
存储 安全 算法
C++的内置数组和STL array、STL vector
C++的内置数组和STL array、STL vector
|
2月前
|
JavaScript 前端开发 索引
在JavaScript中,可以使用数组字面量或Array构造函数来创建一个数组对象
【4月更文挑战第16天】在JavaScript中,可以使用数组字面量或Array构造函数来创建一个数组对象
31 4
|
8月前
|
算法 Python
数组倍增(Array Doubling
数组倍增(Array Doubling)是一种常见的算法技术,用于解决数组相关的查找、插入、删除等问题。该技术的核心思想是将数组的大小乘以 2,新数组的长度是原数组长度的两倍,然后将原数组中的元素复制到新数组中。在某些情况下,这种技术可以提高算法的效率,尤其是对于动态数据结构的问题。
158 1
|
2月前
|
存储 索引 Python
多数pythoneer只知有列表list却不知道python也有array数组
多数pythoneer只知有列表list却不知道python也有array数组
34 0