PyTorch基本数据类型tensor-阿里云开发者社区

PyTorch基本数据类型tensor

2024-03-25 27

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： PyTorch基本数据类型tensor

0. 前言

按照国际惯例，首先声明：本文只是我自己学习的理解，虽然参考了他人的宝贵见解及成果，但是内容可能存在不准确的地方。如果发现文中错误，希望批评指正，共同进步。

在深度学习领域，PyTorch作为一款广受欢迎的开源机器学习库，以其灵活、动态的计算图模型和强大的GPU支持能力而受到广大研究者与开发者的青睐。其中，Tensor是PyTorch的核心数据结构，也是进行各种数学运算和构建神经网络的基础。本文将详细解析PyTorch中的基本数据类型——Tensor，帮助读者深入理解其概念、特性和应用。

1. Tensor的基本介绍

Tensor（张量）在PyTorch中是对多维数组的抽象表示，类似于NumPy中的ndarray。它可以在CPU或GPU上存储和处理数据，并且提供了丰富的数学运算方法。无论是简单的标量、向量、矩阵，还是高维度的数据，都可以用Tensor来表示。

下面通过Python与PyTorch的数据类型对比来说明Tensor：

以上数据是存储在CPU中。如果使用.cuda（），会返回一个GPU上的引用:

import torch

a = torch.tensor([1,2])
c = a.cuda
print(c)
print(type(c))

-----输出------
D:\Users\Lenovo\anaconda3\python.exe C:/Users/Lenovo/Desktop/pythonProject2/main.py
<built-in method cuda of Tensor object at 0x000002A03434CA00>
<class 'builtin_function_or_method'>

Process finished with exit code 0

2. Tensor属性

.shape：返回Tensor的维度信息。
.dtype：返回Tensor的数据类型，如torch.float32、torch.int64等。
.device：返回Tensor所在的设备，即CPU或某个GPU编号。

3. Tensor的常见使用方法及代码实例

3.1生成tensor方法

import torch

a = torch.rand(3, 3) #生成指定大小的，元素范围[0,1]的tensor
print(a)

b = torch.rand_like(a) #生成与对象tensor大小一致的tensor
print(b)

c = torch.randint(1,10,(3,3)) #生成(3,3)大小，[1,10)范围的tensor（包括1，但不包括10）
print(c)

d = torch.randn(2,4) #生成均值为0，方差为1的随机tensor
print(d)

e = torch.full([2,5],0) #生成全部一样的tensor
print(e)

f = torch.arange(0,10)  #生成顺序tensor
print(f)

g = torch.linspace(0,9,steps=8)  #生成[0,9]，等分成8个的tensor
print(g)

print(torch.ones(3,1),
      torch.zeros(4,5),
      torch.eye(6)) #生成全1，全0，单位矩阵tensor

3.2 tensor的切片与索引

import torch

a = torch.rand(3, 7) #生成指定大小的，元素范围[0,1]的tensor
print(a)
print("*"*100)
print(a[0])  #取一行
print("*"*100)
print(a[:2,4:])  #指定一块子区域
print("*"*100)
print(a[:,2])  #取一列
print("*"*100)
print(a[:,0:7:2]) #[0,7]行隔2行取样
print("*"*100)
print(a.index_select(1,torch.tensor([2,6])))  #指定切片位置
print("*"*100)
mask = a.ge(0.8)
print(torch.masked_select(a,mask)) #通过掩码条件切片（注意切片后会被flatten）
print(mask) #看看mask矩阵

3.3 tensor的维度变换（重点）

基本操作：

view/reshape
squeeze/unsqueeze

import torch

a = torch.rand(3,4,2) #生成指定大小的，元素范围[0,1]的tensor
print(a)

# view方法：变换tensor的形状
print(a.view(3, 8))  #压缩维度
print(a.view(3,2,2,2))  #扩展维度

# unsqueeze方法：在指定地方插入一维(squeeze方法同理会消除一维)
print(a.unsqueeze(1))
print(a.squeeze(1))  #squeeze只有在原有维度为1才有用，试试把上面改成rand（3，1，2）看看效果

3.4 tensor的叠加和分割


```python
import torch

#cat操作
a = torch.rand(4,1,3)
b = torch.rand(3,1,3)
# print(a)
# print(b)
c = torch.cat((a,b))  #合并tensor（只能在其他dimension一致的情况下才能合并）
# print(c)
# print(c.shape)

#stack操作
d = torch.rand(4,1)
e = torch.rand(4,1)
# print(d)
# print(e)
f = torch.stack((d,e))  #合并tensor,与cat不同的是，stack会增加一个更高的维度
# print(f)
# print(f.shape)

#split操作
g = torch.rand(5,2,1)
h,i = g.split([1,4])
# print(g)
# print(h)
# print(i)

3.5 tensor的数学运算

import torch

#基本加减乘除
a = torch.zeros(4,3)
b = torch.ones(3)
# print(a+b)  #这样会报错，正确做法如下
# print(torch.add(a, b))  #结果全是1，broadcast运算逻辑

c = torch.tensor([[1,2,3],[4,5,6],[7,8,9]])
d = torch.eye(3)
# print(torch.add(c,d))
# print(c+d)  #不采用broadcast逻辑时，这样也可以
# print(c*d)
# print(c/d)
# print(c**2) #平方
# print(c**0.5) #开平方

#矩阵相乘
# print(torch.matmul(torch.ones(3,3),torch.ones(3,3)))
# print(torch.ones(3,3)@torch.ones(3,3))  #用@的效果是一样的

#高维度的矩阵相乘
e = torch.rand(4,3,2,3)
f = torch.rand(4,3,3,5)
g = e@f
# print(g)
# print(g.shape)  #可以看到，本质上也是二维矩阵相乘的规律

#clamp算法
print(c.clamp(4))  #把小于4的值全部都替换成4

3.6 tensor的统计相关操作

import torch

#norm方法（求范数）
a = torch.arange(10,dtype=float)
b = a.view(2,5)
print(a.norm(1))
print(b.norm(1))

print(a.norm(2,dtype=float))  #同理求二范数
print(b)
print(b.norm(1,dim=1,dtype=float))  #求指定维度的范数

#求最大、最小、平均、求和
print(a.sum())
print(a.min())
print(a.max())
print(a.mean())

#top N的值
c = torch.tensor([1,2,3,3,4,4,4,5,5,5,5,6,8,8],dtype=float)
print(c.topk(3))
print(c.topk(3, largest=False))  #找到前N最小的值

print(c.kthvalue(4))  #找到第k小的值


#比较
print(a>4)
print(a!=8)

#where
cond = torch.tensor([[1,2],[3,4]],dtype=float)  #用where组合2个tensor
d = torch.zeros(2,2)
e = torch.ones(2,2)
print(torch.where(cond>2,d,e))

4. Tensor与计算图

PyTorch的Tensor结合了动态图模式，这意味着每一步运算都会被记录在后台的一个“计算图”中。当调用torch.autograd.backward()进行反向传播时，PyTorch会自动根据这个图来计算梯度。

关于计算图的说明可以参考我的另一篇博客：基于TorchViz详解计算图（附代码）

5. 结语

掌握PyTorch的Tensor是深度学习实践的第一步。了解其构造、操作和与计算图的互动，不仅能够提升我们的编程效率，更能使我们更好地理解和运用PyTorch这一强大工具，为深度学习项目的设计与实施打下坚实基础。在实际的深度学习项目中，Tensor不仅是数据的基本载体，更是实现复杂神经网络结构和优化算法的关键要素。