爱因斯坦求和约定含代码-阿里云开发者社区

爱因斯坦求和约定含代码

2024-05-13 153

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 爱因斯坦求和约定含代码

一、简介

爱因斯坦求和约定(Einstein summation convention)是一种标记的约定, 又称为爱因斯坦标记法(Einstein notation), 可以基于一些约定简写格式表示多维线性代数数组操作，让表达式更加简洁明了，比如通过省略求和符号。

我们先来看两个概念，自由标和哑标：

1.自由标

自由标是在表达式的两边都出现，并且不遵循求和约定的指标。自由标用于指示表达式结果中保留的维度。在爱因斯坦求和约定中，自由标的顺序决定了结果张量的维度顺序。下图中i是自由标、j是哑标。

爱因斯坦和表示为

2.哑标

哑标是在表达式的同一边出现两次的指标，遵循求和约定，即对这个指标进行求和。它在张量运算中仅仅是起到一个辅助的作用，并不影响最终结果的形状，相同的哑标表示对应位置进行求和。下图中的i和j都是哑标。

总的来说，自由标用于表示张量运算的结果的维度，而哑标则是进行求和操作时的辅助指标。

二、torch实现

Einsum在torch、tf和numpy中都有实现，而且用方式差不多，这里我们以torch为例，使用torch.einsum方法。

总体思想是用一些下标标记输入的每个维度，并定义哪些下标是输出的一部分。然后，通过将操作中下标不属于输出的维度的元素先乘积再求和来计算输出。下面是一些例子，还是很好理解的。

值得注意的是torch.einsum会自动调整张量的乘法顺序以匹配所需的乘法操作，并且会自动处理张量的维度匹配。因此，无论参数的顺序如何，都会得到相同的结果。

1.计算迹

torch.einsum('ii', torch.randn(4, 4))
# tensor(-1.2104)

ii表示对第一个维度和第二个维度取相同的索引值，并对所有这些索引值的元素进行求和。在一个方阵中，就是对其对角线上的元素求和。没有显式的输出就是先求和再输出。

2.取矩阵对角线

torch.einsum('ii->i', torch.randn(4, 4))
# tensor([-0.1034,  0.7952, -0.2433,  0.4545])

ii表示对张量的第一个维度和第二个维度取相同的索引值，并对所有这些索引值的元素进行操作。而 ->i 表示我们希望得到的输出张量的形状是一个一维张量，其中包含对每个索引值进行操作后的结果。

3.计算外积

x = torch.randn(5)
y = torch.randn(4)
torch.einsum('i,j->ij', x, y)
# tensor([[ 0.1156, -0.2897, -0.3918,  0.4963],
#         [-0.3744,  0.9381,  1.2685, -1.6070],
#         [ 0.7208, -1.8058, -2.4419,  3.0936],
#         [ 0.1713, -0.4291, -0.5802,  0.7350],
#         [ 0.5704, -1.4290, -1.9323,  2.4480]])

i 和 j 表示两个张量 x 和 y 的维度。标记中的箭头 ->ij 表示我们希望得到的输出张量的形状是一个二维张量，其中第一个维度的大小与 x 张量的大小相同，第二个维度的大小与 y 张量的大小相同。

i,j->ij表示对两个张量 x 和 y 进行乘法操作，并返回一个形状为 (len(x), len(y)) 的二维张量，其中的每个元素是两个输入张量对应位置元素的乘积，即外积。

4.batch矩阵乘法

As = torch.randn(3,2,5)
Bs = torch.randn(3,5,4)
torch.einsum('bij,bjk->bik', As, Bs)
# tensor([[[-1.0564, -1.5904,  3.2023,  3.1271],
#          [-1.6706, -0.8097, -0.8025, -2.1183]],
# 
#         [[ 4.2239,  0.3107, -0.5756, -0.2354],
#          [-1.4558, -0.3460,  1.5087, -0.8530]],
# 
#         [[ 2.8153,  1.8787, -4.3839, -1.2112],
#          [ 0.3728, -2.1131,  0.0921,  0.8305]]])

bij 和 bjk 分别代表两个输入张量 As 和 Bs 的维度。bik 表示我们希望得到的输出张量的形状。

bij,bjk->bik表示对两个张量 As 和 Bs 进行乘法操作，并返回一个形状为 (b, i, k) 的张量，其中 b 是批量大小，i 是 As 张量的第二个维度大小，k 是 Bs 张量的第三个维度大小。

一行代码，将转置和乘法放在一起，确实很方便。

5.带有子列表和省略号

As = torch.randn(3,2,5)
Bs = torch.randn(3,5,4)
torch.einsum(As, [..., 0, 1], Bs, [..., 1, 2], [..., 0, 2])
# tensor([[[-1.0564, -1.5904,  3.2023,  3.1271],
#          [-1.6706, -0.8097, -0.8025, -2.1183]],
# 
#         [[ 4.2239,  0.3107, -0.5756, -0.2354],
#          [-1.4558, -0.3460,  1.5087, -0.8530]],
# 
#         [[ 2.8153,  1.8787, -4.3839, -1.2112],
#          [ 0.3728, -2.1131,  0.0921,  0.8305]]])

[..., 0, 1] 表示对 As 进行切片操作。省略号 ... 表示我们不关心其他的维度，而 [0, 1] 表示我们选择 As 张量的最后两个维度。

[..., 1, 2] 表示对 Bs 进行切片操作。同样，省略号 ... 表示其他的维度不变，而 [1, 2] 表示我们选择 Bs 张量的最后两个维度。

[..., 0, 2] 表示我们希望得到的输出张量的形状。同样，省略号 ... 表示其他的维度不变，而 [0, 2] 表示我们选择输出张量的倒数第二个维度和最后一个维度。

所以下面的代码表示对输入张量 As 和 Bs 进行一系列切片操作，并对结果进行乘法和求和，最后返回一个输出张量，其形状与输入张量的形状相同，但最后两个维度的顺序交换了位置。

6.变换维度

A = torch.randn(2, 3, 4, 5)
torch.einsum('...ij->...ji', A).shape
# torch.Size([2, 3, 5, 4])

...ij表示输入张量 A 的维度。省略号 ... 表示可以匹配任意数量的维度，而 'ij' 表示张量中的最后两个维度。

->...ji表示我们希望得到的输出张量的形状，其维度与输入张量的维度相同，但是最后两个维度交换了位置。

...ij->...ji 表示对输入张量 A 进行转置操作。

7.双线性变换，类似于torch.nn.functional.bilinear

l = torch.randn(2,5)
A = torch.randn(3,5,4)
r = torch.randn(2,4)
torch.einsum('bn,anm,bm->ba', l, A, r)
# tensor([[-0.3430, -5.2405,  0.4494],
#         [ 0.3311,  5.5201, -3.0356]])

这个比较复杂，计算步骤如下：

a.bn和bm中的b表示l和r在这个维度上是相同的，所以会对这个维度进行广播操作，得到中间值：维度(2,5,4),即(b,n,m)

b.A维度(a,n,m)中的n和m与中间值的n和m相对应，表示在这两个维度上进行乘法操作。

c.对n和m维度上的结果进行求和，得到最终的输出张量，其形状由->ba指定，即(2, 3)。

这个例子有点绕，在实际工作中也不会经常遇到，还是建议大家把逻辑写的可读性强一点，这样以后的你会感激现在的自己。

爱因斯坦求和约定就介绍到这里，点个关注不迷路(#^.^#)！

爱因斯坦求和约定含代码

一、简介

1.自由标

2.哑标

二、torch实现

1.计算迹

2.取矩阵对角线

3.计算外积

4.batch矩阵乘法

5.带有子列表和省略号

6.变换维度

7.双线性变换，类似于torch.nn.functional.bilinear

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

直播

下载

镜像站

技术资料

爱因斯坦求和约定 含代码

一、简介

1.自由标

2.哑标

二、torch实现

1.计算迹

2.取矩阵对角线

3.计算外积

4.batch矩阵乘法

5.带有子列表和省略号

6.变换维度

7.双线性变换，类似于torch.nn.functional.bilinear

热门文章

最新文章

相关电子书

爱因斯坦求和约定含代码