【Pytorch写代码技巧--Einsum】Einsum详解+常用写法

2023-06-21 650

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

智能开放搜索 OpenSearch行业算法版，1GB 20LCU 1个月

实时计算 Flink 版，5000CU*H 3个月

实时数仓Hologres，5000CU*H 100GB 3个月

简介： 不知大家在看论文代码的时候是否会常常看见 torch.einsum()，这玩意儿看起来是真的抽象，但是深入了解后发现它原来这么好用。

不知大家在看论文代码的时候是否会常常看见 torch.einsum()，这玩意儿看起来是真的抽象，但是深入了解后发现它原来这么好用。不知大家在看论文代码的时候是否会常常看见 torch.einsum()，这玩意儿看起来是真的抽象，但是深入了解后发现它原来这么好用

一、Introeduction

einsum真名叫做爱因斯坦求和约定，用于简洁的表示转置、内积、外积、各种求和

先看看以下这个例子，有这样的一段代码

R=torch.einsum('ik,jk->ij',A,B)

在Einsum中，箭头从左边到右边消失了什么参数，那公式前就加一个带什么参数的求和符。本案例中消失了k，因此我们需要在加上对带k的求和符，转化为数学公式如下

编辑

对数学敏感的小伙伴可能已经知道这个公式代表什么意思了，但是作为像博主这样愚钝的还是画图看看是什么东西

画完图之后我们可以直观的知道这就是将两个矩阵每行向量进行求内积

此外，它的底层代码就是套了很多层的for循环，如果我们不用Einsum来实现以上的功能估计要写半天了

二、Skill

是不是感觉上面的公式很简单神奇，是的Einsum诞生的初衷就是为了简化矩阵的运算，因此博主记录了以下几个常用的矩阵运算用Einsum来实现。假设有以下四个矩阵

编辑

# 行之和
R=torch.einsum('ij->i',A)
# 列之和
R=torch.einsum('ij->j',A)
# 某维度之和
R=torch.einsum('ijklmn->n',D)

# 所有元素之和
R=torch.einsum('ijklmn->',D)

# 转置
R=torch.einsum('ij->ji',A)

# 内积
R=torch.einsum('ij,jk->ik',A,B)

# 外积
R=torch.einsum('ij,ik->jk',A,C)