图注意力网络

2022-06-08 186

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 图注意力网络

论文标题：GRAPH ATTENTION NETWORKS

论文链接：https://arxiv.org/abs/1710.10903

论文来源：ICLR 2018

一、概述

为了将卷积操作泛化到图数据上，研究人员做了一些努力。一些基于频域图卷积的GCN被研发了出来，然而在所有这些方法中，卷积核都依赖于拉普拉斯特征基，也就是依赖于图结构。也就是说，在一个特定图结构上训练的GCN无法被应用在其他不同的结构上，因此GCN的方法是transductive的。另外一些空域上的图卷积方法也存在，这些方法面临的挑战是处理不同size的邻域并且保持CNN的参数共享特性。

在许多基于序列的任务中，注意力机制几乎已经成为事实上的标准。注意力机制的一个好处是可以处理可变大小的输入，然后通过关注在最相关的部分来做出决策。当一个注意机制被用来计算一个单一序列的表示时，它通常被称为self-attention或者intra-attention。

本文提出了一种基于注意力机制的网络架构来处理图结构的数据，称为graph attention networks(GATs)，主要思想是借助self-attention机制通过attend到节点的邻域来计算每个节点的隐层表示。这种基于注意力机制的架构有以下几个特点：

①操作是高效的，因为在节点的邻域之间以及节点之间都是并行化的；

②能够应用到不同节点度的图节点上；

③能够直接应用到inductive学习问题，包括需要泛化到完全未见图上的任务。

二、方法

图注意力层

9(YEYFZKXGPJ5@WOHAJUNAM.png

]3T42X86XUJDIQ~AH{2]8[7.png

[XT4EF}ELY`[~_6)P9)4[B3.png

需要注意的是，我们模型的感受野的大小是由网络的深度所决定的。跳跃连接等技术可以很容易地用于适当扩展深度。

上述注意力机制以及multi-head输出的聚合过程，如下图所示：

99)[9E5QARU@9~7K20(4X)E.png

图示

相关工作对比

GAT解决了以往方法中存在的一些问题：

①计算上GAT是高效的，无论是对于所有的边的计算还是输出特征的所有节点的计算，都是并行化的。不需要特征分解或类似的代价高昂的矩阵运算。一个注意力head的计算复杂度为 }6JF5DJO$T$(OC[8]H5YI@C.png 是图中节点和边的数量，这种复杂度与GCN相当。

②与GCN不同，GAT允许对邻域节点的不同重要性，这提升了模型的容量。另外，注意力权重可以对模型的可解释性有一定的帮助。

③注意机制以共享的方式应用于图中的所有边，因此它不依赖于对全局图结构或所有节点(特征)的预先访问(这是许多先前技术的限制)。具体来说，首先不要求边是无向的，另外GAT可以直接应用于inductive学习，即使模型在完全未见图上进行测试。

④GraphSAGE的方法在邻域中采集固定样本，并且最有效的LSTM聚合函数的版本假设了邻域节点存在顺序。GAT并没有上述问题，GAT能够在节点的所有邻域上进行操作，并且没有假设节点的顺序。

⑤与之前MoNet方法相比，我们的模型使用节点特征进行相似性计算，而不是节点的结构属性(这将假设预先知道图结构)。

三、实验

本文在Cora，Citeseer，Pubmed，PPI四个数据集上进行实验。其中前三个是transductive的数据集，PPI是inductive的数据集。数据集情况如下：

LD_$`)$QI@99W$60DCUMIUI.png

数据集

transductive实验结果如下：

M6~[4SX~`]}9YNQ`]}9]PPQ.png

transductive

inductive实验结果如下：

YFU$ZQBAG~]VE8QWAWEJ@QA.png

inductive

最后使用t-SNE可视化了一下在Cora数据集上的GAT第一层的特征：

$$BY42B_$XN}EC[}JE7V4TE.png

可视化

图注意力网络

一、概述

二、方法

三、实验

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

图注意力网络

一、概述

二、方法

三、实验

热门文章

最新文章

相关课程

相关电子书

相关实验场景