与神经网络模块或层一样,我们可以将这些GNN层堆叠在一起。
由于GNN不会更新输入图的连通性,因此可以使用与输入图相同的邻接列表和相同数量的特征向量来描述GNN的输出图。
构建了一个简单的GNN后,下一步就是考虑如何在上面描述的任务中进行预测。
首先考虑二分类的情况,这个框架也可以很容易地扩展到多分类或回归情况。如果任务是在图节点上进行二分类预测,并且图已经包含节点信息,那么对于每个节点embedding应用线性分类器即可。
实际情况可能更复杂,例如图形中的信息可能存储在边中,而且节点中没有信息,但仍然需要对节点进行预测。所以就需要一种从边收集信息并将其提供给节点进行预测的方法。
可以通过Pooling来实现这一点。Pooling分两步进行:对于要池化的每个item,收集它们的每个embedding并将它们连接到一个矩阵中,通常通过求和操作聚合收集的embedding。
更复杂地,可以通过在 GNN 层内使用池化来进行更复杂的预测,以使学习到的embedding更了解图的连通性。可以使用消息传递(Message Passing)来做到这一点,其中相邻节点或边缘交换信息并影响彼此更新的embedding。
消息传递包含三个步骤:
1、对于图中的每个节点,收集所有相邻节点embedding(或消息)。
2、通过聚合函数(如sum)聚合所有消息。
3、所有汇集的消息都通过一个更新函数传递,通常是一个学习的神经网络。
这些步骤是利用图的连接性的关键,还可以在GNN层中构建更复杂的消息传递变体,以产生更高表达能力的GNN模型。
本质上,消息传递和卷积是聚合和处理元素的邻居信息以更新元素值的操作。在图中,元素是节点,在图像中,元素是像素。然而,图中相邻节点的数量可以是可变的,这与图像中每个像素都有一定数量的相邻元素不同。通过将传递给GNN层的消息堆叠在一起,节点最终可以合并整个图形中的信息
节点学习完embedding后的下一步就是边。在真实场景中,数据集并不总是包含所有类型的信息(节点、边缘和全局上下文),当用户想要对节点进行预测,但提供的数据集只有边信息时,在上面展示了如何使用池将信息从边路由到节点,但也仅局限在模型的最后一步预测中。除此之外,还可以使用消息传递在GNN层内的节点和边之间共享信息。
可以采用与之前使用相邻节点信息相同的方式合并来自相邻边缘的信息,首先合并边缘信息,使用更新函数对其进行转换并存储。
但存储在图中的节点和边信息不一定具有相同的大小或形状,因此目前还没有一种明确有效的方法来组合他们,一种比较好的方法是学习从边空间到节点空间的线性映射,反之亦然。或者,可以在update函数之前将它们concatenate在一起。
最后一步就是获取全局的节点、边表示。
之前所描述的网络存在一个缺陷:即使多次应用消息传递,在图中彼此不直接连接的节点可能永远无法有效地将信息传递给彼此。对于一个节点,如果有k层网络,那么信息最多传播k步。
对于预测任务依赖于相距很远的节点或节点组的情况,这可能是一个问题。一种解决方案是让所有节点都能够相互传递信息。但不幸的是,对于大型的图来说,所需要的计算成本相当高,但在小图形中已经可以有所应用。
这个问题的一个解决方案是使用图(U)的全局表示,它有时被称为主节点或上下文向量。该全局上下文向量连接到网络中的所有其他节点和边,并可以作为它们之间传递信息的桥梁,为整个图形建立表示。这可以创建一个比其他方法更丰富、更复杂的图形表示。
从这方面来看,所有的图形的属性都已经学习到了对应的表示,因此可以通过调整感兴趣的属性相对于其余属性的信息在池中利用它们。例如对于一个节点,可以考虑来自相邻节点、连接边和全局信息的信息。为了将新节点嵌入到所有这些可能的信息源上,还可以简单地将它们连接起来。此外,还可以通过线性映射将它们映射到同一空间,并应用特征调节层(feature-wise modulation layer)。
通过上述流程,相信大家已经对简单的GNN如何发展为sota模型有了了解。在获取图的节点、边表示后,就可以为之后的任务再单独设计网络,GNN为神经网络提供了一种处理图数据的方式。
在原文博客中,还包括一些GNN的真实案例和数据集,并了解GNN在其中的具体作用,想了解更多内容可以访问参考链接进行阅读。