图相关基础知识
23-10-13 周五
图数据数据类型的常见的类别
- 同构图:同构图是指图中的节点类型和关系类型都仅有一种。同构图是实际图数据的一种最简化的情况,如由超链接关系所构成的万维网,这类图数据的信息全部包含在邻接矩阵里。
- 异构图:与同构图相反,异构图是指图中的节点类型或关系类型多于一种。在现实场景里,我们通常研究的图数据对象是多类型的,对象之间的交互关系也是多样化的。因此,异构图能够更好地贴近现实。
- 属性图:相较于异构图,属性图给图数据增加了额外的属性信息。对于一个属性图而言,节点和关系都有标签(label)和属性(property),这里的标签是指节点或关系的类型,如某节点的类型是用户,属性是节点或关系的附加描述信息,如“用户”节点可以有“姓名”“注册时间”“注册地址”等属性。属性图是一种最常见的工业级图数据的表示方式,能够广泛的适用于多种业务场景下的数据表达。
- 非显示图:非显示图是指数据之间没有显示地定义出关系,需要根据某种规则或计算方式将数据的关系表达出来,进而将数据当成一种图数据进行研究。比如计算机3D视觉中的点云数据,如果我们将节点之间的空间距离转化为关系的话,点云数据就成了图数据。
GNN中的聚合
在图神经网络(Graph Neural Network,GNN)中,"聚合"(Aggregation)是指将节点的邻居信息合并或组合成一个新的表示形式,以便更好地理解节点之间的关系和进行图数据的学习。聚合操作是 GNN 中的关键步骤,它有助于节点在图中传播信息、学习节点的表示,从而用于各种图数据相关任务,如节点分类、链接预测、推荐系统等。
通常,聚合操作包括以下关键步骤:
- 邻居信息汇总:首先,对于每个节点,GNN会考虑其邻居节点的信息。这可以是邻居节点的特征,或者是它们的表示形式。
- 信息合并:然后,GNN将邻居节点的信息进行合并或聚合,通常通过采用某种函数或操作来组合邻居信息。这个函数可以是求和、平均值、拼接、加权和等。
- 节点更新:最后,通过将聚合后的信息与节点自身的信息相结合,得到节点的新表示形式。这个新的表示将包含节点自身的特征以及邻居节点的信息。这个更新的表示可以用于进一步的图神经网络层或者用于特定的任务。
不同的 GNN 模型可能使用不同的聚合函数和策略。常见的 GNN 模型包括Graph Convolutional Networks (GCN)、GraphSAGE、GAT (Graph Attention Networks) 等,它们在如何聚合邻居信息上有不同的方法和权衡。
总之,聚合在图神经网络中是将节点的邻居信息合并为节点的新表示形式的过程,以便在图数据上进行信息传播和学习节点的特征,从而实现各种图数据相关任务。