图采样
为什么要图采样?
数据太多,无法一次性送入计算资源。
借鉴MiniBatch的思想
但是:
传统深度学习
单batch为若干个样本
样本之间无依赖,多层样本计算量固定
图神经网络
batch为若干个节点
节点之间相互依赖,多层节点计算量爆炸
什么是图采样?
!子图采样而不是随机采样
GraphSAGE(SAmple&aggreGatE)
1.邻居采样
2.邻居聚合
3.节点分类
邻居采样的优点
考虑:
采样是只能选取真实的邻居节点吗?
PinSAGE
通过多次随机游走,按游走经过的频率选取邻居。
概念:虚拟邻居
可以更加快速的聚合到多阶的信息
邻居聚合
单射
评估聚合表达能力的指标单射(一对一映射)
单射可以保证对聚合后的结果可区分
基于单射的Graph Isomorphism Net (GIN)模型
保证中心节点和邻居节点可区分
语义场景