1. Background & Motivation
很多图表示学习框架,如DeepWalk、LINE、node2vec等,都是参考了NLP中word2vec思路实现的。这免于了设计网络特征,直接学习隐特征。
下游任务:节点分类,聚类,similarity search12
(在介绍相关研究工作的时候,感觉Predictive Text Embedding (PTE)这个模型可能以后也需要去看一下)
(related work小节没看)
2. 模型
(以下负采样等具体细节不赘)
2.1 metapath2vec
DeepWalk和node2vec用随机游走获取上下文信息,用skip-gram模型学习节点表征:
异质图skip-gram:
在异质图上直接进行随机游走可能会严重biased,因此使用metapath
metapath定义:
关于metapath开头和结尾节点是不是必须得是同一种:按这说法应该是
2.2 metapath2vec++
3. 实验
3.1 数据集
AMiner
DBIS
3.2 baseline
DeepWalk/node2vec
LINE
PTE
Spectral Clustering/Graph Factorization:直接就没拿来比了
3.3 实验设置
略
3.4 multi-class节点分类
3.5 节点聚类
3.6 案例分析:similarity search
3.7 Scalability
4. Future Work
- 中间输出太大
- 自动学习metapath
- 应用到动态图上
- 泛化到其他领域