cs224w(图机器学习)2021冬季课程学习笔记12 Knowledge Graph Embeddings

简介: cs224w(图机器学习)2021冬季课程学习笔记12 Knowledge Graph Embeddings

本章主要内容:

本章首先介绍了 异质图heterogeneous graph 和 relational GCN (RGCN)。

接下来介绍了 知识图谱补全knowledge graph completion 任务,以及通过图嵌入方式的四种实现方式及其对关系表示的限制:TransE,TransR,DistMult,ComplEx。


1. Heterogeneous Graphs and Relational GCN (RGCN)


  1. 本节课任务:

之前课程的内容都囿于一种边类型,本节课拓展到有向、多边类型的图(即异质图)上。

介绍RGCN,知识图谱,知识图谱补全任务的表示方法。

image.png

图的节点和边都可以是异质的


  1. image.png


  1. 异质图举例:生物医学知识图谱或事件图

image.png


  1. Relational GCN

将GCN2拓展到异质图上

  • 从只有一种边类型的有向图开始:通过GCN学习节点A的表示向量,即沿其入边形成的计算图进行信息传播(message + aggregation)。

image.png

  • 对于有多种边类型的情况:在信息转换时,对不同的边类型使用不同的权重 W

image.png

image.png

image.png

  • Relation GCN定义

image.png

image.png


  1. RGCN的scalability

image.png

image.png

image.png

image.png

image.png

image.png


  1. 示例

image.png

image.png


  1. 链接预测

在异质图中,将每种关系对应的边都分成 training message edges, training supervision edges, validation edges, test edges 四类5(切分每种关系所组成的同质图)。

这么分是因为有些关系类型的边可能很少,如果全部混在一起四分的话可能有的就分不到(比如分不到验证集里……之类的)

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png


  1. 总结
  • Relational GCN:用于异质图的图神经网络模型
  • 可用于实体分类和链接预测任务
  • 类似思想可以扩展到其他RGNN模型上(如RGraphSAGE,RGAT等)

image.png


2. Knowledge Graphs: KG Completion with Embeddings


  1. 知识图谱 Knowledge Graphs (KG)

以图形式呈现的知识

捕获实体entity(节点)、类型(节点标签)、关系relationship(边)

一种异质图实例

image.png


  1. 示例
  • bibliographic networks

bibliographic书目的;书籍解题的;著书目录的

通过定义节点类型、关系类型及其之间的关系,得到如图所示的schema :

image.png

  • bio knowledge graphs

image.png

adverse event 不良反应

pathway 总之是个专业术语,过程、反应之类的10


  1. 知识图谱应用实例(就我本来想把这些介绍网址啥的列出来的,但我最近不能上某些网站了,而且我又现在不用,就先直接截图了。以后有缘可以搞一下。如果真的有读者看到这里而且有这样需求的话也可以戳我催更)

image.png

image.png

image.png


  1. 公开可用的知识图谱有:FreeBase, Wikidata, Dbpedia, YAGO, NELL, etc.

这些知识图谱的共同特点是:大,不完整(缺少很多真实边)

对于一个大型KG,几乎不可能遍历所有可能存在的事实,因此需要预测可能存在却缺失的边

image.png


  1. 举例:Freebase

大量信息缺失

有 complete 的子集供研究KG模型

image.png


3. Knowledge Graph Completion: TransE, TransR, DistMult, ComplEx


  1. 知识图谱补全 KG Completion Task

已知 (head, relation),预测 tails(注意,这跟链接预测任务有区别,链接预测任务是啥都不给,直接预测哪些链接最有可能出现)

举例:已知(JK罗琳,作品流派),预测 tail “科幻小说”

image.png


  1. 在本节课中使用 shallow encoding12 的方式来进行图表示学习,也就是用固定向量表示图数据

(虽然这里不用GNN,但是如果愿意的话也可以用)


  1. image.png

image.png


  1. TransE

image.png

image.png



  1. TransE的算法

简单来说,我没看懂。大致来讲过程是这样的:

20210702180649244.png

初始化部分我没看懂,以后再研究。

更新参数时使用的是 contrastive loss,总之大意就是最小化真三元组的距离(也就是最大化真三元组的score或相似性)、最大化假三元组的距离

image.png


  1. KG中关系的模式 Connectivity Patterns in KG

在KG中,关系可能有多种属性,我们接下来就要探讨KG嵌入方法(如TransE等)能否建模、区分开这些关系模式:

image.png

image.png

20210702182835539.png


  1. image.png


  1. image.png


  1. image.png


  1. image.png


  1. image.png


  1. image.png

image.png

image.png


  1. image.png


  1. image.png


  1. image.png


  1. image.png


  1. image.png


  1. image.png

image.png


  1. DistMult

image.png


  1. image.png

image.png


  1. image.png


  1. image.png


  1. image.png


  1. image.png


  1. image.png

image.png

image.png


  1. image.png


  1. image.png


  1. image.png


  1. image.png


  1. 所有模型的表示能力对比:

image.png


  1. 知识图谱嵌入问题的实践应用22


  • 不同知识图谱可能会有很不同的关系模式
  • 因此没有适合所有KG的嵌入方法,可用上表来辅助选择
  • 可以先试用TransE来迅速获得结果(如果目标KG没有过多symmetric relations的话)
  • 然后再用更有表示能力的模型,如ComplEx或RotatE22(复数域的TransE)等

image.png


  1. 总结
  • 链接预测或图补全任务是知识图谱领域的重要研究任务
  • 介绍了不同嵌入域和不同表示能力的模型

TransE

TransR

DistMult

ComplEx


相关文章
|
2月前
|
机器学习/深度学习 计算机视觉 Python
模型预测笔记(三):通过交叉验证网格搜索机器学习的最优参数
本文介绍了网格搜索(Grid Search)在机器学习中用于优化模型超参数的方法,包括定义超参数范围、创建参数网格、选择评估指标、构建模型和交叉验证策略、执行网格搜索、选择最佳超参数组合,并使用这些参数重新训练模型。文中还讨论了GridSearchCV的参数和不同机器学习问题适用的评分指标。最后提供了使用决策树分类器进行网格搜索的Python代码示例。
151 1
|
4月前
|
机器学习/深度学习 算法 Python
【绝技揭秘】Andrew Ng 机器学习课程第十周:解锁梯度下降的神秘力量,带你飞速征服数据山峰!
【8月更文挑战第16天】Andrew Ng 的机器学习课程是学习该领域的经典资源。第十周聚焦于优化梯度下降算法以提升效率。课程涵盖不同类型的梯度下降(批量、随机及小批量)及其应用场景,介绍如何选择合适的批量大小和学习率调整策略。还介绍了动量法、RMSProp 和 Adam 优化器等高级技巧,这些方法能有效加速收敛并改善模型性能。通过实践案例展示如何使用 Python 和 NumPy 实现小批量梯度下降。
45 1
|
6月前
|
机器学习/深度学习 算法 BI
机器学习笔记(一) 感知机算法 之 原理篇
机器学习笔记(一) 感知机算法 之 原理篇
|
6月前
|
机器学习/深度学习 搜索推荐 PyTorch
【机器学习】图神经网络:深度解析图神经网络的基本构成和原理以及关键技术
【机器学习】图神经网络:深度解析图神经网络的基本构成和原理以及关键技术
1353 2
|
6月前
|
机器学习/深度学习 算法 数据可视化
技术心得记录:机器学习笔记之聚类算法层次聚类HierarchicalClustering
技术心得记录:机器学习笔记之聚类算法层次聚类HierarchicalClustering
65 0
|
6月前
|
机器学习/深度学习 分布式计算 API
技术好文:Spark机器学习笔记一
技术好文:Spark机器学习笔记一
48 0
|
7月前
|
机器学习/深度学习 自然语言处理 PyTorch
fast.ai 机器学习笔记(四)(1)
fast.ai 机器学习笔记(四)
143 1
fast.ai 机器学习笔记(四)(1)
|
7月前
|
机器学习/深度学习 监控 算法
LabVIEW使用机器学习分类模型探索基于技能课程的学习
LabVIEW使用机器学习分类模型探索基于技能课程的学习
57 1
|
7月前
|
机器学习/深度学习 算法 图计算
图机器学习入门:基本概念介绍
图机器学习是机器学习的分支,专注于处理图形结构数据,其中节点代表实体,边表示实体间关系。本文介绍了图的基本概念,如无向图与有向图,以及图的性质,如节点度、邻接矩阵。此外,还讨论了加权图、自循环、多重图、双部图、异构图、平面图和循环图。图在描述数据关系和特征方面具有灵活性,为机器学习算法提供了丰富的结构信息。
184 0
|
7月前
|
机器学习/深度学习 Python 索引
fast.ai 机器学习笔记(二)(4)
fast.ai 机器学习笔记(二)
62 0
fast.ai 机器学习笔记(二)(4)