中国人工智能学会通讯——当知识图谱“遇见”深度学习 1.2 知识图谱作为深度学习的输入-阿里云开发者社区

开发者社区> 行者武松> 正文

中国人工智能学会通讯——当知识图谱“遇见”深度学习 1.2 知识图谱作为深度学习的输入

简介:
+关注继续查看

1.2 知识图谱作为深度学习的输入

知识图谱是人工智能符号主义近期进 展的典型代表。知识图谱中的实体、概念 以及关系均采用了离散的、显式的符号化 表示。而这些离散的符号化表示难以直接 应用于基于连续数值表示的神经网络。为 了让神经网络有效利用知识图谱中的符号 化知识,研究人员提出了大量的知识图谱 的表示学习方法。知识图谱的表示学习旨 在习得知识图谱的组成元素 ( 节点与边 ) 的 实值向量化表示。这些连续的向量化表示 可以作为神经网络的输入,从而使得神经 网络模型能够充分利用知识图谱中大量存 在的先验知识。这一趋势催生了对于知识 图谱的表示学习的大量研究。本章首先简 要回顾知识图谱的表示学习,再进一步介 绍这些向量表示如何应用到基于深度学习 模型的各类实际任务中,特别是问答与推 荐等实际应用。

1. 知识图谱的表示学习

image
image
image

除了上述两类典型知识图谱表示学习 模型之外,还有大量的其他表示学习模型。 比如,Sutskever 等人使用张量因式分解和 贝叶斯聚类来学习关系结构。Ranzato 等人 引入了一个三路的限制玻尔兹曼机来学习 知识图谱的向量化表示,并通过一个张量 加以参数化。

当前主流的知识图谱表示学习方法仍 存在各种各样的问题,比如不能较好刻画 实体与关系之间语义相关性、无法较好处 理复杂关系的表示学习、模型由于引入大 量参数导致过于复杂,以及计算效率较低 难以扩展到大规模知识图谱上等等。为了 更好地为机器学习或深度学习提供先验知 识,知识图谱的表示学习仍是一项任重道 远的研究课题。

2. 知识图谱向量化表示的应用

应用 1 问答系统。自然语言问答是人 机交互的重要形式。深度学习使得基于问 答语料的生成式问答成为可能。然而目前 大多数深度问答模型仍然难以利用大量的 知识实现准确回答。Yin 等人针对简单事实 类问题,提出了一种基于 encoder-decoder 框架,能够充分利用知识图谱中知识的深 度学习问答模型 [4]。在深度神经网络中,一 个问题的语义往往被表示为一个向量。具 有相似向量的问题被认为是具有相似语义。 这是联结主义的典型方式。另一方面,知 识图谱的知识表示是离散的,即知识与知 识之间并没有一个渐变的关系。这是符号 主义的典型方式。通过将知识图谱向量化, 可以将问题与三元组进行匹配 ( 也即计算 其向量相似度 ),从而为某个特定问题找到 来自知识库的最佳三元组匹配。匹配过程 如图 1 所示。对于问题 Q:“How tall is YaoMing?”,首先将问题中的单词表示为向量 数组 HQ。进一步寻找能与之匹配的知识图 谱中的候选三元组。最后为这些候选三元 组,分别计算问题与不同属性的语义相似 度。其由以下相似度公式决定:

image

image

应用 2 推荐系统。个性化推荐系统是 互联网各大社交媒体和电商网站的重要智 能服务之一。随着知识图谱的应用日益广 泛,大量研究工作意识到知识图谱中的知 识可以用来完善基于内容的推荐系统中对 用户和项目的内容(特征)描述,从而提 升推荐效果。另一方面,基于深度学习的 推荐算法在推荐效果上日益优于基于协同 过滤的传统推荐模型 [5]。但是,将知识图谱 集成到深度学习的框架中的个性化推荐的 研究工作,还较为少见。Zhang 等人做出了 这样的尝试。作者充分利用了结构化知识 ( 知识图谱 )、文本知识和可视化知识(图 片)[6] 三类典型知识。作者分别通过网络嵌 这里,S(Q,τ) 表示问题 Q 与候选三元组 τ 的 相似度;xQ 表示问题的向量 ( 从 HQ 计算而 得 ),uτ 表示知识图谱的三元组的向量,M 是待学习参数。 入(network embedding)获得结构化知识 的向量化表示,然后分别用 SDAE(Stacked Denoising Auto-Encoder)和层叠卷积自编 码 器 (stacked convolution- autoencoder) 抽 取文本知识特征和图片知识特征;并最终 将三类特征融合进协同集成学习框架,利 用三类知识特征的整合来实现个性化推荐。 作者针对电影和图书数据集进行实验,证 明了这种融合深度学习和知识图谱的推荐 算法具有较好性能。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
+关注
行者武松
杀人者,打虎武松也。
17142
文章
2569
问答
文章排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载