12.50 知识图谱研究综述
知识图谱(Knowledge Graph, KG)旨在描述客观世界的概念、实体、事件及其之间的关系。其中,概念是指人们在认识世界过程中形成对客观事物的概念化表示,如人、动物、组织机构等;实体是客观世界中具体事物,如篮球运动员姚明、互联网公司腾讯等;事件是客观世界的活动,如地震、买卖行为等。关系描述概念、实体、事件之间客观存在的关联关系,如毕业院校描述了一个人与他学习所在学校之间的关系,运动员和篮球运动员之间的关系是概念和子概念之间的关系等。谷歌于 2012 年 5月推出谷歌知识图谱,并在其搜索引擎中增强搜索结果,标志着大规模知识在互联网语义搜索中的成功应用。
知识图谱将互联网的信息表达成更接近人类认知世界的形式,提供了一种更好地组织、管理和理解互联网海量信息的能力。知识图谱给互联网语义搜索带来了活力,同时也在智能问答、大数据分析与决策中显示出强大威力,已经成为互联网基于知识的智能服务的基础设施。知识图谱与大数据和深度学习一起,成为推动人工智能发展的核心驱动力之一。
知识图谱技术是指在建立知识图谱中使用的技术,是融合认知计算、知识表示与推理、信息检索与抽取、自然语言处理与语义 Web、数据挖掘与机器学习等交叉研究。知识图谱研究,一方面探索从互联网语言资源中获取知识的理论和方法;另一方面促进知识驱动的语言理解研究。随着大数据时代的到来,研究从大数据中挖掘隐含的知识理论与方法,将大数据转化为知识,增强对互联网资源的内容理解,将促进当代信息处理技术从信息服务向知识服务转变。具体地,知识图谱技术包括知识表示、知识图谱构建和知识图谱应用三方面的研究内容。
● 知识表示研究客观世界知识的建模,以便于机器识别和理解,既要考虑知识的表示与存储,又要考虑知识的使用和计算。
● 知识图谱构建解决如何建立计算机算法,从客观世界或者互联网的各种数据资源中获取客观世界的知识,主要研究使用什么样的数据和什么样的方法抽取什么样的知识。
● 知识图谱应用主要研究如何利用知识图谱,建立基于知识的系统并提供智能的知识服务,更好地解决实际应用问题。
下面,我们首先归类总结目前已有的一些知识图谱资源,然后逐一介绍上述三个方面的研究思路和进展。