开发者学习笔记【阿里云人工智能工程师ACA认证(2023版):知识图谱】
课程地址:https://edu.aliyun.com/course/3112108/lesson/19288
知识图谱
课程目标
学习完成本课程后,你将了解以下内容:
一、根据图谱的属性和结构,区分图谱与知识图谱
二、能够根据用户的输入与输出区分三种机器翻译的常用功能(文字翻译、语音翻译、回译技术)
三、理解智能机器人的定义及其分类(传感型、交互型、自主型)
四、依据智能程度区分自动驾驶的等级,并列举出自动驾驶的软硬件系统的包含内容
五、区分智能搜索引擎与搜索引擎
六、理解智能推荐系统实现流程及关键技术(如数据管理和推荐算法)
目录:
一、知识图谱
二、机器翻译
三、智能机器人
四、自动驾驶
五、智能开放搜索
六、智能推荐
课堂引言:
一、问题
在学习知识图谱之前,大家先想想,我们在看影视剧或者小说时,若其中的人物很多、人物关系复杂,我们一般会用什么来表示?
二、答案
在人物很多、关系复杂的影视剧或者小说中一般用人物关系图谱来表示。知识与知识之间也有各种各样的关系,知识的关系错综复杂,有些知识与知识之间的关系存在知识。在计算机里表示知识或对知识进行运算时可以用知识图谱(参照人物关系图谱)。
内容介绍:
一、知识图谱的定义
二、知识图谱的搭建
三、知识图谱的应用
一、知识图谱的定义
1.知识的定义
(1)知识是人类对信息进行处理之后的认识和理解。知识是人类在实践中认识客观事件包括人类自身的成果。它包括事实、信息、描述以及在教育和实践中获得的技能。
(2)知识是对数据和信息的凝炼、总结后的成果。知识是人类各个途径获得的经过提升的、总结的、凝练的、系统的认知。可以理解为,把人类作为一个整体来看知识就是人类对信息、数据进行认知和理解。
(3)例子
960万平方公里是一个客观存在的孤立的、无任何意义的数据,仅表达客观事实。当960万变为“中国的国土面积960万平方公里”,此时它是一个有用的信息,是事实性的陈述,属于信息的范畴。而知识是对信息层面的抽象和归纳,把信息整合起来,变成“对我国国土面积的一个认知”。
2.图谱的定义
(1)图谱是一些事物与另一些事物之间互相连接的结构。
(2)图谱通常由一些结点和连接这些节点的边组成。
(3)实体(节点)指的是现实世界中的事物
(4)关系(边)则用来表达不同实体之间的某种联系。
在计算机中有许多类似的概念。在数据结构中的链表二叉树还有其他重要的图。学习数据库时经常分析实体与实体之间的关系。图谱是一个抽象的事物,是事物与事物之间相互连接、关系的表达方式。在图谱中实体称之为“节点”。它们之间的联系叫做“边”。
在图里面的用词需要去注意,当问题比较简单时节点和边就是相同类型的。当问题比较复杂时,就出现了多关系图。多关系图一般包含了多种类型的节点和边。在多关系图中包含了不同类型的实体和不同类型的事物。边的不同代表着关系是不同的。当表示不同的人、地名、概念等不同的物品时,可以用不同的节点。图谱不仅仅是一张简单的图,它指的是数据结构的组织,数据去表达事物与事物关系的方式。这种方式由于图论研究的深入和计算机科学里对于图成熟的处理方式。利用图谱来表示知识、知识之间的关系、以及对知识进行运算有许多便利的地方。
3.知识图谱的定义
(1)知识图谱把图形学、信息可视化技术等理论方法与计量学引文分析、共现分析等方法结合。
(2)知识图谱是利用可视化的图谱形象地展示学科的整体知识架构,达到多学科融合目的的现代理论。
(3)知识图谱本质上是一种揭示实体之间关系的语义网络。可以通过语义网络的形式表达知识,表示知识。
知识可以用语义网络的形式来表达,知识图谱本质上就是图的结构。利用语义网络不仅可以把知识描述出来,还可以进行计算。知识图谱集中在知识的整体架构上,不止可以放在学科上。知识的整体架构就是一部分的知识,知识相关的知识均可以用语义网络来表达。语义网络可以记录知识,但还要进行可视化的呈现。把图形学和信息可视化等理论方法引入进去更便于去理解知识。在复杂的情况下,还需要用到计量学引文分析、共现分析等方法结合才能够将知识更好地呈现出来,更容易被理解。
二、知识图谱的搭建
1.知识图谱的简单搭建
(1)核心就在于对业务的理解以及对知识图谱本身的设计。
(2)设计离不开对业务的深入理解以及对未来业务场景变化的预估。
(3)知识图谱构建的步骤:
定义具体的业务问题-数据的收集与预处理-知识图谱的设计-把数据存入知识图谱-上层应用的开发以及系统的评估
首先要明白解决什么样的问题和痛点,了解为什么要去运用知识图谱才能够解决。知识图谱就是数据汇总的地方,把从各种地方收集到的数据汇总在知识图谱中,选择对问题有帮助性的数据。对收集的数据进行预处理,预处理包括实体内容识别和关系抽取等。预处理之后进行知识图谱的设计。知识图谱的设计在整个流程中起到了十分关键的作用,它需要考虑到未来的场景会有什么样的变化,从而进行预估。把数据存入知识图谱中时需要用到图数据库。最后需要上层应用的开发以及系统的评估。上层应用开始使用知识图谱。任何AI系统完成之后都要进行系统的评估,以上就是知识图谱的简单搭建过程。
三、知识图谱的应用
1.电商推荐系统
(1)基于知识图谱的推荐系统可以融合多源信息,包括商品的上架信息、用户的喜好因素、用户对某一商品的喜好程度等。
(2)能够更加充分地挖掘用户和商品之间的潜在关联,将为用户的最终决策提供更有效的支持。
(3)电子商务成为基于知识图谱的推荐系统的主要应用场合。
(4)目前国内外相关企业如阿里巴巴已经构建知识图谱并应用于各自的电子商务淘宝平台推荐系统中,实现为用户在APP首页、相似商品页等场景进行个性化推荐。
本节回顾
通过本节的学习,我们学习到了:
一、知识图谱的定义
1.知识是人类对信息进行处理之后的认识和理解
2.图谱是一些事物与另一些事物之间相互连接的结构,通常由一些结点和连接这些结点的边组成
3.知识图谱是一种揭示实体之间关系的语义网络
二、知识图谱的搭建
定义具体的业务问题→数据的收集与预处理→知识图谱的设计→把数据存入知识图谱→上层应用的开发以及系统的评估
三、知识图谱的应用
电商推荐系统等