《图数据库(第2版)》——1.1 图是什么

简介:

本节书摘来自异步社区出版社《图数据库(第2版)》一书中的第1章,第1.1节,作者:【美】Ian Robinson(伊恩•罗宾逊) , Jim Webber(吉姆•韦伯) , Emil Eifrem(埃米尔•艾弗雷姆),更多章节内容可以访问云栖社区“异步社区”公众号查看。

1.1 图是什么

形式上,图不过是顶点的集合,或者说更简单一点儿,图就是一些节点和关联这些节点的联系的集合。图将实体表现为节点,实体与其他实体连接的方式表现为联系。我们可以用这个通用而富有表现力的结构来为各种场景建模,从宇宙火箭的建造到道路系统,从食物的供应链及原产地追踪到人们的病历,甚至更多。

无处不在的图

在我们了解科学、政府和商业领域的数据集广泛多样性的过程中,图起到了极大的作用。现实世界完全不同于关系型数据库背后的基于表的模型,它是丰富的且相互之间充满关联:有些部分是统一而规则的,而其他部分是特殊的、不规则的。一旦理解了图,你就会发现图无处不在。比如,Gartner定义了商业世界的5个图——社交、意向、消费、兴趣和移动,并指出运用这些图的能力是一个“可持续的竞争优势”。
就拿Twitter来说,它的数据很容易表示为一张图。在图1-1中,我们可以看到由Twitter用户组成的一个小型社交网络。每个节点都被标为User,表明了他在这个网络中的角色。然后这些节点又用联系连接起来,帮助更好地建立语义上下文。也就是说,Billy关注了(FOLLOWS)Harry,相应地,Harry也关注了Billy。Ruth和Harry也是互相关注的,不过,尽管Ruth关注了Billy,但Billy还没有关注她。
image

带标签的属性图模型
在讨论图1-2的过程中,我们也顺便提一下现在最流行的图模型形式—带标签的属性图(labeled property graph)(在附录A中,我们会更详细地讨论其他几种图数据模型)。带标签的属性图具有如下特征。

它包含节点和联系。
节点上有属性(键值对)。
节点可以有一个或多个标签。
联系有名字和方向,并总是有一个开始节点和一个结束节点。
联系也可以有属性。
对于大部分人来说,属性图模型是直观且容易理解的。不过简单归简单,它却可以描述绝大部分图的使用场景,并对我们的数据产生有价值的见解。
当然,实际的Twitter图比图1-1要大数亿倍,但它们的工作原理是一样的。在图1-2中,我们把Ruth发布的消息也包含到图里面来。
image

尽管图很简单,但图1-2还是展示出了图模型的表现力。我们可以很容易从图中看出Ruth发布了一连串的消息。通过标记为CURRENT的联系可以找到她最新发布的消息,PREVIOUS联系建立了Ruth的消息时间线。

相关实践学习
阿里云图数据库GDB入门与应用
图数据库(Graph Database,简称GDB)是一种支持Property Graph图模型、用于处理高度连接数据查询与存储的实时、可靠的在线数据库服务。它支持Apache TinkerPop Gremlin查询语言,可以帮您快速构建基于高度连接的数据集的应用程序。GDB非常适合社交网络、欺诈检测、推荐引擎、实时图谱、网络/IT运营这类高度互连数据集的场景。 GDB由阿里云自主研发,具备如下优势: 标准图查询语言:支持属性图,高度兼容Gremlin图查询语言。 高度优化的自研引擎:高度优化的自研图计算层和存储层,云盘多副本保障数据超高可靠,支持ACID事务。 服务高可用:支持高可用实例,节点故障迅速转移,保障业务连续性。 易运维:提供备份恢复、自动升级、监控告警、故障切换等丰富的运维功能,大幅降低运维成本。 产品主页:https://www.aliyun.com/product/gdb
相关文章
|
23天前
|
SQL 消息中间件 算法
TuGraph Analytics图数据集成:表到图的最后一公里
小伙伴们想玩一玩图计算,数据的导入工作总是绕不开的一个环节。为了降低大家数据导入操作的成本,提升图计算的整体使用体验,TuGraph Analytics推出了“图数据集成”能力,帮助大家通过简单配置完成数据导入工作。
TuGraph Analytics图数据集成:表到图的最后一公里
|
3月前
|
数据挖掘
r语言数据分析画数据相关性图热力图
r语言数据分析画数据相关性图热力图
80 1
|
8月前
火山图|给你geneList,帮我标到火山图上
火山图|给你geneList,帮我标到火山图上
108 0
|
8月前
|
机器学习/深度学习
离散数学_十章-图 ( 4 ):图的表示和图的同构
离散数学_十章-图 ( 4 ):图的表示和图的同构
153 0
|
9月前
|
数据采集 数据可视化 算法
数据分析可视化常用图介绍以及相关代码实现(箱型图、Q-Q图、Kde图、线性回归图、热力图)
数据分析可视化常用图介绍以及相关代码实现(箱型图、Q-Q图、Kde图、线性回归图、热力图)
|
11月前
|
存储 负载均衡 并行计算
图数据库中的“分布式”和“数据切分”(切图)
什么是分布式系统?为什么需要分布式系统呢?在本文,我们简单讲解下分布式内容,再快速切入的图数据库,了解图数据库的独有数据切分方式,以及各大图数据库产品是如何处理切图的/
245 0
|
数据采集 自然语言处理 数据可视化
数据分析实例-获取某宝评论数据做词云图可视化
数据分析实例-获取某宝评论数据做词云图可视化
303 0
数据分析实例-获取某宝评论数据做词云图可视化
|
SQL 数据可视化 程序员
clickhouse与火焰图
clickhouse与火焰图
486 0
clickhouse与火焰图
|
数据可视化
GraphScope 图分析引擎 - GRAPE 介绍
GraphScope 中的图分析引擎继承自 GRAPE,该系统实现了论文 Parallelizing Sequential Graph Computations 中提出的不动点计算模型