图数据库介绍及应用场景| 学习笔记

简介: 快速学习图数据库介绍及应用场景。

开发者学堂课程【阿里云图数据库 GDB 入门与应用 :图数据库介绍及应用场景】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/623/detail/9443


图数据库介绍及应用场景

 

目录

一、 什么是数据库?

二、 自建图数据库的挑战

三、 应用场景

 

一、什么是数据库?

1.典型的图结构由点,边和点边对应属性构成,圈数据库则是针对能这种结构的独有特点而专门设计的一种数据库,非常适合高度互连数据集的存储和查询。

左边示例中描述的是一个极度简化的社交关系图,圆圈代表顶点( Vertex/node),有方向的线条代表边(Edge),顶点或者边都可以有属性(Property)。

image.png

有三个点,表示三个人物。ID 为1的表示一个年龄为18岁的名字叫 Alice 的人,这些点表示人,上面的属性表示人的属性人与人之间的联系通过边来表示,比如 Alice 和 Bob 之间的关系是认识,边上面还有属性,比如 ID 为100的边上的属性就是2001/10/03,说明是从这一天认识,这个图是明显的结构,由点,边和相关属性构成,而图数据库就是专门为图设计的一种结构,比较适合高度互连数据集的存储和查询。

2.阿里云图数据库

图数据库( Graph Database,简称GDB)是一种支持属性图模型,用于处理高度连接数据查询与存储的实时可靠的在线数据库,支持 TinkerPop Gremlin 查询语言,可以帮助用户快速构建基于高度连接的数据集的应用程序。

image.png

产品的 GDB 分为三层,最底层是引擎层,上面是 database 计算层,在上面支持查询语言 API 的 class 端,用户在 GDB 上面可以构建自己的程序。

纵向是运维的功能,包括产品的高可用,性能管理,备份/恢复,自动扩展,只读副本,安全加密,计费。

3.图数据库 vs 关系数据库

在传统的关键性数据库和图数据库上有明显的区别。

image.png

用户 Userld-xxx 发起“查询自己2度好友中名字叫 james 的人”这样个查询请求,以传统关系数据库的做法,你可能会写出如下查询语句:

select" from t as t3 where t3.uid in(

select friend uid from t as t2 where t2. uid in(

select friend _uid from t as t1 where t1.uid='Userld-xxx

and t3.name='James'

图数据库中查询2度好友:

g. V(Userld-

xxx').repeat(both(). simplePath () times().dedup().has('name

'James')

常用的场景如上,t 表表示用户信息,用户字段 friend uid 表示朋友的 uid,可以看到查询2度好友,有两次的自连操作,需要条件过滤。

图数据库:

g是把所有数据拿出来,找到 User Id-xxx 的点,然后从这个点出发游走,2跳,去重,对属性进行过滤。这只是一个2度查询,可以看到区别。

通过一些性能上的分析可以看到,高度连接的数据查询复杂,效率低下,SQL 语句也复杂。图数据解决了这些复杂的需求,在二度查询平均耗时上,关系型数据库是图数据库的十倍,在三度查询平均耗时上,关系型数据库是图数据库的二十倍。

image.png

在关系型数据库中,高度连接的数据查询复杂且效率低下,而图数据库从基因层面提供了高效解决方案。

面对高度联系的应用场景,选择图数据库。

 

二、自建图数据库的挑战

1. 运维复杂

构建生命周期管理、监控等一系列服务,整体成本很高。

2. 缺乏企业级支持

对于产品的数据集成、产品优化、数据管理,产品Bug等没有完整的支持体系。

3. 可靠性差

需要自己构建高可用系统、自建搭

建监控服务等,成本很高。

4. 价格贵

Neo4j Enterprise Base $189,188 (3 instance)

需要将近十九万美元的成本。

 

三、应用场景

1. 社交网络

在例子讲解,传统数据库对超过三度的查询非常低效,不支持,但图数据库相对容易。

image.png

2. 欺诈检测

通过分析贷款,分期付款的联系人相关信息,进行信用平分。

image.png

3. 搜索引擎

将用户的购买行为,位置关系收藏,实时存储在图数据中,利用图数据库对于高度连接的数据查询高效特点,对用户进行个性化评价。

image.png

4. 其他应用场景

知识图谱、网络/T运营、生命科学等其他领域。

5.社交网络场景:

从用户 A 出发搜索用户 B,甚至搜索跟用户 A 有关系的用户 B,进行一层过滤。前面的案例,关系型数据库表达会非常困难。

A. B 两个用户是如何连接的?

查询最短路径,和短路径之间的阶段

用户推荐

一般有两个实现:

1.两度的人面找, path 多的第一,边最多,可能有很强的关系。

2.如果某个 feature 有很强的识别性,那么直接 featuar 找出相同的用户。

实时推荐场景:

image.png

某 APP,当用户 A 来到商场 B 的时候,如何进行推荐?

根据用户当前的行为、位置等进行实时推荐,最大化数据的商业价值

1.根据朋友,朋友的朋友购买行为进行实时推荐

2.从用户出发,遍历所有朋友、朋友的朋友

3.计算发生“购买”关系最多的商铺,进行推荐

4.“购买”的关系可以替代为“Like”、“打分”等

5.优化:对朋友之间的关系进行亲密度”计算,从而增加“更亲密”朋友的权重

6.实时推荐类似的场景还有

7.用在线进入某个商铺之后,如何进行推荐

金融欺诈场景:

用户A在申贷款额度,或名申请信用支付时:

根据通信录联系人计算个人信用参考值。如果联系中有信用较差的用户,则考虑提高利率或省贷款

从消费者出发,检索贷款分期等金融信息,然后根据金融企业所注册用户的信用信息进行分析,根据消费者通信录联系人,计算个人信用的参考值,或联系人有信用较差的用户,会考虑是否有欺诈行为存在自己。

相关实践学习
阿里云图数据库GDB入门与应用
图数据库(Graph Database,简称GDB)是一种支持Property Graph图模型、用于处理高度连接数据查询与存储的实时、可靠的在线数据库服务。它支持Apache TinkerPop Gremlin查询语言,可以帮您快速构建基于高度连接的数据集的应用程序。GDB非常适合社交网络、欺诈检测、推荐引擎、实时图谱、网络/IT运营这类高度互连数据集的场景。 GDB由阿里云自主研发,具备如下优势: 标准图查询语言:支持属性图,高度兼容Gremlin图查询语言。 高度优化的自研引擎:高度优化的自研图计算层和存储层,云盘多副本保障数据超高可靠,支持ACID事务。 服务高可用:支持高可用实例,节点故障迅速转移,保障业务连续性。 易运维:提供备份恢复、自动升级、监控告警、故障切换等丰富的运维功能,大幅降低运维成本。 产品主页:https://www.aliyun.com/product/gdb
相关文章
|
5月前
|
存储 人工智能 NoSQL
AI大模型应用实践 八:如何通过RAG数据库实现大模型的私有化定制与优化
RAG技术通过融合外部知识库与大模型,实现知识动态更新与私有化定制,解决大模型知识固化、幻觉及数据安全难题。本文详解RAG原理、数据库选型(向量库、图库、知识图谱、混合架构)及应用场景,助力企业高效构建安全、可解释的智能系统。
|
8月前
|
存储 关系型数据库 数据库
附部署代码|云数据库RDS 全托管 Supabase服务:小白轻松搞定开发AI应用
本文通过一个 Agentic RAG 应用的完整构建流程,展示了如何借助 RDS Supabase 快速搭建具备知识处理与智能决策能力的 AI 应用,展示从数据准备到应用部署的全流程,相较于传统开发模式效率大幅提升。
附部署代码|云数据库RDS 全托管 Supabase服务:小白轻松搞定开发AI应用
|
11月前
|
关系型数据库 分布式数据库 数据库
一库多能:阿里云PolarDB三大引擎、四种输出形态,覆盖企业数据库全场景
PolarDB是阿里云自研的新一代云原生数据库,提供极致弹性、高性能和海量存储。它包含三个版本:PolarDB-M(兼容MySQL)、PolarDB-PG(兼容PostgreSQL及Oracle语法)和PolarDB-X(分布式数据库)。支持公有云、专有云、DBStack及轻量版等多种形态,满足不同场景需求。2021年,PolarDB-PG与PolarDB-X开源,内核与商业版一致,推动国产数据库生态发展,同时兼容主流国产操作系统与芯片,获得权威安全认证。
|
9月前
|
安全 druid Nacos
0 代码改造实现应用运行时数据库密码无损轮转
本文探讨了敏感数据的安全风险及降低账密泄漏风险的策略。国家颁布的《网络安全二级等保2.0标准》强调了企业数据安全的重要性。文章介绍了Nacos作为配置中心在提升数据库访问安全性方面的应用,并结合阿里云KMS、Druid连接池和Spring Cloud Alibaba社区推出的数据源动态轮转方案。该方案实现了加密配置统一托管、帐密全托管、双层权限管控等功能,将帐密切换时间从数小时优化到一秒,显著提升了安全性和效率。未来,MSE Nacos和KMS将扩展至更多组件如NoSQL、MQ等,提供一站式安全服务,助力AI时代的应用安全。
500 14
|
6月前
|
缓存 Java 应用服务中间件
Spring Boot配置优化:Tomcat+数据库+缓存+日志,全场景教程
本文详解Spring Boot十大核心配置优化技巧,涵盖Tomcat连接池、数据库连接池、Jackson时区、日志管理、缓存策略、异步线程池等关键配置,结合代码示例与通俗解释,助你轻松掌握高并发场景下的性能调优方法,适用于实际项目落地。
1109 5
|
6月前
|
存储 弹性计算 Cloud Native
云原生数据库的演进与应用实践
随着企业业务扩展,传统数据库难以应对高并发与弹性需求。云原生数据库应运而生,具备计算存储分离、弹性伸缩、高可用等核心特性,广泛应用于电商、金融、物联网等场景。阿里云PolarDB、Lindorm等产品已形成完善生态,助力企业高效处理数据。未来,AI驱动、Serverless与多云兼容将推动其进一步发展。
296 8
|
6月前
|
存储 弹性计算 安全
现有数据库系统中应用加密技术的不同之处
本文介绍了数据库加密技术的种类及其在不同应用场景下的安全防护能力,包括云盘加密、透明数据加密(TDE)和选择列加密。分析了数据库面临的安全威胁,如管理员攻击、网络监听、绕过数据库访问等,并通过能力矩阵对比了各类加密技术的安全防护范围、加密粒度、业务影响及性能损耗。帮助用户根据安全需求、业务改造成本和性能要求,选择合适的加密方案,保障数据存储与传输安全。
|
8月前
|
安全 Java Nacos
0代码改动实现Spring应用数据库帐密自动轮转
Nacos作为国内被广泛使用的配置中心,已经成为应用侧的基础设施产品,近年来安全问题被更多关注,这是中国国内软件行业逐渐迈向成熟的标志,也是必经之路,Nacos提供配置加密存储-运行时轮转的核心安全能力,将在应用安全领域承担更多职责。
|
9月前
|
安全 关系型数据库 数据库
瀚高股份与 Anolis OS 完成适配,龙蜥获数据库场景高性能与稳定性认证
Anolis OS 能够为用户提供更加高效、安全的数据处理与管理体验。