分布式数据库系统的分类及体系架构 | 学习笔记

简介: 快速学习 分布式数据库系统的分类及体系架构

开发者学堂课程【分布式数据库技术与实现分布式数据库系统的分类及体系架构】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/373/detail/4688


分布式数据库系统的分类及体系架构


目录  

一. 分布式数据库系统的分类

二. 体系架构

.垂直分片和水平分片的区别


一.分布式数据库系统的分类

分为以下三类

1.  同质同构数据库

指完全相同的数据库,如每一个分库都是 Oracle

2.  同质异构数据库

如讲 OracleMySQLPostgreSQL 混用,三者是不同的数据库,但实际本质上都是关系型数据库。

3.  异构数据库

如关系型数据库跟文档数据库跟搜索引擎

在同一个逻辑里,最常见的是同质同构数据库,一般从运维的角度来讲,相同的数据库更便于运维,从全局的角度来讲,异构体数据库更常见,由于关系数据库,文档数据库跟搜索引擎每一种不同数据库在处理性能,还有功能方面有各自的优势,

所以如在商品交易系统里,使用关系数据库,但是同时产品要提供搜索,因此要把关系数据库跟搜索引擎整个纳入系统,所以从全局角度看,这是一个异构数据库。

image.png


二.体系架构

1.数据分片

2.数据分配

由于把全局数据分散到不同的地域,就涉及到分配的标准,分配的方法主要是两个维度:

1>分割分配

所谓的分割分配是指把数据分散到不同的节点,并且每一个节点之间的数据是不互相重复的,所有结点的总和是数据的全集。

2>全复制分配

每一个节点都拥有全量的数据,不同节点之间的数据都是完全相同的,这样的数据库往往用在解决”读”的问题,即当只有读的压力比较大,而数据的种量还有数据的写性能还没有达到瓶颈,全复制分配是一种不错的分配方案。

最常见的还是分割分配跟全复制分配的混合结构,如按地区分割成不同的存储节点,而在同一个地区里,由于要保证数据的安全性,同一个地区的数据会复制出多个节点,每个节点拥有整个地区的数据,从这种结构上就是分割分配跟全复制分配的混合。

数据分配架构决定了不同节点之间的逻辑关系,从工程角度还要考虑数据的分片,常见的三种分片:

1> 水平分片

水平分片就是按行拆分,如同一地区的商品,仍然按照不同的卖家来分配到不同的表里,这种分配格式里,不同的分片之间,它们的数据结构是一样的,即他们的字段数目跟字段类型是一样的,把所有数据的行合并到一起,就是数据的全集。

2> 垂直分片

垂直分片即将一张表的数据按字段分成多个表,基本的分片方法是将频繁更新的字段跟不平凡更新的字段分开,将大字段跟小字段分开,这种分片方式最主要的目的减少更新对磁盘造成的影响,如一个商品有颜色,价格,详细信息,描述等,还有库存,实际上如库存这样的字段会经常更新,而像商品介绍是不经常更新的,把它分开就可以避免由于我们更新产品库存而导致整个表的更新量变得更大。

3>混合分片

混合分片就是同时使用水平跟垂直两种分片结构。


三.垂直分片和水平分片的区别

水平分片本身已经包含了整个表的结构,因此不需要冗余字段,而垂直分片,需要一个字段能够用来标识两个不同的表之间的逻辑一致性,如将商品的详细信息这个字段单独区分开,放在一个额外的表,就需要在这张表里面也存一个商品的 ID ,因此垂直分片本身天然的就会造成冗余。

不论是将数据如何分配到不同的节点,分布式数据库系统要求分片里面一定要满足以下的几个规则:

1>完备性

所有的数据虽然被分配到不同的节点,但是所有节点和总和必须包含完整的信息。

2>重构条件

把数据分配到不同的节点以后,一定要有线索将数据通过固定的方法合并成完整的数据。如垂直分片的方法,如果商品信息的表本身没有商品 ID,就会导致无法将商品详情合并回商品表。

3>不相交条件

如一个商品不会同时出现在两个不同的地区

实际上在工程实现上12是必须完全满足的,第三个条件,从数据的可靠性或从访问的速度考虑,会做一些妥协。

相关文章
|
负载均衡 算法 关系型数据库
大数据大厂之MySQL数据库课程设计:揭秘MySQL集群架构负载均衡核心算法:从理论到Java代码实战,让你的数据库性能飙升!
本文聚焦 MySQL 集群架构中的负载均衡算法,阐述其重要性。详细介绍轮询、加权轮询、最少连接、加权最少连接、随机、源地址哈希等常用算法,分析各自优缺点及适用场景。并提供 Java 语言代码实现示例,助力直观理解。文章结构清晰,语言通俗易懂,对理解和应用负载均衡算法具有实用价值和参考价值。
大数据大厂之MySQL数据库课程设计:揭秘MySQL集群架构负载均衡核心算法:从理论到Java代码实战,让你的数据库性能飙升!
|
10月前
|
存储 监控 分布式数据库
ClickHouse分布式数据库动态伸缩(弹性扩缩容)的实现
实现ClickHouse数据库的动态伸缩需要持续的维护和精细的操作。从集群配置到数据迁移,再到监控和自动化,每一步都要仔细管理以确保服务的可靠性和性能。这些活动可以显著提高应用的响应性和成本效率,帮助业务根据实际需求灵活调整资源分配。
515 10
|
11月前
|
存储 关系型数据库 分布式数据库
【赵渝强老师】基于PostgreSQL的分布式数据库:Citus
Citus 是基于 PostgreSQL 的开源分布式数据库,采用 shared nothing 架构,具备良好的扩展性。它以插件形式集成,部署简单,适用于处理大规模数据和高并发场景。本文介绍了 Citus 的基础概念、安装配置步骤及其在单机环境下的集群搭建方法。
924 2
|
11月前
|
存储 关系型数据库 数据库
高性能云盘:一文解析RDS数据库存储架构升级
性能、成本、弹性,是客户实际使用数据库过程中关注的三个重要方面。RDS业界率先推出的高性能云盘(原通用云盘),是PaaS层和IaaS层的深度融合的技术最佳实践,通过使用不同的存储介质,为客户提供同时满足低成本、低延迟、高持久性的体验。
|
12月前
|
存储 Cloud Native 关系型数据库
PolarDB开源:云原生数据库的架构革命
本文围绕开源核心价值、社区运营实践和技术演进路线展开。首先解读存算分离架构的三大突破,包括基于RDMA的分布式存储、计算节点扩展及存储池扩容机制,并强调与MySQL的高兼容性。其次分享阿里巴巴开源治理模式,涵盖技术决策、版本发布和贡献者成长体系,同时展示企业应用案例。最后展望技术路线图,如3.0版本的多写多读架构、智能调优引擎等特性,以及开发者生态建设举措,推荐使用PolarDB-Operator实现高效部署。
522 4
|
负载均衡 算法 关系型数据库
大数据新视界--大数据大厂之MySQL数据库课程设计:MySQL集群架构负载均衡故障排除与解决方案
本文深入探讨 MySQL 集群架构负载均衡的常见故障及排除方法。涵盖请求分配不均、节点无法响应、负载均衡器故障等现象,介绍多种负载均衡算法及故障排除步骤,包括检查负载均衡器状态、调整算法、诊断修复节点故障等。还阐述了预防措施与确保系统稳定性的方法,如定期监控维护、备份恢复策略、团队协作与知识管理等。为确保 MySQL 数据库系统高可用性提供全面指导。
|
SQL 存储 分布式数据库
分布式存储数据恢复—hbase和hive数据库数据恢复案例
分布式存储数据恢复环境: 16台某品牌R730xd服务器节点,每台服务器节点上有数台虚拟机。 虚拟机上部署Hbase和Hive数据库。 分布式存储故障: 数据库底层文件被误删除,数据库不能使用。要求恢复hbase和hive数据库。
478 12
|
人工智能 JavaScript 安全
【01】Java+若依+vue.js技术栈实现钱包积分管理系统项目-商业级电玩城积分系统商业项目实战-需求改为思维导图-设计数据库-确定基础架构和设计-优雅草卓伊凡商业项目实战
【01】Java+若依+vue.js技术栈实现钱包积分管理系统项目-商业级电玩城积分系统商业项目实战-需求改为思维导图-设计数据库-确定基础架构和设计-优雅草卓伊凡商业项目实战
745 13
【01】Java+若依+vue.js技术栈实现钱包积分管理系统项目-商业级电玩城积分系统商业项目实战-需求改为思维导图-设计数据库-确定基础架构和设计-优雅草卓伊凡商业项目实战
|
人工智能 前端开发 Java
DDD四层架构和MVC三层架构的个人理解和学习笔记
领域驱动设计(DDD)是一种以业务为核心的设计方法,与传统MVC架构不同,DDD将业务逻辑拆分为应用层和领域层,更关注业务领域而非数据库设计。其四层架构包括:Interface(接口层)、Application(应用层)、Domain(领域层)和Infrastructure(基础层)。各层职责分明,避免跨层调用,确保业务逻辑清晰。代码实现中,通过DTO、Entity、DO等对象的转换,结合ProtoBuf协议,完成请求与响应的处理流程。为提高复用性,实际项目中可增加Common层存放公共依赖。DDD强调从业务出发设计软件,适应复杂业务场景,是微服务架构的重要设计思想。