开发者学堂课程【分布式数据库技术与实现:分布式数据库系统的分类及体系架构】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/373/detail/4688
分布式数据库系统的分类及体系架构
目录
一. 分布式数据库系统的分类
二. 体系架构
三.垂直分片和水平分片的区别
一.分布式数据库系统的分类
分为以下三类
1. 同质同构数据库
指完全相同的数据库,如每一个分库都是 Oracle
2. 同质异构数据库
如讲 Oracle、MySQL、PostgreSQL 混用,三者是不同的数据库,但实际本质上都是关系型数据库。
3. 异构数据库
如关系型数据库跟文档数据库跟搜索引擎
在同一个逻辑里,最常见的是同质同构数据库,一般从运维的角度来讲,相同的数据库更便于运维,从全局的角度来讲,异构体数据库更常见,由于关系数据库,文档数据库跟搜索引擎每一种不同数据库在处理性能,还有功能方面有各自的优势,
所以如在商品交易系统里,使用关系数据库,但是同时产品要提供搜索,因此要把关系数据库跟搜索引擎整个纳入系统,所以从全局角度看,这是一个异构数据库。
二.体系架构
1.数据分片
2.数据分配
由于把全局数据分散到不同的地域,就涉及到分配的标准,分配的方法主要是两个维度:
1>分割分配
所谓的分割分配是指把数据分散到不同的节点,并且每一个节点之间的数据是不互相重复的,所有结点的总和是数据的全集。
2>全复制分配
每一个节点都拥有全量的数据,不同节点之间的数据都是完全相同的,这样的数据库往往用在解决”读”的问题,即当只有读的压力比较大,而数据的种量还有数据的写性能还没有达到瓶颈,全复制分配是一种不错的分配方案。
最常见的还是分割分配跟全复制分配的混合结构,如按地区分割成不同的存储节点,而在同一个地区里,由于要保证数据的安全性,同一个地区的数据会复制出多个节点,每个节点拥有整个地区的数据,从这种结构上就是分割分配跟全复制分配的混合。
数据分配架构决定了不同节点之间的逻辑关系,从工程角度还要考虑数据的分片,常见的三种分片:
1> 水平分片
水平分片就是按行拆分,如同一地区的商品,仍然按照不同的卖家来分配到不同的表里,这种分配格式里,不同的分片之间,它们的数据结构是一样的,即他们的字段数目跟字段类型是一样的,把所有数据的行合并到一起,就是数据的全集。
2> 垂直分片
垂直分片即将一张表的数据按字段分成多个表,基本的分片方法是将频繁更新的字段跟不平凡更新的字段分开,将大字段跟小字段分开,这种分片方式最主要的目的减少更新对磁盘造成的影响,如一个商品有颜色,价格,详细信息,描述等,还有库存,实际上如库存这样的字段会经常更新,而像商品介绍是不经常更新的,把它分开就可以避免由于我们更新产品库存而导致整个表的更新量变得更大。
3>混合分片
混合分片就是同时使用水平跟垂直两种分片结构。
三.垂直分片和水平分片的区别
水平分片本身已经包含了整个表的结构,因此不需要冗余字段,而垂直分片,需要一个字段能够用来标识两个不同的表之间的逻辑一致性,如将商品的详细信息这个字段单独区分开,放在一个额外的表,就需要在这张表里面也存一个商品的 ID ,因此垂直分片本身天然的就会造成冗余。
不论是将数据如何分配到不同的节点,分布式数据库系统要求分片里面一定要满足以下的几个规则:
1>完备性
所有的数据虽然被分配到不同的节点,但是所有节点和总和必须包含完整的信息。
2>重构条件
把数据分配到不同的节点以后,一定要有线索将数据通过固定的方法合并成完整的数据。如垂直分片的方法,如果商品信息的表本身没有商品 ID,就会导致无法将商品详情合并回商品表。
3>不相交条件
如一个商品不会同时出现在两个不同的地区
实际上在工程实现上1、2是必须完全满足的,第三个条件,从数据的可靠性或从访问的速度考虑,会做一些妥协。