《云原生一站式数据库技术与实践》——一、云原生分布式数据库PolarDB-X技术架构(4) https://developer.aliyun.com/article/1231701?groupCode=aliyundb
二级分区使用灵活,支持与一级分区一样多的分区策略,是完全正交的策略。而且可以任意组合,支持模板化和非模板化的方式,能够实现精细化控制。比如二级分区可以对所有一级分区制定统一的规则,将每个一级分区都分为5 个子分区,也可以只将某一个分区分为5 个分区,其他一级分区不变,这样的模式可以根据业务特点进行灵活的调整,也能够避免分区数量无限膨胀。
分布式带来的好处在于在企业级能力上提供了一致性保证,利用Paxos+2PC 实现了任何时候都有数据强一致的保证。
Paxos 主要用于DN 的复制组,保证数据副本之间的一致性。MVCC 加2PC 的分布式事务的方式保证了外部的一致性。TSO 用于做Snapshot 隔离级别、事务隔离级别的一致性保证,其优势在于,做只读事务时,无需对数据进行加速,通过快照也可以读到一致的数据视图,不会读到某个部分的事务。
企业级能力这一层做了一体化,包括分布式一体化以及在线与历史归档数据一体化。数据在分布式系统里的体量非常大,且很多数据均有明显的冷热区隔。为了降低成本,我们实现了自动归档的能力。
归档过程全自动化,在建表时指定数据过期规则,会将过期数据自动建好分区进行归档,存储到低成本的OSS 存储里。自动归档也会对冷数据的做压缩,大幅降低数据容量,结合OSS 低成本的混合存储方式,相对在线数据的成本有20 倍下降。
过期的分区可以作为外表做在线查询,即对历史归档数据一样可以与在线数据做混合查询。
《云原生一站式数据库技术与实践》——一、云原生分布式数据库PolarDB-X技术架构(6) https://developer.aliyun.com/article/1231697?groupCode=aliyundb