如果想要数据库“永久可用”,Aurora如何降低AZ级别故障和节点故障同时发生的概率?
由于特定故障发生的频率(Mean Time To Fail,MTTF)是一定的,为了减少故障同时发生的概率,可以想办法提高故障的修复时间(Mean Time To Repair,MTTR)。 Aurora 将存储分片管理,每个分片10GB,6 个10GB 副本构成一个PGs(Protection Groups)。Aurora 存储由若干PGs 构成,这些PGs 实际上是由EC2(Amazon Elastic Compute Cloud)服务器+本地SSD 磁盘组成的存储节点构成的,目前Aurora 最多支持64TB 的存储空间。分片后,每个分片作为一个故障单位,在10Gb/s 网络下,一个10GB 的分片可以在10s 内恢复。因此,当且仅当10s 内2 个以上分片同时出现故障时,才会影响数据库服务的可用性,实际上这种情况基本不会出现。通过分片管理,巧妙地提高了数据库服务的可用性。
以上内容摘自《云原生数据库原理与实践》,这本书可以在电子工业出版社天猫店购买。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。