YashanDB共享集群产品能力观测:细节足见功底

简介: 本文根据前泽塔数科研发总监王若楠在“2024年国产数据库创新生态大会”上的演讲整理,全面测试了崖山共享集群YAC的架构、功能、高可用性与性能。测试结果显示,YAC具备全对称架构,兼容Oracle特性,高可用场景下RPO=0且RTO<15秒,四节点集群性能高达520万tpmC。其资源控制精细、功能丰富,展现出卓越的稳定性和成熟度,为国产数据库替代Oracle RAC提供了有力支持。

本文基于前泽塔数科研发总监-王若楠2024年11月在“2024年国产数据库创新生态大会”-“根”技术专场的演讲整理形成,主要对崖山共享集群YAC的架构、功能、高可用性、性能四大方面进行全面测试,并分享了测试环境和测试结论。

年初,基于某些商业考量,我们团队对崖山共享集群数据库(YAC)进行了测试。起初,我持有怀疑态度,这既源于近年来数据库领域出现的乱象,也因为我作为共享存储架构研发人员,深知其中的技术难度。经过全面的测试后,崖山共享集群YAC的稳定性、成熟度、独特性均超出了我们的预期。

共享存储集群架构为什么如此重要?

以Oracle RAC为代表的共享存储集群架构,常被用于金融、电力等行业的核心系统上。目前国产替代已逐步进入深水区,面临的首要挑战之一就是Oracle RAC架构的替代。

用户在进行国产替代时,首要考虑的因素是确保关键业务系统实现长期稳定的运行以及服务的连续性。用户最担心发生软件BUG、硬件故障或掉电、网络中断、介质失效等故障时,出现数据丢失破坏或服务长时间中断的情况。因此**国产数据库必须满足两方面的诉求,一是数据高可用****,企业级要求数据零损失,RPO=0;二是服务高可用,服务中断时间RTO尽可能短。**除了满足上述高可用的前提下,用户还会追求性能及扩展性的最大化。相较于单机和分布式数据库集群,共享存储集群架构在高可用性、扩展性以及成本效益方面展现出更为显著的优势。

image.png

综上所述,核心业务系统中的功能性需求可以通过简单的修改和调整来满足。然而,高可用性、性能以及扩展性等问题,必须依赖于数据库的核心技术来解决。

YAC产品到底能力如何?

我们团队对崖山共享集群数据库(YAC)进行了全面的测试,覆盖了单机到四个节点的场景,具体包括产品架构、功能完整性、高可用性保障、性能表现四大方面。

1测试环境

128核X86架构,详细配置如下。
image.png

2架构层面

测试目标

  1. 测试YAC是否为全对称架构,每个节点都可进行读写。

  2. 测试产品的独特性。

测试项

  1. 针对第一点,我们主要对各个节点的读写性能表现进行了多种反复观测,发现四个节点的读写性能表现是相似的,四个节点均具备读写能力。

  2. 针对第二点我们主要查看了其进线程结构、存储结构、文件系统等,其存储文件系统进线程结构均不同于市面其他产品,具有自己的独特性与原创性。
    image.png

测试结论

YAC产品架构完备。架构及表现与RAC相同,四个节点均具备读写能力,读写性能表现相似。同时,产品存储结构、线程结构不同于市面上其他产品,具有自己的独特性。

3功能层面

测试目标

  1. 测试与Oracle的兼容度。

  2. 测试功能的完整性。

测试项
image.png

测试结论

产品系统表、系统视图、DBA视图、PL/SQL、事务、非自动提交及回滚方式、功能等与Oracle高度兼容。

在保持与Oracle和MySQL在细节功能及使用习惯上的一致性的同时,也对功能进行了丰富。

4高可用性

测试目标

测试YAC产品在性能极限的负载下,当系统故障时(软件BUG、硬件故障或掉电、网络中断、介质失效等),是否能做到数据不丢失(RPO=0),服务中断时间很短(RTO<30S)。

测试项
image.png

测试结论

YAC产品在性能极限的负载下做高可用测试,所测故障场景均可做到正确的识别切换,RPO=0,RTO<15S,一致性正确。

5性能层面

测试目标

  1. 测试单机的极限性能值。

  2. 测试集群对单节点性能的影响。

  3. 测试YAC扩展性。

测试结论

image.png

  1. YashanDB单机最高性能202万,且CPU占用率接近65%左右;

  2. YAC集群单实例最优194万,相对单机202万可知YAC集群架构几乎对单节点的性能没有影响;

  3. YAC四节点集群随节点数的增加,性能基本呈线性增长,四节点性能高达520万tpmC。

一句话评价:细节足见功底

从一个多年从事数据库内核研发工程师的角度看崖山数据库:细节足见功底。

测试过程中,我深刻感受到了崖山数据库的稳定。这个稳定既来源于产品的工程化能力和成熟度,也得益于在设计阶段对资源控制的精细考量。崖山数据库的这三个细节展示了其精细化的资源控制:

一是库内连接池功能亮眼。测试中崖山数据库的库内连接池功能是亮眼的,该功能对于维持系统不达到过高的压力水平和稳定性起到了至关重要的作用。

二是资源申请的极致控制。 在面临高压、高并发以及大内存使用的极端条件下,YAC都展现出了出色的稳定性,未发生内存溢出(OOM)等异常情况,且性能波动维持在极低水平。深入分析其参数配置,可以发现YAC对内存管理进行了精细划分与优化,包括更为合理的内存区域分配及大小设置,并采用了大页内存技术等高级策略。

三是资源及性能的可观测性。 该点也是常常被忽略,崖山数据库拥有与Oracle相似AWR性能报告,其独特之处在于采用了与Oracle相同的基于DB Time统计评估逻辑,这一特性使得性能监测更为全面且精准,为用户提供了极具指导价值的性能洞察。

同时测试中发现了崖山数据库具备一些少见的功能。比如闪回不但支持了Oracle的功能,同时还新增支持truncate闪回、本地swap表空间等功能,提升性能的同时,再一次体现了其精细资源管理的理念。

目录
打赏
0
18
19
2
98
分享
相关文章
为何YashanDB共享集群的高可用能力被频频称赞,它的机制有何不同?
本文深入解析了 YashanDB 共享集群的高可用机制。包括高可用概述,对比了主备架构和共享集群架构在实例故障时的 RPO 和 RTO 情况。介绍了共享集群的高可用架构,如支持主备库部署,三大关键组件及各自的高可用核心特性。还阐述了核心技术,如 YCS、YFS、DB 组件的高可用机制。最后通过 TPCC 业务模型压测表明实例故障恢复期间业务持续部分可用,耗时 8 秒,并总结了各种故障场景下的关键设计和 RTO/RPO 表现。
YashanDB共享集群产品能力观测:细节足见功底
王若楠,前泽塔数科研发总监,在2024年国产数据库创新生态大会上详细介绍了崖山共享集群YAC的架构、功能、高可用性和性能测试。测试覆盖单机到四节点场景,验证了YAC在读写性能、Oracle兼容性、故障恢复(RPO=0,RTO&lt;15S)和线性扩展性方面的卓越表现。尤其在资源控制和性能优化上,YAC展现出精细的设计与稳定的表现,为国产数据库替代提供了有力支持。
Elasticsearch全观测技术解析问题之面对客户不同的场景化如何解决
Elasticsearch全观测技术解析问题之面对客户不同的场景化如何解决
打造无缝灾备新境界:运用服务网格ASM,将集群外服务无缝融入集群内服务,铸就高可用性坚盾!
【8月更文挑战第2天】随着微服务架构的应用,服务的高可用性变得至关重要。服务网格如阿里巴巴的ASM提供流量管理、服务发现等功能,支撑高可靠服务系统。本文介绍如何利用ASM实现集群外服务作为集群内服务的灾备方案,确保服务连续性。先决条件包括已部署ASM的Kubernetes集群环境及内外部的关键服务副本。通过定义服务条目、配置虚拟服务和目的地规则,可实现自动或手动故障转移。借助ASM的流量管理能力,确保服务高可用性和业务连续性。
76 10
微服务架构下的服务治理策略:打破服务混乱的惊天秘籍,开启系统稳定的神奇之门!
【8月更文挑战第7天】微服务架构将应用细分为可独立部署的小服务,提升灵活性与可扩展性。但服务增多带来治理挑战。通过服务注册与发现(如Eureka)、容错机制(如Hystrix)、监控工具(如Prometheus+Grafana)、集中配置管理(如Spring Cloud Config)和服务网关(如Zuul),可有效解决这些挑战,确保系统的高可用性和性能。合理运用这些技术和策略,能充分发挥微服务优势,构建高效应用系统。
80 1
|
8月前
|
开发与运维数据问题之实现商业版和开源版在发送可观测数据方面的差异如何解决
开发与运维数据问题之实现商业版和开源版在发送可观测数据方面的差异如何解决
80 1
通用研发提效问题之女娲的缓存方案,体现易用性的四重境界,如何解决
通用研发提效问题之女娲的缓存方案,体现易用性的四重境界,如何解决
关于DEFI模式系统详细方案技术开发逻辑讲解方案
关于DEFI模式系统详细方案技术开发逻辑讲解方案
提升云上资源稳定性的两大利器:事件驱动体系构建&自诊断工具
阿里云弹性计算技术专家王子龙和阿里云弹性计算技术专家樊超在本次课程中带来了题为《提升云上资源稳定性的两大利器:事件驱动体系构建&自诊断工具》的主题分享, 课程涵盖基于事件构建可观测体系、基于事件的云上运维、ECS事件驱动最佳实践、使用ECS遇到故障时的痛点分析、一眼排障ECS健康状态、一键定位ECS健康诊断等内容。