什么是云原生数据库PolarDB分布式版

本文涉及的产品
RDS AI 助手,专业版
RDS MySQL DuckDB 分析主实例,基础系列 4核8GB
RDS MySQL DuckDB 分析主实例,集群系列 4核8GB
简介: 本文介绍什么是云原生数据库PolarDB分布式版,也称为PolarDB分布式版,本手册中简称为PolarDB-X。

本文介绍什么是云原生数据库PolarDB分布式版,也称为PolarDB分布式版,本手册中简称为PolarDB-X。

产品简介

PolarDB分布式版(PolarDB for Xscale,简称“PolarDB-X”)。

PolarDB-X是阿里云面向高吞吐、大存储、低延时、易扩展和超高可用的云时代数据库使用需求自主设计研发的高性能云原生分布式数据库产品。

PolarDB-X始终保持对阿里巴巴集团"双十一购物狂欢节"所有相关业务的全面支撑。历经十余年淬炼,PolarDB-X具备了强数据一致性、高系统稳定性、快速集群弹性等核心关键特性,并在司法财税、交通物流、电力能源等公共事业领域有广泛深入应用。

PolarDB-X坚定遵循自主可控、开放生态的发展思路,持续围绕MySQL开源生态构建分布式能力,以求最大程度降低用户的学习使用成本。

PolarDB-X产品形态上,秉持的理念是“在业务无需分布式时,客户不应为此付出成本”,采用集中式和分布式一体化架构,可以支撑业务从小到大的发展。

image.png

产品特性

PolarDB-X依托云资源和容器化部署能力,整体采用了基于存储计算分离的Shared-Nothing系统架构,该架构可以方便用户根据业务需要按需进行分层容量规划。全面兼容MySQL开源生态,从SQL 语法、事务行为、生态工具等多个维度都做了深度兼容,应用无需或者修改少量代码即可从 MySQL 迁移到 PolarDB-X。

PolarDB-X聚焦云原生分布式数据库,支持单机集中式到大规模分布式平滑演进,最小1个节点、最大1024节点(PB级存储)。

image.png

金融级高可用
PolarDB-X采用数据多副本架构,为了保证副本间的强一致性(RPO=0),采用Paxos的多数派复制协议,每次写入都要获得超过半数节点的确认,即便其中1个节点宕机,集群也仍然能正常提供服务。Paxos算法能够保证副本间的强一致性,彻底解决副本不一致问题。

PolarDB-X提供多种高可用形态,比如同城单机房3副本、同城三机房3副本、两地三中心5副本等,满足不同金融级别的容灾诉求。

透明分布式
让用户以单机MySQL数据库使用体验操作分布式数据库是PolarDB-X一贯追求的目标。为此PolarDB-X提供简单易用的透明分布式能力:

  • 默认主键拆分,让移植到PolarDB-X的数据和业务摆脱对设计"分区键"的依赖。

  • 高性能强一致分布式事务,PolarDB-X采用自研的X-Paxos协议保证数据存储在故障切换过程中RPO=0的基础上,使用TSO策略和分布式的MVCC能力保证了分布式事务的隔离性和一致性。

  • 分布式线性扩展,PolarDB-X基于一致性Hash的分区策略有效地进行负载均衡和热点抑制,且在扩展过程中保持计算下推和数据一致性的同时实现业务零感知。并行和流控能力为扩展期间业务连续性提供了有力保障。

  • 全局Binlog和全局一致性备份,分别解决分布式数据库各节点数据库向下游流转的难题,以及各节点备份时间差造成的恢复一致性问题。

集中式和分布式一体化
PolarDB-X全面构建集中式和分布式一体化的架构能力(简称“集分一体”),兼具分布式数据库的扩展性和集中式数据库的功能和单机性能,两种形态可以无缝切换。在集分一体化数据库中,数据节点被独立出来作为集中式形态,完全兼容单机数据库形态。当业务增长到需要分布式扩展的时候,架构会原地升级成分布式形态,分布式组件无缝对接到原有的数据节点上进行扩展,不需要数据迁移,也不需要应用侧做改造。

PolarDB-X提供两种产品形态:标准版(集中式架构)和企业版(分布式架构),支持从标准版原地升级为企业版。

HTAP一体化
随着云原生技术的不断普及,以Snowflake为代表的新一代云原生数仓、以及数据库HTAP架构不断创新,行列混存HTAP会成为数据库的标配能力。

PolarDB-X 提供列存索引的形态(Clustered Columnar Index,CCI),行存表默认有主键索引和二级索引,列存索引是一份额外基于列式结构的二级索引(覆盖行存所有列),一张表可以同时具备行存和列存的数据。同时,全面构建面向行列混合场景的代价优化器、以及向量化执行算子,通过一套SQL引擎支持行列混合查询。

开源与多云
为满足不同行业客户对部署形态的需求,PolarDB-X提供公共云、专有云、DBStack、开源软件版四种部署形态:

  • 公共云:高速迭代,稳定服务,完全托管。目前面向世界范围内13个地区提供高性能云原生分布式数据库服务。

  • 专有云(ApsaraStack):集成阿里云核心产品,满足对安全性、隔离型有合规要求的行业客户。注:由于部署资源差异,专有云和公共云的软件版本或有差异。

  • DBStack:轻量级数据库管理服务平台,集成阿里云核心数据库产品,满足构建高性能、高可用、低成本的全场景数据库解决方案用户需求。

  • 开源软件版(PolarDB-X Lite):在Lite版本中,用户可体验最新的产品特性并以最小资源构建一个分布式数据库集群。

安全与稳定
PolarDB-X通过多项国家级别的安全认证,在安全属性较高的行业,比如金融、运营商等行业的核心系统,有比较多的交付成功案例。

在数据库安全方面,PolarDB-X提供全方位的安全防护,比如:IP白名单/SSL、TDE落盘加密、备份加密、全密态、全量SQL审计和链路跟踪、三权分立和标签权限等。

PolarDB-X提供金融级的高可用容灾能力,可以满足在机房故障时数据不丢,确保RPO=0,提供两地三中心架构形态,可以满足金融行业的五级容灾要求。

典型业务场景

高负载低延时交易
场景描述:

交易场景广泛存在于互联网业务系统中,是信息系统中最为核心的组件之一。业务连续性、事务一致性和系统安全性是交易系统正常运行的基础,长时间高负载低延时的运行是互联网时代交易系统的发展方向。

产品能力:

金融级高可用、透明分布式。

数据集中存储
场景描述:

该场景也称"数据大集中"或"数据归集",属企业数据架构中的ODS层,具有承担各垂直业务数据源的数据汇总功能。高并发写入、大容量存储、多维度查询、低成本流出是该场景的主要诉求。

产品能力:

透明分布式、HTAP一体化、安全与稳定。

业务端分库分表
场景描述:

当前业务已采用开源组件实现分库分表架构,属于核心场景,数据规模大、并发量高、以及稳定性是该场景的主要诉求,同时受限于开源组件的限制,缺少有效的分布式运维能力,比如:分布式DDL、扩缩容等。

产品能力:

透明分布式。

分布式快速改造
场景描述:

当业务体量即将突破单机数据库承载极限和单表过大导致性能和维护问题时,分布式改造是解决上述问题的高性价比方案。数据库作为分布式改造的重点难点,"和使用单机数据库一样使用分布式数据库"一直是广大用户的核心诉求。

产品能力:

透明分布式、集中式和分布式一体化。

单元化容灾改造
场景描述:

金融、运营商等行业,当达到一定业务量之后,需要保证核心服务可以连续提供,避免业务连续性风险。目前,逐步尝试分布式服务化改造来实现单元化架构,每个单元都是活跃且同时承载各自业务流量,满足数据中心级别的故障隔离,实现异地多活的效果。

产品能力:

金融级高可用、透明分布式、安全与稳定。

混合负载访问
场景描述:

互联网业务的实时化、智能化趋势催生了事务数据与分析数据在相同数据源内进行混合访问(HTAP)的需求。数据一致性、访问便捷度和访问安全性是混合负载访问场景的主要诉求。

产品能力:

HTAP一体化。

业务降本增效
场景描述:

当前业务体量趋向于稳定,期望通过数据库优化来实现整体的降本诉求,比如:MySQL一键平迁、数据压缩、流量合并等。

产品能力:

集中式和分布式一体化、HTAP一体化、开源与多云。

多云容灾
场景描述:

业务有自建跨云容灾的诉求,比如:担心云厂商绑定、技术自有可控、故障逃逸能力等,期望一套数据库适配多样化的场景。

产品能力:

开源与多云。

相关实践学习
使用PolarDB和ECS搭建门户网站
本场景主要介绍如何基于PolarDB和ECS实现搭建门户网站。
阿里云数据库产品家族及特性
阿里云智能数据库产品团队一直致力于不断健全产品体系,提升产品性能,打磨产品功能,从而帮助客户实现更加极致的弹性能力、具备更强的扩展能力、并利用云设施进一步降低企业成本。以云原生+分布式为核心技术抓手,打造以自研的在线事务型(OLTP)数据库Polar DB和在线分析型(OLAP)数据库Analytic DB为代表的新一代企业级云原生数据库产品体系, 结合NoSQL数据库、数据库生态工具、云原生智能化数据库管控平台,为阿里巴巴经济体以及各个行业的企业客户和开发者提供从公共云到混合云再到私有云的完整解决方案,提供基于云基础设施进行数据从处理、到存储、再到计算与分析的一体化解决方案。本节课带你了解阿里云数据库产品家族及特性。
目录
相关文章
|
8月前
|
关系型数据库 分布式数据库 数据库
|
8月前
|
存储 关系型数据库 分布式数据库
喜报|阿里云PolarDB数据库(分布式版)荣获国内首台(套)产品奖项
阿里云PolarDB数据库管理软件(分布式版)荣获「2024年度国内首版次软件」称号,并跻身《2024年度浙江省首台(套)推广应用典型案例》。
|
12月前
|
Cloud Native 关系型数据库 分布式数据库
登顶TPC-C|云原生数据库PolarDB技术揭秘:Limitless集群和分布式扩展篇
阿里云PolarDB云原生数据库在TPC-C基准测试中以20.55亿tpmC的成绩刷新世界纪录,展现卓越性能与性价比。其轻量版满足国产化需求,兼具高性能与低成本,适用于多种场景,推动数据库技术革新与发展。
|
8月前
|
存储 NoSQL MongoDB
MongoDB数据库详解-针对大型分布式项目采用的原因以及基础原理和发展-卓伊凡|贝贝|莉莉
MongoDB数据库详解-针对大型分布式项目采用的原因以及基础原理和发展-卓伊凡|贝贝|莉莉
342 8
MongoDB数据库详解-针对大型分布式项目采用的原因以及基础原理和发展-卓伊凡|贝贝|莉莉
|
9月前
|
存储 监控 关系型数据库
突破IO瓶颈:PolarDB分布式并行查询(Parallel Query)深度调优手册
在海量数据处理中,I/O瓶颈严重制约数据库性能。本文基于PolarDB MySQL 8.0.32版本,深入解析分布式并行查询技术如何提升CPU利用率至86.7%、IO吞吐达8.5GB/s,并结合20+实战案例,系统讲解并行架构、执行计划优化、资源调优与故障排查方法,助力实现高性能数据分析。
326 6
|
11月前
|
Cloud Native 关系型数据库 分布式数据库
登顶TPC-C|云原生数据库PolarDB技术揭秘:Limitless集群和分布式扩展篇
云原生数据库PolarDB技术揭秘:Limitless集群和分布式扩展篇
|
11月前
|
SQL 存储 分布式数据库
分布式存储数据恢复—hbase和hive数据库数据恢复案例
分布式存储数据恢复环境: 16台某品牌R730xd服务器节点,每台服务器节点上有数台虚拟机。 虚拟机上部署Hbase和Hive数据库。 分布式存储故障: 数据库底层文件被误删除,数据库不能使用。要求恢复hbase和hive数据库。
404 12
|
存储 Cloud Native 数据处理
从嵌入式状态管理到云原生架构:Apache Flink 的演进与下一代增量计算范式
本文整理自阿里云资深技术专家、Apache Flink PMC 成员梅源在 Flink Forward Asia 新加坡 2025上的分享,深入解析 Flink 状态管理系统的发展历程,从核心设计到 Flink 2.0 存算分离架构,并展望未来基于流批一体的通用增量计算方向。
464 0
从嵌入式状态管理到云原生架构:Apache Flink 的演进与下一代增量计算范式
|
7月前
|
运维 监控 Cloud Native
从本土到全球,云原生架构护航灵犀互娱游戏出海
本文内容整理自「 2025 中企出海大会·游戏与互娱出海分论坛」,灵犀互娱基础架构负责人朱晓靖的演讲内容,从技术层面分享云原生架构护航灵犀互娱游戏出海经验。
626 16
|
7月前
|
运维 监控 Cloud Native
从本土到全球,云原生架构护航灵犀互娱游戏出海
内容整理自「 2025 中企出海大会·游戏与互娱出海分论坛」,灵犀互娱基础架构负责人朱晓靖的演讲内容,从技术层面分享云原生架构护航灵犀互娱游戏出海经验。