什么是PolarDB PostgreSQL
PolarDB PostgreSQL(下文简称为PolarDB)是一款阿里云自主研发的云原生数据库产品,100%兼容PostgreSQL,采用基于Shared-Storage的存储计算分离架构,具有极致弹性、毫秒级延迟、HTAP的能力。
- 极致弹性:存储与计算能力均可独立地横向扩展。
- 当计算能力不够时,可以单独扩展计算集群,数据无需复制。
- 当存储容量/IO不够时,可以单独扩展存储集群,而不中断业务。
- 毫秒级延迟:
- WAL日志存储在共享存储上,RW到所有RO之间仅复制WAL的元数据。
- 独创的LogIndex技术,实现了Lazy回放和Parallel回放,理论上最大程度地缩小了RW和RO节点间的延迟。
- HTAP能力:基于Shared-Storage的分布式并行执行框架,加速在OLTP场景下的OLAP查询。一套OLTP型的数据,可支持2套计算引擎:
- 单机执行引擎:处理高并发的TP型负载。
- 分布式执行引擎:处理大查询的AP型负载。
PolarDB还支持时空、GIS、图像、向量、搜索、图谱等多模创新特性,应对企业对数据处理日新月异的需求。
另外,除了上述Shared-Storage云原生的模式,PolarDB还支持以Shared-Nothing模式部署,详见distribute分支的Readme。
分支说明
PolarDB后续默认分支为main分支,支持存储计算分离的形态。distribute分支是分布式形态(对应之前的master分支)。
产品架构和版本规划
PolarDB采用了基于Shared-Storage的存储计算分离架构。数据库由传统的Share-Nothing,转变成了Shared-Storage架构。由原来的N份计算+N份存储,转变成了N份计算+1份存储。虽然共享存储上数据是一份,但是数据在内存中的状态是不同的,需要通过内存状态的同步来维护数据的一致性;同时主节点在刷脏时也需要做协调,避免只读节点读取到超前的“未来页面”,也要避免只读节点读取到过时的没有在内存中被正确回放的“过去页面”。为了解决该问题,PolarDB创造性地设计了LogIndex数据结构来维护页面的回放历史,该结构能够在主节点到只读节点进行同步。
在存储计算分离后,IO单路延迟变大的同时,IO的吞吐也变大了。在处理分析型查询时,仅使用单个只读节点无法发挥出存储侧的大IO带宽优势,也无法发挥其他只读节点的CPU/Mem/IO。为了解决该问题,PolarDB研发了基于Shared-Storage的并行执行引擎,能够在SQL级别上弹性利用任意数目的CPU来加速分析查询,支持HTAP的混合负载场景。
文档
快速入门
我们提供了三种途径来使用PolarDB数据库:阿里巴巴云服务、搭建本地存储的实例、搭建基于PFS共享存储的实例(即将上线)。
阿里巴巴云服务
阿里云云原生关系型数据库PolarDB PostgreSQL引擎:官网地址。
搭建本地存储的实例
我们提供了一键部署脚本,助您快速编译PolarDB内核并搭建本地实例。本节介绍了如何通过提供的一键部署脚本,快速搭建存储为本地磁盘的PolarDB实例。
**操作系统要求:**CentOS 7.5及以上。以下步骤在CentOS 7.5上通过测试。
**说明:**请使用同一个用户进行以下步骤。请勿使用root用户搭建实例。
- 下载PolarDB源代码,地址:https://github.com/alibaba/PolarDB-for-PostgreSQL/tree/main。
- 安装相关依赖:
sudo yum install readline-devel zlib-devel perl-CPAN bison flex sudo cpan -fi Test::More IPC::Run
- 根据不同的搭建场景,可选择不同的脚本执行命令:
- 只编译数据库源码,不创建本地实例:
./polardb_build.sh --noinit
- 编译并创建本地单节点实例,节点为主节点(端口为5432):
./polardb_build.sh
- 编译并创建本地多节点实例,节点包括:
- 主节点1个(端口为5432)。
- 只读节点1个(端口为5433)。
./polardb_build.sh --withrep --repnum=1
- 编译并创建本地多节点实例,节点包括:
- 主节点1个(端口为5432)。
- 只读节点1个(端口为5433)。
- 备库节点1个(端口为5434)。
./polardb_build.sh --withrep --repnum=1 --withstandby
- 编译并创建本地多节点实例,节点包括:
- 主节点1个(端口为5432)
- 只读节点2个(端口分别为5433与5434)
- 备库节点1个(端口为5435)。
./polardb_build.sh --withrep --repnum=2 --withstandby
- 部署完成后,需要进行实例检查和测试,确保部署正确。
- 实例检查:
$HOME/tmp_basedir_polardb_pg_1100_bld/bin/psql -p 5432 -c 'select version();' $HOME/tmp_basedir_polardb_pg_1100_bld/bin/psql -p 5432 -c 'select * from pg_replication_slots;'
- 一键执行全量回归测试:
./polardb_build.sh --withrep --repnum=1 --withstandby -r-check-all -e -r-contrib -r-pl -r-external -r-installcheck-all
软件许可说明
PolarDB的代码的发布基于Apache 2.0版本和PostgreSQL代码的软件许可。相关的许可说明可参见License和NOTICE。
致谢
部分代码和设计思路参考了其他开源项目,例如:PG-XC/XL(pgxc_ctl)、TBase(部分基于时间戳的vacuum 和MVCC)、Greenplum以及Citus(pg_cron)。感谢以上开源项目的贡献。
联系我们
- PolarDB PostgreSQL Slack:https://app.slack.com/client/T023NM10KGE/C023VEMKS02。
- 使用钉钉扫描如下二维码,加入PolarDB技术推广组钉钉群。