PostgreSQL 11 新特性解读 : 支持并行创建索引(Parallel Index Builds)

2018-11-19 5418

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

PolarDB Agent Express，2核4GB

PolarDB Agent Flow，2核4GB

PolarSearch，搜索节点 4核8GB

简介：

PostgreSQL 11 版本在并行方面得到增强，例如支持并行创建索引、并行Hash Join、并行 CREATE TABLE .. AS等，本文先介绍并行创建索引。

PostgreSQL 11 版本并行创建索引仅支持 B-tree 索引，其它类型索引现阶段不支持并行创建。

并行进程相关参数

介绍并行创建索引之前先来看看并行进程的相关 postgresql.conf 参数。

max_parallel_maintenance_workers
max_parallel_maintenance_workers 参数设置维护命令(例如 CREATE INDEX) 命令允许的最大并行进程数，默认值为2。
max_parallel_workers
设置系统支持的最大并行进程数，默认值为8。
max_worker_processes
设置数据库的最大后台进程数，默认值为8。
max_parallel_workers_per_gather
设置单个Gather或Gather Merge节点能够启用的最大并行进程数，默认值为2，并行查询(Parallel Query)的并行度受此参数的影响，CREATE INDEX 命令的并行度不受此参数影响。

以上参数可能并不容易理解，进一步解释如下：

max_worker_processes 参数设置的是数据库允许的最大后台进程数，并行进程属于后台进程的一种；
max_parallel_workers 参数设置数据库允许的最大并行进程数，这个值小于或等于 max_worker_processes。
并行进程数设置分为两类，第一类是并行查询，并行查询的并行度由 max_parallel_workers_per_gather 参数控制，第二类是维护命令(例如 CREATE INDEX)，维护命令的并行度由 max_parallel_maintenance_workers 参数控制。
max_parallel_workers_per_gather+max_parallel_maintenance_workers值应小于或等于 max_parallel_workers。

postgresql.conf 设置以下并行度参数如下：

max_worker_processes = 16               # (change requires restart)
max_parallel_maintenance_workers = 4    # taken from max_parallel_workers
max_parallel_workers_per_gather = 4     # taken from max_parallel_workers
max_parallel_workers = 8

测试环境准备

创建测试表big并插入3000万条数据，如下：

CREATE TABLE big(user_id int4,user_name text,ctime timestamp(6) without time zone default clock_timestamp() );
INSERT INTO big(user_id,user_name) SELECT  n ,n || '_data' FROM generate_series(1,30000000) n;;

并行创建索引

在会话级设置max_parallel_maintenance_workers值为4。

francs=> set max_parallel_maintenance_workers =4;
SET

创建索引，如下

francs=> CREATE INDEX idx_big_ctime ON big USING BTREE(ctime);
CREATE INDEX

在主机上通过 top 命令可以看到 CREATE INDEX 命令的进程号为 21164，并且开启了4个并发子进程。

创建索引并行度测试

设置 max_parallel_maintenance_workers 值不同并行度，测试并行索引创建的时间。

本测试环境为一台4核8GB内存的虚机，测试结果如下：

max_parallel_maintenance_workers	索引创建时间(毫秒)
0	14938.738
2	10469.283
4	10439.237
6	11577.147
8	17020.216

从以上看出，当 max_parallel_maintenance_workers 值为4时索引创建时间出现拐点。

关闭指定表并行创建索引

通过前面介绍大家知道可通过设置max_parallel_maintenance_workers参数为0关闭所有表的并行创建索引，如何关闭指定表的并行索引创建呢？

可通过 ALTER TABLE 方式禁止表上的并行创建索引，如下禁止表big上的所有并行创建索引。

francs=> ALTER TABLE big SET (parallel_workers=0);
ALTER TABLE

如果想恢复指定表上的parallel_workers参数设置，使用 RESET 选项即可，如下：

francs=> ALTER TABLE big RESET(parallel_workers);
ALTER TABLE

参考

新书推荐

最后推荐和张文升共同编写的《PostgreSQL实战》，本书基于PostgreSQL 10 编写，共18章，重点介绍SQL高级特性、并行查询、分区表、物理复制、逻辑复制、备份恢复、高可用、性能优化、PostGIS等，涵盖大量实战用例！

购买链接：https://item.jd.com/12405774.html

_5_PostgreSQL_

PostgreSQL 11 新特性解读 : 支持并行创建索引(Parallel Index Builds)

并行进程相关参数

测试环境准备

并行创建索引

创建索引并行度测试

关闭指定表并行创建索引

参考

新书推荐

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

PostgreSQL 11 新特性解读 : 支持并行创建索引(Parallel Index Builds)

并行进程相关参数

测试环境准备

并行创建索引

创建索引并行度测试

关闭指定表并行创建索引

参考

新书推荐

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像