PostgreSQL的序列的性能验证

本文涉及的产品
PolarSearch,搜索节点 4核8GB
PolarDB Agent Express,2核4GB
PolarDB Agent Flow,2核4GB
简介: 前段时间有同事咨询PostgreSQL相关的问题,发现他们用了一个自动生成的32字节的字符串作为唯一键,而这张表的数据量相当大,建议他们改用序列,可减少存储空间。但用序列有一点不一样,就是序列必须顺序产生,那么高并发访问时会不会成为性能瓶颈呢?下面做个测试验证一下。
前段时间有同事咨询PostgreSQL相关的问题,发现他们用了一个自动生成的32字节的字符串作为唯一键,而这张表的数据量相当大,建议他们改用序列,可减少存储空间。但用序列有一点不一样,就是序列必须顺序产生,那么高并发访问时会不会成为性能瓶颈呢?下面做个测试验证一下。

1.测试环境

个人PC上的VMware虚拟机
PC
 CPU:Intel Core i5-3470 3.2G(4核)
 MEM:6GB
 SSD:OCZ-VERTEX4 128GB(VMware虚拟机所在磁盘,非系统盘)
 OS:Win7


VMware虚拟机
 CPU:4核
 MEM:1GB
 OS:CentOS 6.5
 PG:PostgreSQL 9.3.4(shared_buffers = 128MB,其他是默认值)

2.测试方法

创建表和序列

  1. postgres=# create sequence seq1;
  2. CREATE SEQUENCE
  3. postgres=# create sequence cached_seq cache 100;
  4. CREATE SEQUENCE
  5. postgres=# create table tb1(c1 bigint);
  6. CREATE TABLE


分别将下面的6个测试SQL写到到不同文件中

  1. select 1
  2. select nextval('seq1')
  3. select nextval('cached_seq')
  4. insert into tb1 values(1)
  5. insert into tb1 values(nextval('seq1'))
  6. insert into tb1 values(nextval('cached_seq'))

以“select 1”为例,分别测试1,10和100并发时的tps
1个并发

  1. -bash-4.1$ pgbench -n -c 1 -j 1 -T 2 -f s1.sql
  2. transaction type: Custom query
  3. scaling factor: 1
  4. query mode: simple
  5. number of clients: 1
  6. number of threads: 1
  7. duration: 2 s
  8. number of transactions actually processed: 53902
  9. tps = 26938.365906 (including connections establishing)
  10. tps = 26991.946783 (excluding connections establishing)

10个并发

  1. -bash-4.1$ pgbench -n -c 10 -j 10 -T 2 -f s1.sql
  2. transaction type: Custom query
  3. scaling factor: 1
  4. query mode: simple
  5. number of clients: 10
  6. number of threads: 10
  7. duration: 2 s
  8. number of transactions actually processed: 194019
  9. tps = 96983.799293 (including connections establishing)
  10. tps = 97749.039911 (excluding connections establishing)

100个并发

  1. -bash-4.1$ pgbench -n -c 100 -j 100 -T 2 -f s1.sql
  2. transaction type: Custom query
  3. scaling factor: 1
  4. query mode: simple
  5. number of clients: 100
  6. number of threads: 100
  7. duration: 2 s
  8. number of transactions actually processed: 178286
  9. tps = 88122.453862 (including connections establishing)
  10. tps = 97019.521088 (excluding connections establishing)

3.测试结果


                        \   发数
                   SQL   \   
1 10 100
select 1 26991 97749 97019
select nextval('seq1') 17336 61615 69211
select nextval('cached_seq') 19379 69693 76410
insert into tb1 values(1) 4042 19792 30982
insert into tb1 values(nextval('seq1')) 4083 18822 27365
insert into tb1 values(nextval('cached_seq')) 3953 18145 28701


4. 结论

1,序列创建很快
   单纯的nextval()在普通PC上都可以达到7万的tps,相比其他操作,创建序列本身要快的多,所以不大可能成为系统性能的瓶颈
2,序列的cache优化效果不大
  因为序列创建不是性能瓶颈所以也看不出cache的优化效果。序列cache后可能会导致序列的不连续,所以除非真的需要,否则不必cache。

5. 补充

序列既然提供了cache,想必对性能还是有用处的。参考网友对Oracle的测试,使用cache 50和不使用cache,处理时间居然差了100多倍。
http://blog.itpub.net/751051/viewspace-731760/

但在PostgreSQL上进行类似的带序列的批量插入的测试,cache的性能提高仍然不明显。是不是PG对序列的优化做的太好了,都不需要那种牺牲序列连续性的序列cache上场了?

  1. postgres=# insert into tb1 select 1 from (select generate_series(1,100000))tbx;
  2. INSERT 0 100000
  3. Time: 145.642 ms
  4. postgres=# insert into tb1 select 1 from (select generate_series(1,100000))tbx;
  5. INSERT 0 100000
  6. Time: 156.057 ms
  7. postgres=# insert into tb1 select 1 from (select generate_series(1,100000))tbx;
  8. INSERT 0 100000
  9. Time: 172.874 ms
  10. postgres=# insert into tb1 select nextval('seq1') from (select generate_series(1,100000))tbx;
  11. INSERT 0 100000
  12. Time: 184.046 ms
  13. postgres=# insert into tb1 select nextval('seq1') from (select generate_series(1,100000))tbx;
  14. INSERT 0 100000
  15. Time: 183.670 ms
  16. postgres=# insert into tb1 select nextval('seq1') from (select generate_series(1,100000))tbx;
  17. INSERT 0 100000
  18. Time: 183.410 ms
  19. postgres=# insert into tb1 select nextval('cached_seq') from (select generate_series(1,100000))tbx;
  20. INSERT 0 100000
  21. Time: 181.197 ms
  22. postgres=# insert into tb1 select nextval('cached_seq') from (select generate_series(1,100000))tbx;
  23. INSERT 0 100000
  24. Time: 144.633 ms
  25. postgres=# insert into tb1 select nextval('cached_seq') from (select generate_series(1,100000))tbx;
  26. INSERT 0 100000
  27. Time: 198.545 ms



相关实践学习
使用PolarDB和ECS搭建门户网站
本场景主要介绍如何基于PolarDB和ECS实现搭建门户网站。
阿里云数据库产品家族及特性
阿里云智能数据库产品团队一直致力于不断健全产品体系,提升产品性能,打磨产品功能,从而帮助客户实现更加极致的弹性能力、具备更强的扩展能力、并利用云设施进一步降低企业成本。以云原生+分布式为核心技术抓手,打造以自研的在线事务型(OLTP)数据库Polar DB和在线分析型(OLAP)数据库Analytic DB为代表的新一代企业级云原生数据库产品体系, 结合NoSQL数据库、数据库生态工具、云原生智能化数据库管控平台,为阿里巴巴经济体以及各个行业的企业客户和开发者提供从公共云到混合云再到私有云的完整解决方案,提供基于云基础设施进行数据从处理、到存储、再到计算与分析的一体化解决方案。本节课带你了解阿里云数据库产品家族及特性。
相关文章
|
存储 关系型数据库 数据库
postgresql|数据库|提升查询性能的物化视图解析
postgresql|数据库|提升查询性能的物化视图解析
1994 0
|
监控 关系型数据库 数据库
《PostgreSQL性能大提升:实用优化技巧》
《PostgreSQL性能大提升:实用优化技巧》
1124 0
|
12月前
|
SQL 关系型数据库 PostgreSQL
CTE vs 子查询:深入拆解PostgreSQL复杂SQL的隐藏性能差异
本文深入探讨了PostgreSQL中CTE(公共表表达式)与子查询的选择对SQL性能的影响。通过分析两者底层机制,揭示CTE的物化特性及子查询的优化融合优势,并结合多场景案例对比执行效率。最终给出决策指南,帮助开发者根据数据量、引用次数和复杂度选择最优方案,同时提供高级优化技巧和版本演进建议,助力SQL性能调优。
1323 1
|
缓存 关系型数据库 数据库
PostgreSQL性能
【8月更文挑战第26天】PostgreSQL性能
366 1
|
SQL 关系型数据库 OLAP
云原生数据仓库AnalyticDB PostgreSQL同一个SQL可以实现向量索引、全文索引GIN、普通索引BTREE混合查询,简化业务实现逻辑、提升查询性能
本文档介绍了如何在AnalyticDB for PostgreSQL中创建表、向量索引及混合检索的实现步骤。主要内容包括:创建`articles`表并设置向量存储格式,创建ANN向量索引,为表增加`username`和`time`列,建立BTREE索引和GIN全文检索索引,并展示了查询结果。参考文档提供了详细的SQL语句和配置说明。
599 2
|
存储 关系型数据库 MySQL
四种数据库对比MySQL、PostgreSQL、ClickHouse、MongoDB——特点、性能、扩展性、安全性、适用场景
四种数据库对比 MySQL、PostgreSQL、ClickHouse、MongoDB——特点、性能、扩展性、安全性、适用场景
|
缓存 关系型数据库 数据库
如何优化 PostgreSQL 数据库性能?
如何优化 PostgreSQL 数据库性能?
811 2
|
缓存 关系型数据库 数据库
PostgreSQL的性能
PostgreSQL的性能
877 2
|
缓存 关系型数据库 数据库
PostgreSQL 查询性能
【8月更文挑战第5天】PostgreSQL 查询性能
402 8
|
关系型数据库 Java 数据库
PostgreSQL性能
【8月更文挑战第5天】PostgreSQL性能
523 7

热门文章

最新文章

推荐镜像

更多