【DB吐槽大会】第64期 - PG 里面的某些单核瓶颈

简介: 大家好,这里是DB吐槽大会,第64期 - PG 里面的某些单核瓶颈

背景


1、产品的问题点

  • PG 里面的某些单核瓶颈

2、问题点背后涉及的技术原理

  • 虽然PG已经支持并行计算, 大多数的SQL支持通过并行计算加速, 使得PG可以支撑OLAP类业务. 但是还存在一些单核场景.
  • WAL writer
  • vacuum 单表/单分区时
  • checkpointer
  • 崩溃recovery时

3、这个问题将影响哪些行业以及业务场景

  • 写压力较大的场景
  • 表比较大而且这个表的更新并发较高的场景, 例如互联网业务
  • ssd云盘使用网络通信, 相比本地盘存在先天缺陷, 虽然带宽大, 但是每次IO的延迟较高. 所以小IO或离散IO的场景(特别是数据库): 单线程打不满IO.

4、会导致什么问题?

  • 写压力特别大的场景, 可能有两个性能瓶颈, datalbock extend exclusive lock, 或者 wal insert exclusive lock.
  • 表比较大, 而且更新并发高时, 可能导致vacuum赶不上产生垃圾的速度, 产生恶性表膨胀.
  • shared buffer配置较大而且脏页较多时, checkpoint 周期可能会很长.
  • 如果检查点周期很长, 崩溃恢复过程中需要恢复的WAL文件数可能较多, 从而导致恢复时间漫长.

5、业务上应该如何避免这个坑

  • 拆库
  • 拆表或使用分区表, 解决vacuum 单表/单分区串行问题.
  • 配置更豪华的SSD存储, 一定程度缓解检查点慢或者恢复慢点问题

6、业务上避免这个坑牺牲了什么, 会引入什么新的问题

  • 需要调整业务, 可能涉及业务代码的修改.
  • 分区表会引入一定的性能问题. (PG大版本有改观, 性能影响几乎可以忽略不计, 一定要用大版本).

7、数据库未来产品迭代如何修复这个坑

  • 希望内核层面可以支持更多并行化的后台进程任务
  • 采用 wal 分区设计、减少锁冲突、同时支持更多的并行insert
  • 支持vacuum 单表/单分区/单索引内的并行(目前支持单表的多个索引的并行)
  • 支持并行的checkpoint, 支持并行的recovery



相关文章
|
存储 传感器 监控
【DB吐槽大会】第1期——PG MVCC
大家好,这是DB吐槽大会,第1期 - PG MVCC
12423 0
|
SQL Oracle 关系型数据库
【DB吐槽大会】第48期 - PG 性能问题发现和分析能力较弱
大家好,这里是DB吐槽大会,第48期 - PG 性能问题发现和分析能力较弱
|
关系型数据库 Java 分布式数据库
【DB吐槽大会】第9期 - PG 大量连接写小事务性能差
大家好,这里是DB吐槽大会,第9期 - PG 大量连接写小事务性能差
|
SQL 关系型数据库 Java
【DB吐槽大会】第8期 - PG 高并发短连接性能差
大家好,这里是DB吐槽大会,第8期 - PG 高并发短连接性能差
|
JSON 固态存储 关系型数据库
【DB吐槽大会】第43期 - PG 倒排索引启动和recheck代价高
大家好,这里是DB吐槽大会,第43期 - PG 倒排索引启动和recheck代价高
|
SQL Oracle 关系型数据库
【DB吐槽大会】第65期 - PG 没有内置进程池
大家好,这里是DB吐槽大会,第65期 - PG 没有内置进程池
|
存储 NoSQL 关系型数据库
【DB吐槽大会】第56期 - PG 分析场景IO消耗较大, 计算有巨大性能提升空间
大家好,这里是DB吐槽大会,第56期 - PG 分析场景IO消耗较大, 计算有巨大性能提升空间
|
SQL 资源调度 并行计算
【DB吐槽大会】第54期 - PG 资源隔离、管理手段较少
大家好,这里是DB吐槽大会,第54期 - PG 资源隔离、管理手段较少
|
SQL 监控 关系型数据库
【DB吐槽大会】第40期 - PG 缺少qps计数器
大家好,这里是DB吐槽大会,第40期 - PG 缺少qps计数器
|
SQL 关系型数据库 中间件
【DB吐槽大会】第42期 - PG 读写分离不友好
大家好,这里是DB吐槽大会,第42期 - PG 读写分离不友好

相关实验场景

更多