沉浸式学习PostgreSQL|PolarDB 20: 学习成为数据库大师级别的优化技能-阿里云开发者社区

作者

digoal

日期

2023-10-12

背景

欢迎数据库应用开发者参与贡献场景, 在此issue回复即可, 共同建设《沉浸式数据库学习教学素材库》, 帮助开发者用好数据库, 提升开发者职业竞争力, 同时为企业降本提效.

系列课程的核心目标是教大家怎么用好数据库, 而不是怎么运维管理数据库、怎么开发数据库内核. 所以面向的对象是数据库的用户、应用开发者、应用架构师、数据库厂商的产品经理、售前售后专家等角色.

本文的实验可以使用永久免费的阿里云云起实验室来完成.

如果你本地有docker环境也可以把镜像拉到本地来做实验:

x86_64机器使用以下docker image:

《amd64 image》

ARM机器使用以下docker image:

《arm64 image》

业务场景1 介绍: 学习成为数据库大师级别的优化技能

在上一个实验《沉浸式学习PostgreSQL|PolarDB 19: 体验最流行的开源企业ERP软件 odoo》中, 学习了如何部署odoo和polardb|pg.

由于ODOO是非常复杂的ERP软件, 对于关系数据库的挑战也非常大, 所以通过odoo业务可以更快速提升同学的数据库优化能力, 发现业务对数据库的使用问题(如索引、事务对锁的运用逻辑问题), 数据库的代码缺陷, 参数或环境配置问题, 系统瓶颈等.

优化实验

odoo的压力测试脚本在如下目录中: PolarDB-PG-Benchmark/tests

1 优化TOP SQL性能

这个优化是比较通用的, 古话说得好, 擒贼先擒王, 打蛇打七寸. 找出TOP SQL, 对资源消耗的头部SQL进行优化, 效果立竿见影.

准备: 插件pg_stat_statements

实验步骤:

1、清理pg_stat_statements插件计数

2、使用固定的数据量、压测时长、并发、压测请求数开启压测, 关闭压测

3、利用pg_stat_statements, 记录总资源消耗、被优化SQL的单次请求平均消耗. 用于评判优化效果.

4、利用pg_stat_statements找top sql并优化, 方法可参考:

索引优化参考:

5、执行完优化手段后, 再次重复1-3的操作.

对比优化效果:

总资源消耗
被优化SQL的单次请求平均消耗
odoo压测结果变化

2 发现业务逻辑问题 - 锁冲突为例

这个实验主要用于发现业务层的数据库使用问题, 其中最突出的是锁等待的问题, 例如持锁时间过长, 持锁级别过高, 死锁等. 这些问题都会导致并发能力下降甚至雪崩.

准备: 开启log_lock_waits, 配置deadlock_timeout.

1、配置等待事件采集. pgpro-pwr, performance insight, pg_stat_monitor, pg_wait_sampling 都可以, 参考:

2、使用固定的数据量、压测时长、并发、压测请求数开启压测, 关闭压测

3、观测数据库日志 $PGDATA/pg_log 或 $PGDATA/log 目录.

通过锁超时日志, 找到对应会话和SQL, 分析业务问题.

4、通过前面配置的 perf insight, pg_stat_monitor, pg_wait_sampling 找到TOP锁等待事件和对应的SQL.

5、优化手段举例:

秒杀场景可以用advisory lock来优化.

业务并行请求都锁冲突问题, 可以调整并行逻辑, 在业务层面进行线程-数据映射逻辑优化, 对锁进行隔离进行优化.

《高并发队列处理业务的数据库性能优化 - IO扫描|CPU计算浪费 , 锁冲突 , 垃圾索引扫描浪费》

业务使用大锁, 且长时间持有锁带来的问题优化:

《DB吐槽大会,第84期 - PG逻辑备份释放对象元数据共享锁不及时》

在事故现场如何发现锁冲突是什么业务导致的?

雪崩的优化方法:

6、通过规范可以避免业务使用数据库不当导致的大部分问题

《PostgreSQL 数据库开发规范》

3 环境和参数性能优化

1、使用固定的数据量、压测时长、并发、压测请求数开启压测

在压测过程收集数据, 观测问题

2、OS层观测工具参考

iostat
pmstat
mpstat
vmstat
tcpdump
top
ps
gdb
pstack

指标参考:

3、发现问题

内存不足?
存储请求延迟、IOPS、带宽瓶颈?
文件系统锁等待瓶颈?
网络包转发、带宽?
numa问题?
中断问题, cpu 绑核?

4、优化手段参考

4 整体变慢的性能优化通用方法

5 找出代码缺陷

最后这个实验, 是要找出数据库|OS内核的性能瓶颈.

1、使用固定的数据量、压测时长、并发、压测请求数开启压测

在压测过程收集数据, 观测问题

2、观测工具参考

perf
dtrace
systemtap

工具使用方法参考:

附赠一些常用的学习资料

知识点

要求的知识点比较综合, 需掌握os,存储,网络,数据库等原理和常用的工具, 方法论等.

思考

1 除了以上优化, 通常还需要结合数据库的原理进行优化, 例如

《PostgreSQL 空间st_contains，st_within空间包含搜索优化 - 降IO和降CPU(bound box) (多边形GiST优化)》

2 数据库中有大量的优化器因子配置项, 参数优化和硬件配置有什么关系?

3 数据库的cbo, geqo优化器优化规则说的是什么? 和统计信息如何配合? 如何选择JOIN方法JOIN顺序?

沉浸式学习PostgreSQL|PolarDB 20: 学习成为数据库大师级别的优化技能

作者

日期

标签

背景

业务场景1 介绍: 学习成为数据库大师级别的优化技能

优化实验

1 优化TOP SQL性能

2 发现业务逻辑问题 - 锁冲突为例

3 环境和参数性能优化

4 整体变慢的性能优化通用方法

5 找出代码缺陷

附赠一些常用的学习资料

知识点

思考

参考

PolarDB PostgreSQL 版

热门文章

最新文章

相关产品

相关课程

相关电子书

相关实验场景

推荐镜像