PostgreSQL 11 preview - 强制auto prepared statment开关(自动化plan cache)(类似Oracle cursor_sharing force)

本文涉及的产品
云原生数据库 PolarDB 分布式版,标准版 2核8GB
RDS PostgreSQL Serverless,0.5-4RCU 50GB 3个月
推荐场景:
对影评进行热评分析
云数据库 RDS SQL Server,基础系列 2核4GB
简介:

标签

PostgreSQL , Oracle , 自动plan cache , pgbouncer , simple query


背景

通常一个QUERY在执行时分为几个步骤,语义解析、SQL REWRITE、生成所有可选执行路径、选择最优路径、执行等多个步骤。

对于同一类SQL,只是更换SQL中的一些FILTER变量时,实际上很多步骤是可以共享的。例如语义解析、SQL REWRITE、生成执行计划都是可共享的,这些步骤通常比较耗CPU资源,通过prepared statement对于高并发的小事务来说,可以大幅降低CPU开销,降低延迟,性能提升非常明显。

比如:

1、简单调用,耗费较多资源

select * from tbl where id=1;  
  
select * from tbl where id=2;  

2、绑定变量,一次语义解析、SQL REWRITE、生成执行计划,多次BIND,EXEC。

prepare ps1(int) as select * from tbl where id=$1;  
  
execute ps1(1);  
  
execute ps1(2);  
  
....  

目前PostgreSQL支持几种绑定变量手段:

1、DB端绑定变量

https://www.postgresql.org/docs/10/static/sql-prepare.html

2、协议绑定变量

《学习 PostgreSQL Frontend/Backend protocol (通信协议)》

驱动使用例子

libpq  
  
jdbc  
  
...  

https://www.postgresql.org/docs/10/static/libpq-async.html

https://jdbc.postgresql.org/documentation/head/server-prepare.html

3、UDF中动态SQL绑定变量

《PostgreSQL Oracle 兼容性之 - DBMS_SQL(存储过程动态SQL中使用绑定变量)》

PostgreSQL绑定变量的使用

1、每个会话各自有各自的绑定变量,所以切换会话的话,绑定变量会失效,需要重新绑定。

《PostgreSQL plan cache 源码浅析 - 如何确保不会计划倾斜》

2、函数调用是默认用绑定变量的。(因为函数调用接口固定,很容易实现绑定变量)。

但是并不是所有场景都可以用绑定变量的,例如我们在使用连接池时,如果需要用transaction级复用机制,那么就无法使用绑定变量,因为事务结束后,连接就可能被其他会话复用,而你再次发起execute ps请求时,可能从池里分配给你的连接并不是你之前执行prepare statement的连接,导致ps不存在的错误。

那么怎么让数据库在执行简单SQL的时候,能够用上prepared statement呢?

在Oracle里面可以设置CURSOR_SHARING参数来搞定。

Oracle CURSOR_SHARING 强制绑定变量

设置CURSOR_SHARING=force,即使你使用的是简单SQL,那么在数据库中也会自动帮你转换为prepared statement,当然相比正式的绑定变量还是更耗费资源一点,毕竟parser省不了。

CURSOR_SHARING determines what kind of SQL statements can share the same cursors.  
  
参数:  
  
FORCE  
Forces statements that may differ in some literals, but are otherwise identical, to share a cursor, unless the literals affect the meaning of the statement.  
  
SIMILAR  
Causes statements that may differ in some literals, but are otherwise identical, to share a cursor, unless the literals affect either the meaning of the statement or the degree to which the plan is optimized.  
  
EXACT  
Only allows statements with identical text to share the same cursor.  

PostgreSQL 数据库强制自动绑定变量

PostgreSQL 11可能会加入这个patch,即使你执行的是简单SQL,内部也会自动对其绑定。

那么势必要让所有会话共享执行计划。最后会设计成什么样还不清楚,因为这个PATCH还没有提交。

可能的做法是1、通过开关来控制是否开启强制绑定变量,2、限制执行多少次后开启强制绑定变量,3、共享绑定变量,4、根据执行计划耗时设置阈值,来决定是否使用强制绑定变量。。。。。

https://www.postgresql.org/message-id/flat/8e76d8fc-8b8c-14bd-d4d1-e9cf193a74f5@postgrespro.ru#8e76d8fc-8b8c-14bd-d4d1-e9cf193a74f5@postgrespro.ru

Hi hackers,  
  
There were a lot of discussions about query plan caching in hackers   
mailing list, but I failed to find some clear answer for my question and   
the current consensus on this question in Postgres community. As far as   
I understand current state is the following:  
1. We have per-connection prepared statements.  
2. Queries executed inside plpgsql code are implicitly prepared.  
  
It is not always possible or convenient to use prepared statements.  
For example, if pgbouncer is used to perform connection pooling.  
Another use case (which is actually the problem I am trying to solve   
now) is partitioning.  
Efficient execution of query to partitioned table requires hardcoded   
value for partitioning key.  
Only in this case optimizer will be able to construct efficient query   
plan which access only affected tables (partitions).  
  
My small benchmark for distributed partitioned table based on pg_pathman   
+ postgres_fdw shows 3 times degrade of performance in case of using   
prepared statements.  
But without prepared statements substantial amount of time is spent in   
query compilation and planning. I was be able to speed up benchmark more   
than two time by  
sending prepared queries directly to the remote nodes.  
  
So what I am thinking now is implicit query caching. If the same query   
with different literal values is repeated many times, then we can try to   
generalize this query and replace it with prepared query with   
parameters. I am not considering now shared query cache: is seems to be   
much harder to implement. But local caching of generalized queries seems   
to be not so difficult to implement and requires not so much changes in   
Postgres code. And it can be useful not only for sharding, but for many   
other cases where prepared statements can not be used.  
  
I wonder if such option was already considered and if it was for some   
reasons rejected: can you point me at this reasons?  
  

参考

https://commitfest.postgresql.org/17/1150/

https://www.postgresql.org/message-id/flat/8e76d8fc-8b8c-14bd-d4d1-e9cf193a74f5@postgrespro.ru

https://docs.oracle.com/cd/B19306_01/server.102/b14237/initparams035.htm#REFRN10025

http://www.dba-oracle.com/t_cursor_sharing_force.htm

相关实践学习
使用PolarDB和ECS搭建门户网站
本场景主要介绍基于PolarDB和ECS实现搭建门户网站。
阿里云数据库产品家族及特性
阿里云智能数据库产品团队一直致力于不断健全产品体系,提升产品性能,打磨产品功能,从而帮助客户实现更加极致的弹性能力、具备更强的扩展能力、并利用云设施进一步降低企业成本。以云原生+分布式为核心技术抓手,打造以自研的在线事务型(OLTP)数据库Polar DB和在线分析型(OLAP)数据库Analytic DB为代表的新一代企业级云原生数据库产品体系, 结合NoSQL数据库、数据库生态工具、云原生智能化数据库管控平台,为阿里巴巴经济体以及各个行业的企业客户和开发者提供从公共云到混合云再到私有云的完整解决方案,提供基于云基础设施进行数据从处理、到存储、再到计算与分析的一体化解决方案。本节课带你了解阿里云数据库产品家族及特性。
目录
相关文章
|
6月前
|
关系型数据库 分布式数据库 数据库
PolarDB PostgreSQL版:Oracle兼容的高性能数据库
PolarDB PostgreSQL版是一款高性能的数据库,具有与Oracle兼容的特性。它采用了分布式架构,可以轻松处理大量的数据,同时还支持多种数据类型和函数,具有高可用性和可扩展性。它还提供了丰富的管理工具和性能优化功能,为企业提供了可靠的数据存储和处理解决方案。PolarDB PostgreSQL版在数据库领域具有很高的竞争力,可以满足各种企业的需求。
|
2月前
|
Oracle NoSQL 关系型数据库
主流数据库对比:MySQL、PostgreSQL、Oracle和Redis的优缺点分析
主流数据库对比:MySQL、PostgreSQL、Oracle和Redis的优缺点分析
275 2
|
6月前
|
人工智能 Oracle 关系型数据库
一篇文章弄懂Oracle和PostgreSQL的Database Link
一篇文章弄懂Oracle和PostgreSQL的Database Link
|
SQL Oracle 关系型数据库
PostgreSQL技术大讲堂 - 第27讲:Oracle-FDW部署
从零开始学PostgreSQL,PG技术大讲堂 - 第27讲:Oracle-FDW部署
220 2
|
6月前
|
SQL Oracle 关系型数据库
常用数据库的分页语句(mySQL、oracle、PostgreSQL、SQL Server)
常用数据库的分页语句(mySQL、oracle、PostgreSQL、SQL Server)
|
Oracle 关系型数据库 数据库
PostgreSQL和Oracle两种数据库有啥区别?如何选择?
PostgreSQL和Oracle两种数据库有啥区别?如何选择?
501 0
|
SQL Oracle 关系型数据库
物化视图(Oracle与PostgreSQL对比)
物化视图(Oracle与PostgreSQL对比)
|
11月前
|
SQL Oracle 关系型数据库
Oracle,Postgresql等数据库使用
Oracle,Postgresql等数据库简单使用
166 0
Oracle,Postgresql等数据库使用
|
SQL Oracle 关系型数据库
Java连接各种数据库操作(mysql、oracle、postgresql、gbase、mongo)
Java连接各种数据库操作(mysql、oracle、postgresql、gbase、mongo)
521 0
|
SQL Oracle 关系型数据库
Polar DB-O (兼容 Oracle 语法版本)和Polar DB PostgreSQL 版本概述(二)
Polar DB-O (兼容 Oracle 语法版本)和Polar DB PostgreSQL 版本概述(二)
1679 0

相关产品

  • 云原生数据库 PolarDB
  • 云数据库 RDS PostgreSQL 版
  • 推荐镜像

    更多