唯一索引的行估算实验

简介: 唯一索引的行估算实验 唯一索引除了有业务上约束作用,还可以使行估算更准确。 对唯一索引列的等值条件查询,即使统计信息缺失,也能得到准确的行估算值即1。 实验 创建不收集统计信息的测试表 postgres=# create table t...

唯一索引的行估算实验

唯一索引除了有业务上约束作用,还可以使行估算更准确。 对唯一索引列的等值条件查询,即使统计信息缺失,也能得到准确的行估算值即1。

实验

创建不收集统计信息的测试表

postgres=# create table tbc1(id int) with (autovacuum_enabled=off);
CREATE TABLE
postgres=# insert into tbc1 select * from generate_series(1,10000);
INSERT 0 10000 

查询某唯一值,但行估算为57。

postgres=# explain select * from tbc1 where id =10;
                      QUERY PLAN                       
-------------------------------------------------------
 Seq Scan on tbc1  (cost=0.00..188.44 rows=57 width=4)
   Filter: (id = 10)
(2 rows) 

创建普通索引,行估算仍为50。

postgres=# create index on tbc1(id);
CREATE INDEX
postgres=# explain select * from tbc1 where id =10;
                                QUERY PLAN                                 
---------------------------------------------------------------------------
 Bitmap Heap Scan on tbc1  (cost=2.17..38.17 rows=50 width=4)
   Recheck Cond: (id = 10)
   ->  Bitmap Index Scan on tbc1_id_idx  (cost=0.00..2.16 rows=50 width=0)
         Index Cond: (id = 10)
(4 rows) 

创建唯一索引,行估算变为1和实际吻合。

postgres=# create unique index on tbc1(id);
CREATE INDEX
postgres=# explain select * from tbc1 where id =10;
                                  QUERY PLAN                                  
------------------------------------------------------------------------------
 Index Only Scan using tbc1_id_idx1 on tbc1  (cost=0.29..3.30 rows=1 width=4)
   Index Cond: (id = 10)
(2 rows) 

唯一索引对行估算的作用不适用于非等值条件,比如范围条件

postgres=# explain analyze select * from tbc1 where id   Bitmap Index Scan on tbc1_id_idx1  (cost=0.00..40.28 rows=3333 width=0) (actua
l time=0.007..0.007 rows=0 loops=1)
         Index Cond: (id 

SQL中也不要在条件字段上附加计算或类型转换,否则即使有唯一索引估算也不会准。

postgres=# explain select * from tbc1 where id::text ='10';
                      QUERY PLAN                       
-------------------------------------------------------
 Seq Scan on tbc1  (cost=0.00..220.00 rows=50 width=4)
   Filter: ((id)::text = '10'::text)
(2 rows) 

由于关闭auto_autovacuum,测试过程中全程测试表统计信息都为空

postgres=# select * from pg_stats where tablename='tbc1';
 schemaname | tablename | attname | inherited | null_frac | avg_width | n_distinct | 
most_common_vals | most_common_freqs | histogram_bounds | correlation | most_common_e
lems | most_common_elem_freqs | elem_count_histogram 
------------+-----------+---------+-----------+-----------+-----------+------------+-
-----------------+-------------------+------------------+-------------+--------------
-----+------------------------+----------------------
(0 rows)
相关文章
|
4月前
|
SQL 关系型数据库 分布式数据库
在PolarDB中,行数评估是通过对表的统计数据、基数估计以及算子代价模型来进行估算的。
【2月更文挑战第14天】在PolarDB中,行数评估是通过对表的统计数据、基数估计以及算子代价模型来进行估算的。
131 1
|
10天前
|
机器学习/深度学习
【LLM提示技术:零样本提示、少样本提示】
本文介绍了零样本和少样本提示技术在大型语言模型中的应用。零样本提示指模型无需示例即可完成任务,而少样本提示则通过提供少量示例提升模型的表现。文中详细探讨了这两种技术的特点与限制,并通过具体示例说明了其在不同任务中的效果。研究表明,指令调整和人类反馈可增强模型性能,而对于复杂任务,则需更高级的提示工程,如思维链提示。
【LLM提示技术:零样本提示、少样本提示】
|
2月前
|
关系型数据库 分布式数据库 数据库
PolarDB产品使用问题之行数评估是通过什么估算的
PolarDB产品使用合集涵盖了从创建与管理、数据管理、性能优化与诊断、安全与合规到生态与集成、运维与支持等全方位的功能和服务,旨在帮助企业轻松构建高可用、高性能且易于管理的数据库环境,满足不同业务场景的需求。用户可以通过阿里云控制台、API、SDK等方式便捷地使用这些功能,实现数据库的高效运维与持续优化。
|
SQL 存储 搜索推荐
|
人工智能 BI
估算
估算
83 0
|
存储 缓存 分布式计算
性能估算-汇总【转】
假期重新把之前在新浪博客里面的文字梳理了下,搬到这里。
640 0