PostgreSQL bloom filter index 扩展 for bigint

本文涉及的产品
Redis 开源版,标准版 2GB
推荐场景:
搭建游戏排行榜
云数据库 Tair(兼容Redis),内存型 2GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
简介: 标签PostgreSQL , bloom filter , bloom filter index背景凡是支持HASH函数,以及相等operator的类型,都可以使用bloom filter index .扩展方法见本文。

标签

PostgreSQL , bloom filter , bloom filter index


背景

凡是支持HASH函数,以及相等operator的类型,都可以使用bloom filter index .

扩展方法见本文。

原文

https://obartunov.livejournal.com/201027.html

Bloom index by default works for int4 and text, but other types with hash function and equality operator could be supported.

Just use opclass interface, for example, for type bigint

create extension bloom;  
  
postgres=# select * from pg_opclass where opcname='bigint_ops';  
 opcmethod | opcname | opcnamespace | opcowner | opcfamily | opcintype | opcdefault | opckeytype   
-----------+---------+--------------+----------+-----------+-----------+------------+------------  
(0 rows)  

创建bigint的bloom filter index支持。

CREATE OPERATOR CLASS bigint_ops   
DEFAULT FOR TYPE bigint USING bloom AS   
OPERATOR 1 = (bigint, bigint),  
FUNCTION 1 hashint8(bigint);  
  
  
postgres=# select * from pg_opclass where opcname='bigint_ops';  
 opcmethod |  opcname   | opcnamespace | opcowner | opcfamily | opcintype | opcdefault | opckeytype   
-----------+------------+--------------+----------+-----------+-----------+------------+------------  
    136065 | bigint_ops |         2200 |       10 |    136074 |        20 | t          |          0  
(1 row)	  

Now, you can build bloom index for bigint data type.

Data types, which could be supported by bloom index.

查询可以支持bloom filter的类型,HASH函数

凡是支持HASH函数,以及相等operator操作符的类型,都可以使用bloom filter index .

postgres=# select oid,* from pg_am;  
  oid   | amname |  amhandler  | amtype   
--------+--------+-------------+--------  
    403 | btree  | bthandler   | i  
    405 | hash   | hashhandler | i  
    783 | gist   | gisthandler | i  
   2742 | gin    | ginhandler  | i  
   4000 | spgist | spghandler  | i  
   3580 | brin   | brinhandler | i  
  18204 | rum    | rumhandler  | i  
 136050 | bloom  | blhandler   | i  
(8 rows)  

查询可以支持bloom filter的类型,HASH函数

SELECT oc.opcintype::regtype, p.amproc FROM pg_opclass oc  
JOIN pg_amproc p ON p.amprocfamily = oc.opcfamily  
WHERE oc.opcmethod = 405 -- hash am   
AND oc.opcdefault -- 默认proc for this am  
-- https://www.postgresql.org/docs/devel/static/xindex.html Strategies number  
AND p.amprocnum = 1    
AND p.amproclefttype = oc.opcintype   
AND p.amprocrighttype = oc.opcintype;  
          opcintype          |     amproc       
-----------------------------+----------------  
 character                   | hashbpchar  
 "char"                      | hashchar  
 date                        | hashint4  
 anyarray                    | hash_array  
 real                        | hashfloat4  
 double precision            | hashfloat8  
 inet                        | hashinet  
 smallint                    | hashint2  
 integer                     | hashint4  
 bigint                      | hashint8  
 interval                    | interval_hash  
 macaddr                     | hashmacaddr  
 name                        | hashname  
 oid                         | hashoid  
 oidvector                   | hashoidvector  
 text                        | hashtext  
 time without time zone      | time_hash  
 numeric                     | hash_numeric  
 timestamp with time zone    | timestamp_hash  
 time with time zone         | timetz_hash  
 timestamp without time zone | timestamp_hash  
 boolean                     | hashchar  
 bytea                       | hashvarlena  
 xid                         | hashint4  
 cid                         | hashint4  
 abstime                     | hashint4  
 reltime                     | hashint4  
 aclitem                     | hash_aclitem  
 uuid                        | uuid_hash  
 pg_lsn                      | pg_lsn_hash  
 macaddr8                    | hashmacaddr8  
 anyenum                     | hashenum  
 anyrange                    | hash_range  
 jsonb                       | jsonb_hash  
(34 rows)  

创建索引,例子

postgres=# create table test(id int, c1 int8, c2 int8, c3 int8);  
CREATE TABLE  
postgres=# create index idx_test_1 on test using bloom (c1,c2,c3);  
CREATE INDEX  
  
  
postgres=# set enable_seqscan=off;  
SET  
postgres=# explain select * from test where c1=1::int8 and c2=1::int8 and c3=1::int8;  
                                       QUERY PLAN                                         
----------------------------------------------------------------------------------------  
 Bitmap Heap Scan on test  (cost=15.73..15.75 rows=1 width=28)  
   Recheck Cond: ((c1 = '1'::bigint) AND (c2 = '1'::bigint) AND (c3 = '1'::bigint))  
   ->  Bitmap Index Scan on idx_test_1  (cost=0.00..15.73 rows=1 width=0)  
         Index Cond: ((c1 = '1'::bigint) AND (c2 = '1'::bigint) AND (c3 = '1'::bigint))  
(4 rows)  
  
postgres=# set enable_seqscan =on;  
SET  
postgres=# explain select * from test where c1=1::int8 and c2=1::int8 and c3=1::int8;  
                                  QUERY PLAN                                    
------------------------------------------------------------------------------  
 Seq Scan on test  (cost=0.00..9.85 rows=1 width=28)  
   Filter: ((c1 = '1'::bigint) AND (c2 = '1'::bigint) AND (c3 = '1'::bigint))  
(2 rows)  

参考

https://obartunov.livejournal.com/201027.html

https://www.postgresql.org/docs/devel/static/xindex.html

相关实践学习
使用PolarDB和ECS搭建门户网站
本场景主要介绍基于PolarDB和ECS实现搭建门户网站。
阿里云数据库产品家族及特性
阿里云智能数据库产品团队一直致力于不断健全产品体系,提升产品性能,打磨产品功能,从而帮助客户实现更加极致的弹性能力、具备更强的扩展能力、并利用云设施进一步降低企业成本。以云原生+分布式为核心技术抓手,打造以自研的在线事务型(OLTP)数据库Polar DB和在线分析型(OLAP)数据库Analytic DB为代表的新一代企业级云原生数据库产品体系, 结合NoSQL数据库、数据库生态工具、云原生智能化数据库管控平台,为阿里巴巴经济体以及各个行业的企业客户和开发者提供从公共云到混合云再到私有云的完整解决方案,提供基于云基础设施进行数据从处理、到存储、再到计算与分析的一体化解决方案。本节课带你了解阿里云数据库产品家族及特性。
目录
相关文章
|
存储 NoSQL 关系型数据库
PostgreSQL列存扩展hydra简单测试
Hydra是一款PostgreSQL的扩展,为PostgreSQL增加了列存引擎,使得PostgreSQL的olap性能大幅提升,本文介绍Hydra基本的使用方法。
|
存储 安全 关系型数据库
PostgreSQL物化视图增量更新扩展 -- pg_ivm
PostgreSQL不支持物化视图增量更新,需要定期执行REFRESH MATERIALIZED VIEW命令刷新物化视图。Incremental View Maintenance (IVM)是一种使物化视图保持最新的方法,其中只计算增量更改并将其应用于视图,而不是REFRESH MATERIALIZED VIEW那样从头开始重新计算内容。当只更改视图的一小部分时,IVM可以比重新计算更高效地更新物化视图。
|
4月前
|
SQL 关系型数据库 C语言
PostgreSQL SQL扩展 ---- C语言函数(三)
可以用C(或者与C兼容,比如C++)语言编写用户自定义函数(User-defined functions)。这些函数被编译到动态可加载目标文件(也称为共享库)中并被守护进程加载到服务中。“C语言函数”与“内部函数”的区别就在于动态加载这个特性,二者的实际编码约定本质上是相同的(因此,标准的内部函数库为用户自定义C语言函数提供了丰富的示例代码)
|
关系型数据库 PostgreSQL
PostgreSQL pg_orphaned扩展
由于种种原因,PostgreSQL可能会产生一些孤儿文件,这些文件会占用磁盘空间,手工查找费时费力还容易出错,pg_orphaned扩展很好的解决了这个问题。
|
SQL 关系型数据库 Go
《增强你的PostgreSQL:最佳扩展和插件推荐》
《增强你的PostgreSQL:最佳扩展和插件推荐》
1079 0
|
8月前
|
SQL 关系型数据库 C语言
PostgreSQL【应用 03】Docker部署的PostgreSQL扩展SQL之C语言函数(编写、编译、载入)计算向量余弦距离实例分享
PostgreSQL【应用 03】Docker部署的PostgreSQL扩展SQL之C语言函数(编写、编译、载入)计算向量余弦距离实例分享
111 0
|
8月前
|
SQL 关系型数据库 数据库
PostgreSQL【应用 02】扩展SQL之C语言函数(编写、编译、载入)实例分享
PostgreSQL【应用 02】扩展SQL之C语言函数(编写、编译、载入)实例分享
263 0
|
8月前
|
SQL 关系型数据库 编译器
PostgreSQL SQL扩展 ---- C语言函数(二)
可以用C(或者与C兼容,比如C++)语言编写用户自定义函数(User-defined functions)。这些函数被编译到动态可加载目标文件(也称为共享库)中并被守护进程加载到服务中。“C语言函数”与“内部函数”的区别就在于动态加载这个特性,二者的实际编码约定本质上是相同的(因此,标准的内部函数库为用户自定义C语言函数提供了丰富的示例代码)
|
8月前
|
SQL 存储 关系型数据库
PostgreSQL SQL扩展 ---- C语言函数(一)
可以用C(或者与C兼容,比如C++)语言编写用户自定义函数(User-defined functions)。这些函数被编译到动态可加载目标文件(也称为共享库)中并被守护进程加载到服务中。“C语言函数”与“内部函数”的区别就在于动态加载这个特性,二者的实际编码约定本质上是相同的(因此,标准的内部函数库为用户自定义C语言函数提供了丰富的示例代码)
|
SQL 存储 缓存
「PostgreSQL技术」扩展Postgresql到TB
「PostgreSQL技术」扩展Postgresql到TB

相关产品

  • 云原生数据库 PolarDB