GIN 索引代替 bitmap 索引

简介: 使用GIN代替bitmap索引, 减少索引空间开销

在一些数据库系统中, bitmap 索引经常用来给一些具有大量重复值的字段建立索引。 布尔字段(性别)、状态编码等。
相比于使用正常的 B-Tree 索引, Bitmap 显示的非常高效。

PostgreSQL 并不支持bitmap索引, 但是使用GIN索引可以非常好的处理这种冗余度高的字段。GIN 索引的内部结构与bitmap
是非常相似的。它并不是使用bitmap作为索引项,但是在9.4版本中,它使用的是 varbyte 编码,在最好的情况下, 每一个索引
项只需要占用一个字节。之前是使用 2-3个字节用来存放索引项。在早期的版本,是使用6个字节来存放索引条目,但是这相比于
B-Tree 每个索引条目仍然具有非常小的开销。

创建一个表, 并使用一些字段用来填充它。


CREATE TABLE numbers (n int4, mod2 int4);

insert into numbers (n, mod2) select n, n%2 from generate_series(1, 10000000) n;

这里用到了扩展件 btree_gin, 下面为表创建 GIN 索引


create extension btree_gin;

create index numbers_mod2_gin_idx on numbers using gin(mod2);

对比实验, 我们为相同的列创建B-Tree 索引


create index numbers_mod2_btree_idx on numbers using btree (mod2);

检查建立的索引

di+

public | numbers_mod2_btree_idx | index | whatcat | numbers | 214 MB |
public | numbers_mod2_gin_idx | index | whatcat | numbers | 10 MB |


在这里我们可以看到, GIN 索引相比于 B-Tree 索引有20倍小。
目录
相关文章
|
7月前
|
索引
索引
索引。
37 0
|
6天前
|
存储 算法 关系型数据库
索引总结(2)
索引总结(2)
|
7月前
|
存储 关系型数据库 MySQL
了解和认识索引
了解和认识索引 。
37 0
|
7月前
|
存储 SQL 关系型数据库
索引
索引(在MySQL中也叫做“键(key)”)是存储引擎用于快速找到记录的一种数据结构。 索引是快速搜索的关键。MySQL索引的建立对于MySQL的高效运行是很重要的。对于少量的数据,没有合适的索引影响不是很大,但是,当随着数据量的增加,性能会急剧下降。如果对多列进行索引(组合索引),列的顺序非常重要,MySQL仅能对索引最左边的前缀进行有效的查找。
20 0
|
7月前
|
关系型数据库 MySQL 索引
索引(2)
索引(2)。
15 0
|
7月前
|
关系型数据库 MySQL 数据库
了解和认识索引
了解和认识索引。
26 0
|
存储 缓存 自然语言处理
正排索引
介绍ElasticSearch相关正排索引
|
SQL 数据库 索引
为or、in平反——or、in到底能不能利用索引?
  先说一个笑话,作为开场白。俺也换换风格试一试,呵呵。   在以前,有三个书生赶考,在路上遇到了一个算命先生,于是就问算命先生:我们三个人赶考,结果如何呀?算命先生伸出来了一个手指头(食指)。
994 0
|
监控 关系型数据库 C#