PostgreSQL的逻辑存储结构主要是指数据库集群、数据库、表空间、段、区、块等;同时PostgreSQL的逻辑存储结构也包括数据库中的各种数据库对象,如:表、索引、视图等等。所有数据库对象都有各自的对象标识符oid(object identifiers),它是一个无符号的四字节整数,相关对象的oid都存放在相关的系统目录表中,比如数据库的oid和表的oid分别存放在pg_database,pg_class表中。下图展示了PostgreSQL数据库的逻辑存储结构。
下面重点讨论一下PostgreSQL的段、区和块。视频讲解如下:
- 段-Segment
一个段是分配给一个逻辑结构,如:一个表、一个索引或其他对象的一组区,它是数据库对象使用空间的集合。段可以有表段、索引段、回滚段、临时段和高速缓存段等,而最常用的段就是表段和索引段。
- 区-Extent
区是数据库存储空间分配的一个逻辑单位,它由连续数据块所组成。一个段是由一个或多个磁盘盘区组成。当一段中间所有空间已完全使用,PostgreSQL会自动为该段分配一个新的磁盘盘区范围。
- 块-Block(Page)
数据块是PostgreSQL 管理数据文件中存储空间的单位,为数据库使用的I/O的最小单位。数据库是最小的逻辑存储单位,其默认值8K。通过参数block_size可以查看当前数据库的数据块大小。
postgres=# show block_size; block_size ------------ 8192 (1 row)
在PostgreSQL中,数据的读写是以数据块为最小单位。在编译PostgreSQL时通过指定BLCKSZ参数大小将决定数据块的大小。每个表文件由都由BLCKSZ字节大小的数据块组成。在分析型数据库中,适当增加BLCKSZ大小可以小幅度提升数据库的性能。