PostgreSQL中的WAL是Write Ahead Logging的缩写,即预写日志,它是保证数据完整性的一种标准方法。简单来说就是在PostgreSQL数据库中要对数据文件进行修改时必须先写入WAL日志信息,即当WAL日志记录完成了持久化,刷新到永久储存之后才能更改数据文件。根据这个原则就不需要在每次提交事务的时候都刷新数据到磁盘。因为当数据库出现宕机发生数据丢失时,可以重新执行WAL日志来达到恢复数据库的目的。因此WAL日志也可以叫做redo重做日志,因为任何没有写到数据文件上的改动都可以根据日志记录进行重做。在默认的情况下,单个WAL预写日志文件的大小是16M,通过参数wal_segment_size决定。
postgres=# show wal_segment_size; wal_segment_size ------------------ 16MB (1 row) # 源码安装编译的时候可以通过指定下面的参数更改其大小: ./configure --with-wal-segsize=target_value
在默认情况下,WAL日志保存在pg_wal目录下,例如:
[postgres@mydb pg_wal]$ pwd /home/postgres/training/pgsql/data/pg_wal [postgres@mydb pg_wal]$ tree . ├── 000000010000000000000001 └── archive_status
WAL日志文件名称为16进制的24个字符组成,每8个字符一组,每组的意义如下:
00000001 00000000 00000001 时间线 逻辑ID 物理ID
当一个WAL预写日志文件写满时会自动切换到下一个WAL预写日志文件,而WAL切换的方式也可以是手动切换。例如,当执行pg_switch_wal()后WAL会切换到新的日志。下面展示了操作的过程:
-- 查看当前已有的WAL日志文件 postgres=# select * from pg_ls_waldir(); name | size | modification --------------------------+----------+------------------------ 000000010000000000000001 | 16777216 | 2025-07-20 22:04:53+08 (1 row) -- 进行WAL的手动切换 postgres=# select pg_switch_wal(); pg_switch_wal --------------- 0/15BADD0 (1 row) -- 再次查看当前已有的WAL日志文件 postgres=# select * from pg_ls_waldir(); name | size | modification --------------------------+----------+------------------------ 000000010000000000000001 | 16777216 | 2025-07-20 22:06:31+08 000000010000000000000002 | 16777216 | 2025-07-20 22:06:31+08 (2 rows)
通过查看pg_wal目录,此时将生成一个新的WAL日志文件:
[postgres@mydb pg_wal]$ tree . ├── 000000010000000000000001 ├── 000000010000000000000002 └── archive_status 1 directory, 2 files
PostgreSQL数据库使用WAL优势主要有以下两个方面:
- 首先,由于在数据库数据发生变更时会先将WAL日志缓冲区中的重做日志写入磁盘,因此即使在数据库发生宕机时,数据缓冲区中的数据还没有全部写入到永久存储中的情况下,也可以通过磁盘上的WAL日志信息来恢复数据库丢失的数据;
- 其次,在提交事务操作时仅仅是把WAL日志写入到磁盘上,并不会将数据刷新到磁盘。因此,从I/O次数来说,刷新WAL日志的次数要比刷新数据文件的次数少得多;从IO花销来说,WAL刷新是连续I/O,而数据刷新是随机I/O,因此,WAL刷新花销小得多。
WAL机制在保证事务持久性和数据完整性的同时,成功地提升了系统性能。下图说明了数据提交与WAL日志写入时的关系。
视频讲解如下:
在postgresql.conf文件中关于WAL的配置参数主要有以下几个:
wal_level = replica fsync = on max_wal_size = 1GB min_wal_size = 80MB # 其中: # wal_level参数的可选的值有以下三个,级别依次增高,记录的WAL信息也越多。 # (1)minimal:不能通过基础备份和WAL日志恢复数据库。 # (2)replica:该级别支持WAL归档和复制。 # (3)logical:在replica级别的基础上添加了支持逻辑解码所需的信息。 # # fsync:强制同步来实现数据安全保证。 # 当WAL日志文件的大小超过max_wal_size参数设置时,将发生WAL日志信息的覆盖, # 从而造成日志信息的丢失。因此为了保证数据的安全,建议在生产环境中开启WAL的归档模式。
由于WAL日志文件采用了二进制的形式存储日志信息,因此PostgreSQL提供了工具pg_waldump帮助获取WAL日志文件中记录的日志信息,例如:
[postgres@mydb pgsql]$ pwd /home/postgres/training/pgsql [postgres@mydb pgsql]$ bin/pg_waldump \ > data/pg_wal/000000010000000000000002 # 输出的信息如下: rmgr: Standby len (rec/tot): 50/ 50, tx: 0, lsn: 0/02000028, prev 0/015BADB8, desc: RUNNING_XACTS nextXid 485 latestCompletedXid 484 oldestRunningXid 485 rmgr: Standby len (rec/tot): 50/ 50, tx: 0, lsn: 0/02000060, prev 0/02000028, desc: RUNNING_XACTS nextXid 485 latestCompletedXid 484 oldestRunningXid 485 rmgr: XLOG len (rec/tot): 114/ 114, tx: 0, lsn: 0/02000098, prev 0/02000060, desc: CHECKPOINT_ONLINE redo 0/2000060; tli 1; prev tli 1; fpw true; xid 0:485; oid 13581; multi 1; offset 0; oldest xid 478 in DB 1; oldest multi 1 in DB 1; oldest/newest commit timestamp xid: 0/0; oldest running xid 485; online rmgr: Standby len (rec/tot): 50/ 50, tx: 0, lsn: 0/02000110, prev 0/02000098, desc: RUNNING_XACTS nextXid 485 latestCompletedXid 484 oldestRunningXid 485