详解PostgreSQL WAL日志工作原理与数据写入机制-开发者社区-阿里云

【赵渝强老师】PostgreSQL数据库的WAL日志与数据写入的过程

2025-08-12 1052

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： PostgreSQL中的WAL（预写日志）是保证数据完整性的关键技术。在数据修改前，系统会先将日志写入WAL，确保宕机时可通过日志恢复数据。它减少了磁盘I/O，提升了性能，并支持手动切换日志文件。WAL文件默认存储在pg_wal目录下，采用16进制命名规则。此外，PostgreSQL提供pg_waldump工具解析日志内容。

副本_副本_副本_副本_副本_副本_副本_副本_副本_副本_副本_副本_副本_Oracle-课程封面__2025-08-11+20_34_37.png

PostgreSQL中的WAL是Write Ahead Logging的缩写，即预写日志，它是保证数据完整性的一种标准方法。简单来说就是在PostgreSQL数据库中要对数据文件进行修改时必须先写入WAL日志信息，即当WAL日志记录完成了持久化，刷新到永久储存之后才能更改数据文件。根据这个原则就不需要在每次提交事务的时候都刷新数据到磁盘。因为当数据库出现宕机发生数据丢失时，可以重新执行WAL日志来达到恢复数据库的目的。因此WAL日志也可以叫做redo重做日志，因为任何没有写到数据文件上的改动都可以根据日志记录进行重做。在默认的情况下，单个WAL预写日志文件的大小是16M，通过参数wal_segment_size决定。

postgres=# show wal_segment_size;
 wal_segment_size 
------------------
 16MB
(1 row)

# 源码安装编译的时候可以通过指定下面的参数更改其大小：
./configure --with-wal-segsize=target_value

在默认情况下，WAL日志保存在pg_wal目录下，例如：

[postgres@mydb pg_wal]$ pwd
/home/postgres/training/pgsql/data/pg_wal
[postgres@mydb pg_wal]$ tree
.
├── 000000010000000000000001
└── archive_status

WAL日志文件名称为16进制的24个字符组成，每8个字符一组，每组的意义如下：

00000001  00000000  00000001
时间线    逻辑ID      物理ID

当一个WAL预写日志文件写满时会自动切换到下一个WAL预写日志文件，而WAL切换的方式也可以是手动切换。例如，当执行pg_switch_wal()后WAL会切换到新的日志。下面展示了操作的过程：

-- 查看当前已有的WAL日志文件
postgres=# select * from pg_ls_waldir();
           name           |   size   |      modification      
--------------------------+----------+------------------------
 000000010000000000000001 | 16777216 | 2025-07-20 22:04:53+08
(1 row)

-- 进行WAL的手动切换
postgres=# select pg_switch_wal();
 pg_switch_wal 
---------------
 0/15BADD0
(1 row)

-- 再次查看当前已有的WAL日志文件
postgres=# select * from pg_ls_waldir();
           name           |   size   |      modification      
--------------------------+----------+------------------------
 000000010000000000000001 | 16777216 | 2025-07-20 22:06:31+08
 000000010000000000000002 | 16777216 | 2025-07-20 22:06:31+08
(2 rows)

通过查看pg_wal目录，此时将生成一个新的WAL日志文件：

[postgres@mydb pg_wal]$ tree
.
├── 000000010000000000000001
├── 000000010000000000000002
└── archive_status
1 directory, 2 files

PostgreSQL数据库使用WAL优势主要有以下两个方面：

首先，由于在数据库数据发生变更时会先将WAL日志缓冲区中的重做日志写入磁盘，因此即使在数据库发生宕机时，数据缓冲区中的数据还没有全部写入到永久存储中的情况下，也可以通过磁盘上的WAL日志信息来恢复数据库丢失的数据；
其次，在提交事务操作时仅仅是把WAL日志写入到磁盘上，并不会将数据刷新到磁盘。因此，从I/O次数来说，刷新WAL日志的次数要比刷新数据文件的次数少得多；从IO花销来说，WAL刷新是连续I/O，而数据刷新是随机I/O，因此，WAL刷新花销小得多。

WAL机制在保证事务持久性和数据完整性的同时，成功地提升了系统性能。下图说明了数据提交与WAL日志写入时的关系。

视频讲解如下：

在postgresql.conf文件中关于WAL的配置参数主要有以下几个：

wal_level = replica
fsync = on
max_wal_size = 1GB
min_wal_size = 80MB

# 其中：
# wal_level参数的可选的值有以下三个，级别依次增高，记录的WAL信息也越多。
# （1）minimal：不能通过基础备份和WAL日志恢复数据库。
# （2）replica：该级别支持WAL归档和复制。
# （3）logical：在replica级别的基础上添加了支持逻辑解码所需的信息。
#
# fsync：强制同步来实现数据安全保证。

# 当WAL日志文件的大小超过max_wal_size参数设置时，将发生WAL日志信息的覆盖，
# 从而造成日志信息的丢失。因此为了保证数据的安全，建议在生产环境中开启WAL的归档模式。

由于WAL日志文件采用了二进制的形式存储日志信息，因此PostgreSQL提供了工具pg_waldump帮助获取WAL日志文件中记录的日志信息，例如：

[postgres@mydb pgsql]$ pwd
/home/postgres/training/pgsql
[postgres@mydb pgsql]$ bin/pg_waldump \
> data/pg_wal/000000010000000000000002

# 输出的信息如下：
rmgr: Standby     len (rec/tot):     50/    50, tx:          0, lsn: 0/02000028, prev 0/015BADB8, desc: RUNNING_XACTS nextXid 485 latestCompletedXid 484 oldestRunningXid 485
rmgr: Standby     len (rec/tot):     50/    50, tx:          0, lsn: 0/02000060, prev 0/02000028, desc: RUNNING_XACTS nextXid 485 latestCompletedXid 484 oldestRunningXid 485
rmgr: XLOG        len (rec/tot):    114/   114, tx:          0, lsn: 0/02000098, prev 0/02000060, desc: CHECKPOINT_ONLINE redo 0/2000060; tli 1; prev tli 1; fpw true; xid 0:485; oid 13581; multi 1; offset 0; oldest xid 478 in DB 1; oldest multi 1 in DB 1; oldest/newest commit timestamp xid: 0/0; oldest running xid 485; online
rmgr: Standby     len (rec/tot):     50/    50, tx:          0, lsn: 0/02000110, prev 0/02000098, desc: RUNNING_XACTS nextXid 485 latestCompletedXid 484 oldestRunningXid 485

【赵渝强老师】PostgreSQL数据库的WAL日志与数据写入的过程

热门文章

最新文章

相关课程

相关电子书

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

【赵渝强老师】PostgreSQL数据库的WAL日志与数据写入的过程

热门文章

最新文章

相关课程

相关电子书

推荐镜像