PG:checkpoint是什么

简介: PG:checkpoint是什么

PGcheckpoint是什么

CheckpointPG中的核心概念。然而会有用户对此比较陌生,不知道如何调优。本文解释checkpoint及如何调优,希望对数据库内核理解有所帮助。


PG如何写数据


详细讨论checkpoint前,理解PG是如何write数据的非常重要,看下面的图:

 

重要的假设是crash会发生在任何时间。为什么和这个相关?需要确认数据库永远不会被破坏。我们不能直接将数据写入数据文件。为甚?假设要将“1234”写入数据文件,如果在“12”后面崩溃,结果将是表中某个位置的一个元组被破坏,索引条目可能丢失等。我们必须不惜一切代价防止这种情况发生。

因此需要更加复杂的数据写入方法。PG首先将数据写入WALWAL就像一个包含二进制变化的顺序磁带。如果添加一行,WAL可能包含一条记录,用于记录数据文件哪些地方改动了,可能包含一组索引记录改动的指令、可能需要写入一个额外的页等,仅包含一系列变化。

数据一旦写入WALPG将会对共享缓存区中的数据页进行更改,注意数据文件中仍没有数据。现在有了WAL条目及共享缓冲区的脏页。如果一个读取请求来了,可从缓存中找到,而不用到磁盘上读取。

某个时刻,内存中的脏页会由后台写入进程写入磁盘。这里最重要的一点是,数据可能会被乱序写入,这个是没有问题的。如果用户想读取数据,PG先从共享缓冲区中获取。因此脏页的写入顺序与此无关。甚至可以晚一点写入,以增加一次sync的量。


删除WAL


WAL不能无限写入,需要回收空间。这就是CHECKPOINT需要干的活之一。

 

Checkpoint的目的就是确保脏页刷写到磁盘,然后该脏页对应的WAL及之前的WAL就可以删除回收了。PG的方法启动一个checkpoint进程,将bgwriter进程没有刷写的刷写到磁盘。但是这个过程并没有尽可能快的刷,我们需要使IO平稳,保证稳定的响应时间。

控制checkpoint平稳的参数为:


test=# SHOW
test=# SHOW checkpoint_completion_target;
checkpoint_completion_target
------------------------------
0.5
(1 row) 

到下个checkpoint开始前完成刷写一半。真实情况下对于大多数负载0.7-0.9就可以了,但可以随意设置。注意PG14中这个参数就会取消了,硬编码值为0.9。下一个问题是:什么时候进行checkpoint呢?参数为:

    test=# SHOW checkpoint_timeout;
    checkpoint_timeout
    --------------------
    5min
    (1 row)
    test=# SHOW max_wal_size;
    max_wal_size
    --------------
    1GB
    (1 row)

    如果系统的负载比较低,在一段时间后进行checkpoint。默认值是5分钟,但建议增加这个值以提高写入性能。注意,请随意修改这个值,仅会影响性能,不会以任何方式伤害数据库,除了性能没有数据会有风险。

    max_wal_size有点棘手,这个是个软限制,不是硬限制。因此WAL会超过这个值。这个值为了告诉PG可以堆积多少WAL,从而挑战checkpoint。现实中,提高这个值会消耗更多空间,但是会提高性能。

    为啥不将max_wal_size设置成无限大呢?首先很明显,这样就需要更多空间。另外,一旦数据库崩溃,PG就需要从上个checkpoint处开始回放,这样回放的时间就非常长了。如果检查点的距离增加,性能确实会提升,但是所做的和想要达到的效果有限,从某种意义上说,在这个问题上投入更多存储空间不会改变任何事情。

    后台写进程会将脏页刷写到磁盘,然而许多情况下,更多工作是由checkpoint进程本身完成,因此关注checkpoint比后台写进程有意义。


    min_wal_size:神秘参数


    min_wal_size max_wal_size有什么区别呢?如果PG空闲,会逐渐将WAL量减少到min_wal_size,这是个缓慢的过程,不是立即一蹴而就。假设本周内有高写负载,但是在周末会空闲。礼拜五下午,WAL量会很多,但是周末,会渐渐减少。当到周一后,WAL量又会增加。

    因此最后将min_wal_size的值设置的不要太小。

    原文

    https://www.cybertec-postgresql.com/en/postgresql-what-is-a-checkpoint/

    目录
    相关文章
    |
    2月前
    |
    SQL 关系型数据库 数据库连接
    `pg_dump` 和 `pg_restore`
    `pg_dump` 和 `pg_restore`
    24 4
    |
    10月前
    |
    Oracle 安全 关系型数据库
    如何在openGauss/PostgreSQL手动清理XLOG/WAL 文件?
    openGauss/PostgreSQL中的预写式日志WAL(Write Ahead Log),又名Xlog或redo log,相当于oracle的online redo log, 不同的是oracle online redo log是提前创建几组滚动使用,但在opengauss中只需要本配置参数控制WAL日志的周期,数据库会一直的创建并自动清理,但存在一些情况WAL日志未清理导致目录空间耗尽,或目录空间紧张时手动删除wal日志时,比如如何确认在非归档模式下哪些WAL日志文件可以安全删除?
    568 0
    |
    9月前
    |
    存储 关系型数据库
    PG检查点刷写脏页CheckPointGuts
    PG检查点刷写脏页CheckPointGuts
    80 0
    |
    9月前
    |
    缓存 关系型数据库
    PG的synchronous_commit
    PG的synchronous_commit
    107 0
    |
    关系型数据库 数据库 PostgreSQL
    PG 数据文件
    每个索引和表都是一个单独的文件,page页/段,默认1G,大于1G的page会被分割
    257 0
    |
    关系型数据库 数据库
    PG 控制文件
    数据库启动时会读取控制文件,识别上次关机前的状态信息(元数据信息)
    151 0
    |
    SQL 安全 关系型数据库
    pg_dump
    备份PostgreSQL数据库的工具,它甚至可以在数据库正在并发使用时进行完整一致的备份,而不会阻塞其它用户对数据库的访问。该工具生成的转储格式可以分为两种,脚本和归档文件。
    160 0
    |
    SQL 弹性计算 关系型数据库
    为什么pg_basebackup或pg_start_backup好像hang住确没有开始拷贝文件 - checkpoint 的几种调度(checkpoint_completion_target)
    标签 PostgreSQL , checkpoint , 调度 , lazy , immediate , pg_start_backup , pg_basebackup 背景 PostgreSQL支持在线全量备份与增量归档备份。在线全量备份实际上就是拷贝文件,增量备份则分为两种,一种是基于BLOCK lsn变化的BLOCK即增量备份,另一种是基于WAL的持续归档文件备份。 全量备份通常
    1527 0
    |
    监控 关系型数据库 数据库
    pg_resetxlog清理的pg_xlog下的WAL日志
    PostgreSQL的pg_xlog下有大量日志,空间不足,如何删除? Darren1:postgres:/usr/local/pgsql/data/pg_xlog:>ls 000000010000000000000008.
    1317 0