PgSQL · 源码分析 · PG中的无锁算法和原子操作应用一则

本文涉及的产品
云数据库 RDS SQL Server,基础系列 2核4GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云原生数据库 PolarDB 分布式版,标准版 2核8GB
简介: 原子操作概述近年来随着服务器上CPU核数的不断增加,无锁算法(Lock Free)越来越广泛的被应用于高并发的系统中。PostgreSQL 做为世界上最高级开源数据库也在9.5时引入了无锁算法。本文先介绍了无锁算法和原子操作在PostgreSQL中的具体实现, 再通过一个Patch来看一下在PostgreSQL中是如何利用它来解决实际的高并发问题的。无锁算法是利用CPU的原子操作实现的数

原子操作概述

近年来随着服务器上CPU核数的不断增加,无锁算法(Lock Free)越来越广泛的被应用于高并发的系统中。PostgreSQL 做为世界上最高级开源数据库也在9.5时引入了无锁算法。本文先介绍了无锁算法和原子操作在PostgreSQL中的具体实现, 再通过一个Patch来看一下在PostgreSQL中是如何利用它来解决实际的高并发问题的。

无锁算法是利用CPU的原子操作实现的数据结构和算法来解决原来只能用锁才能解决的并发控制问题。 众所周知,在一个并发系统中特别是高并发的场景下,锁的使用会影响系统性能。 这里的CPU的原子操作是不可中断的一个或者一系列操作, 也就是不会被线程调度机制打断的操作, 运行期间不会有任何的上下文切换。

常用的原子操作包括:

  • CAS,Compare & Set,或是 Compare & Swap: 看某内存位置的值是不是等于一个值oldval, 如果是就写入新值newval,返回一个bool值标识是否做了更新
  • Fetch-and-add: 把某个内存位置加上一个值
  • Test-and-set: 写值到某个内存位置并传回其旧值

本文并不打算对这些原子操作概念和原理本身进行展开讨论,有兴趣的读者可以参考Wikipedia或其它的网上文章。

PostgreSQL中原子操作的实现

由于PostgreSQL是一个跨平台的开源软件,支持十几种CPU架构和众多的操作系统, 而原子操作又与CPU架构和编译器紧密相关,所以原子操作在PostgreSQL中的实现稍显复杂。

在PostgreSQL中原子操作的实现涉及到的文件包括(由于PostgreSQL的头文件都位于源码的include目录里, 所以本文后面的说明头文件路径时都是只引用到include子目录这一层):

  • include/port/atomics.h
  • include/port/atomics目录里的所有头文件
  • 源文件 src/backend/port/atomics.c

原子操作的所有对外部模块可用符号都声明在头文件port/atomics.h中, 而其他文件都可看作是原子操作模块的内部实现文件不允许外部模块直接引用。 也就是说,如果要在PostgreSQL代码中使用原子操作只需包含port/atomics.h即可。 而port/atomics.h也是原子操作模块的最主要的源文件,所有其他的源文件都是通过该文件组织起来的。 下面从port/atomics.h源文件开始分析。

port/atomics.h 整个文件分成4个部分。
第1部分和第2部分分别用来包含具体CPU架构相关的头文件和各种编译器相关的头文件。 这些头文件都在port/atomics目录下。第1部分所包含的头文件里一般都是用汇编语言实现的CPU相关的内存屏障1和原子操作的实现函数, 目前只在X86架构下用GCC编译的情况下实现了汇编版本原子操作,而其他的CPU架构则采用第2部分里的编译器实现的通用版本, 一般的编译器如GCC2都内置了原子操作的支持。之所以X86版本提供了基于汇编的实现主要是为了更好的性能和支持更老版本的GCC。 第2部分的最后还包含了port/atomics/fallback.h头文件,该文件声明了PostgreSQL自己使用自旋锁或操作系统的信号量模拟实现的原子操作的版本, 具体实现位于src/backend/port/atomics.c中,这在第1部分和第2部分都没有找到实现的情况下会使用该版本,注意使用该版本性能会比较差。

通常支持一个新的平台只需要在port/atomics.h的第1部分或第2部分中实现如下函数即可:

  • pg_compiler_barrier()
  • pg_write_barrier()
  • pg_read_barrier()
  • pg_atomic_compare_exchange_u32()
  • pg_atomic_fetch_add_u32()
  • pg_atomic_test_set_flag()
  • pg_atomic_init_flag()
  • pg_atomic_clear_flag()

前三个函数是实现内存屏障(Memory Barrier)的,剩下的是基本的原子操作函数, port/atomics.h的第3部分包含了头文件port/atomics/generic.h, 它利用这几个基本的原子操作实现更多的原子操作函数。

port/atomics.h第4部分是定义本模块所有的导出函数,通常都是定义一个简单的inline函数去调用该函数的具体实现(实现函数名一般为xxx_impl)。 下面是第4部分具体定义的原子操作函数:

  • 内存屏障相关函数,包括 compiler barrier 和 read/write barrier
  • 语义上的布尔值(PG代码里叫flag,具体实现上可能映射到一个字节,或一个整数)的原子操作,包括:
    • pg_atomic_init_flag,初始化一个flag
    • pg_atomic_test_set_flag, Test-And-Set,这也是flag的唯一支持的原子 操作函数
    • pg_atomic_unlocked_test_flag,检查flag是否没有被设置
    • pg_atomic_clear_flag,清除已设置的flag
  • 32位无符号整数的原子操作,包括:
    • pg_atomic_init_u32, pg_atomic_read_u32, pg_atomic_write_u32,初始化、读、写操作
    • pg_atomic_exchange_u32,给原子变量赋值并返回原值
    • pg_atomic_compare_exchange_u32, 32位无符号整数的CAS操作,比较原子变量和另一个变量的值, 如果相等就赋一个新值到原子变量里,返回一个布尔值标识是否进行了赋值操作
    • pg_atomic_fetch_add_u32, pg_atomic_fetch_sub_u32, pg_atomic_fetch_and_u32, pg_atomic_fetch_or_u32 对某个原子变量进行加、减、与、或操作,并返回变量改变之前的值
    • pg_atomic_add_fetch_u32, pg_atomic_sub_fetch_u32 对某个原子变量进行加、减操作,并返回变量改变之后的值
  • 64位无符号整数的原子操作,与32位的实现的操作函数相似,只是实现的是64位版本,这里需要注意的是, 64位版本并不保证所有平台的都支持,目前在PostgreSQL的源代码中还没有被使用。

在port/atomics.h的文件开头的注释里,代码的作者也提到了:除非必要否则尽量不要使用原子操作, 可以使用更上层的数据结构或算法如LWLock,SpinLock或者普通锁,因为使用原子操作需要更多的技巧, 写出完全正确的代码是比较难的。

目前在PostgreSQL的代码中有3个地方使用了原子操作来提高并发性能,分别是事务提交时的并发处理, LWLock的实现和Buffer的管理,下一节我们将对其中的一个进行分析,其他对原子操作的使用将会在后续的文章中进行分析。

使用原子操作减少事务提交时锁的争用

在PostgreSQL中每个Session的执行时的一些关键的状态信息都保存在PGPROC这个结构当中, 如当前所执行事务的事务ID(xid),PostgreSQL维护了一个PGPROC的数组叫ProcArray, 由一个叫ProcArrayLock的锁保护着。ProcArray在PostgreSQL当中属于核心数据结构, 在事务的开启和结束,在执行任何查询时获取事务快照(Snapshot)3做可见性判断时都会获取ProcArrayLock锁去访问ProcArray。 现在在高并发的情况下ProcArrayLock锁争用已经非常严重了,在PostgreSQL 9.6时提交了一个Patch使用原子操作来减少对该锁的争用。

当一个写事务提交时,进程要修改自己的PGPROC结构来标识自己已经结束了,其中的一个主要动作是重置自己事务ID(xid), 为了简化我们后面就管这个过程叫重置xid,这时需要以排它的方式获取ProcArrayLock锁,以防拿事务Snapshot的进程看到不一致的结果。 当有很多事务提交时,每一个要提交的进程依次唤醒、拿锁、放锁,导致该锁的过度争用。为了提高效率这个Patch只让一个进程获取ProcArrayLock锁, 由该进程为所有同时提交的其他进程(Patch里叫一个ProcArray组)集中批量修改。

下面来详细分析一下该Patch的代码。Patch修改了PGPROC结构和PGPROC数组头结构PROC_HDR,在PGPROC中加入了3个成员变量:

/* Support for group XID clearing. */
/* 如果是一个ProcArray组的成员为true */
bool            procArrayGroupMember;
/* 指向下一个ProcArray组的成员 */
pg_atomic_uint32 procArrayGroupNext;

/*
 * 这是在调用重置xid的函数所需要传递的参数
 */
TransactionId procArrayGroupMemberXid;

在PROC_HDR中加入一个成员变量:

 /* ProcArray组的第一个成员 */
pg_atomic_uint32 procArrayGroupFirst;

首先在事务提交时尝试去获取ProcArrayLock,如果获取到了就直接调用重置xid函数, 否则调用一个新加的函数ProcArrayGroupClearXid通过使用原子操作进行批量重置xid。

整个Patch主要逻辑都在ProcArrayGroupClearXid函数中,该函数首先将自己加到ProcArray组的头部:

while (true)
{
	nextidx = pg_atomic_read_u32(&procglobal->procArrayGroupFirst);
	pg_atomic_write_u32(&proc->procArrayGroupNext, nextidx);

	if (pg_atomic_compare_exchange_u32(&procglobal->procArrayGroupFirst,
									   &nextidx,
									   (uint32) proc->pgprocno))
		break;
}

这段代码通过对位于PROC_HDR结构中的ProcArray组头部进行CAS原子操作,不断的尝试将自己加入到ProcArray组中, 这里是通过存储其pgprocno(相当于PGPROC数组下标),形成一个用pgprocno串起来的链表。 注意在以上3条语句之间随时有可能由其他进程插进来把它们自己加到ProcArray组中导致CAS操作失败, 失败之后程序会进行下一次循环直到成功。 执行完这段代码变量nexidx存储的是原ProcArray组的头部, 代码通过比较nextidx来判断是否是ProcArray组的第一个成员即Leader,Leader的nextidx应该是初值INVALID_PGPROCNO, 由Leader负责整个组的重置xid工作,非Leader成员只需等待Leader完成工作后通知自己即可。

ProcArray组的Leader先获取PROCArray锁,然后从组头部拿到第一个元素,并把组头置成初值INVALID_PGPROCNO, 这时其他进程可以开始一个新的ProcArray组:

while (true)
{
        nextidx = pg_atomic_read_u32(&procglobal->procArrayGroupFirst);
        if (pg_atomic_compare_exchange_u32(&procglobal->procArrayGroupFirst,
                                           &nextidx,
                                           INVALID_PGPROCNO))
        break;
}

注意在执行这段代码过程中,还会不断有新到组成员加进来,所以使用了while循环。

这个函数的最后就比较简单了,ProcArray组的Leader循环组列表对每个成员调用重置xid函数, 最后在释放了ProcArrayLock锁之后通知每个组成员继续执行。

通过对以上Patch代码的分析我们可以看到PG巧妙的利用了原子操作有效的减少了在高并发的条件下在事务提交时对ProcArrayLock锁的争用。 但随着硬件服务器上CPU核数的不断增加,并发的不断加大,ProcArrayLock锁的争用仍然是一个需要不断优化的热点, 其中一个最有希望的解决方案是使用CSN(commit sequence number)替代原来的事务快照(Snapshot)机制来做可见性判断, 这在PostgreSQL社区里已经有了Patch,我们将在后续文章进行分析。


1 内存屏障是一个和原子操作相关的概念,限于篇幅本文没有介绍, 有兴趣的读者可参考PostgreSQL源代码目录下的src/backend/storage/lmgr/README.barrier,或其他网上资料
2 参见 GCC 6.2.0 原子操作内置函数

3 在获取事务快照(Snapshot)时需要以共享方式获取ProcArrayLock锁, 并且循环整个ProcArray数组来拿到当前所有执行事务的列表,持锁时间会更长,而且获取事务快照是一个更频繁的操作, 根据事务隔离级别的不同,执行每个事务可能要进行多次获取事务快照操作

相关实践学习
使用PolarDB和ECS搭建门户网站
本场景主要介绍基于PolarDB和ECS实现搭建门户网站。
阿里云数据库产品家族及特性
阿里云智能数据库产品团队一直致力于不断健全产品体系,提升产品性能,打磨产品功能,从而帮助客户实现更加极致的弹性能力、具备更强的扩展能力、并利用云设施进一步降低企业成本。以云原生+分布式为核心技术抓手,打造以自研的在线事务型(OLTP)数据库Polar DB和在线分析型(OLAP)数据库Analytic DB为代表的新一代企业级云原生数据库产品体系, 结合NoSQL数据库、数据库生态工具、云原生智能化数据库管控平台,为阿里巴巴经济体以及各个行业的企业客户和开发者提供从公共云到混合云再到私有云的完整解决方案,提供基于云基础设施进行数据从处理、到存储、再到计算与分析的一体化解决方案。本节课带你了解阿里云数据库产品家族及特性。
目录
相关文章
|
2月前
|
存储 算法 Java
解析HashSet的工作原理,揭示Set如何利用哈希算法和equals()方法确保元素唯一性,并通过示例代码展示了其“无重复”特性的具体应用
在Java中,Set接口以其独特的“无重复”特性脱颖而出。本文通过解析HashSet的工作原理,揭示Set如何利用哈希算法和equals()方法确保元素唯一性,并通过示例代码展示了其“无重复”特性的具体应用。
45 3
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习中的优化算法及其应用
【10月更文挑战第8天】 本文将探讨深度学习中常用的优化算法,包括梯度下降法、Adam和RMSProp等,介绍这些算法的基本原理与应用场景。通过实例分析,帮助读者更好地理解和应用这些优化算法,提高深度学习模型的训练效率与性能。
150 63
|
21天前
|
机器学习/深度学习 JSON 算法
二叉树遍历算法的应用场景有哪些?
【10月更文挑战第29天】二叉树遍历算法作为一种基础而重要的算法,在许多领域都有着不可或缺的应用,它为解决各种复杂的问题提供了有效的手段和思路。随着计算机科学的不断发展,二叉树遍历算法也在不断地被优化和扩展,以适应新的应用场景和需求。
24 0
|
2月前
|
存储 算法 搜索推荐
这些算法在实际应用中有哪些具体案例呢
【10月更文挑战第19天】这些算法在实际应用中有哪些具体案例呢
38 1
|
2月前
|
机器学习/深度学习 人工智能 算法
[大语言模型-算法优化] 微调技术-LoRA算法原理及优化应用详解
[大语言模型-算法优化] 微调技术-LoRA算法原理及优化应用详解
81 0
[大语言模型-算法优化] 微调技术-LoRA算法原理及优化应用详解
|
2月前
|
算法 安全 物联网
如何应用SM2算法进行身份认证
【10月更文挑战第5天】如何应用SM2算法进行身份认证
74 1
|
2月前
|
存储 算法 安全
SM2算法的应用场景有哪些?
【10月更文挑战第5天】SM2算法的应用场景有哪些?
100 1
|
2月前
|
存储 算法 安全
Python 加密算法详解与应用
Python 加密算法详解与应用
36 1
|
2月前
|
机器学习/深度学习 算法
深度学习中的优化算法及其应用
本文探讨了深度学习中常用的优化算法,包括梯度下降、随机梯度下降、动量方法和Adam方法。通过对比这些算法的优缺点及适用场景,帮助读者更好地理解和应用这些优化方法。
32 2
|
2月前
|
监控 算法 数据挖掘
HyperLogLog算法有哪些应用场景呢
【10月更文挑战第19天】HyperLogLog算法有哪些应用场景呢
17 0
下一篇
无影云桌面