Linux内核RCU(Read Copy Update)锁简析

简介:

在很早以前,大概是2009年的时候,写过一篇关于Linux RCU锁的文章《RCU锁在linux内核的演变》, 现在我承认,那个时候我虽然懂了RCU锁,但是我没有能力用一种非常简单的描述把Linux的实现给展示出来,有道是你能给别人用你自己的方式非常简洁地 描述清楚,你才是真正的精通它,否则,无异于背诵。换个说法,如果你在被面试,在短时间内靠嘴说给面试官,且他还要能听明白,就说明自己真的懂了,这种时 候,是不会给你机会分析源代码的,也不可能让你背诵源代码。
       时隔五年多,近期又碰到了这个话题,我不能自诩自己对RCU锁是多么精通,但是起码,和2009年相比,我确实有所进步,因此在这个台风肆虐的次日,我尝试着用我自己的方式描述一下Linux对RCU锁的一种实现方式,作为《RCU锁在linux内核的演变》这篇文章的补充。本文不配图,没代码,只是文字。
声明:如果你还不知道RCU锁是什么,请自行baidu,本文不再赘述概念,但是这也就等于说,如果我自己有一天忘记了RCU,我也不能指望从本文中得到任何帮助,我总是这样,不是吗?能力在忘不在记,得其义而忘其形。

RCU要素

RCU锁的要素包括

读标志

如果一个Reader企图占据一把RCU锁,它是不需要付出任何代价的,只需要设置一个标志,让外界知道有Reader在占据这把RCU锁,多个Reader可以共同持有一把RCU锁。

写时拷贝

如果有一个Write企图更新RCU锁所保护的数据,那么它会首先查看该RCU锁的读标志,如果有该标志,说明有最少一个Reader持有了该RCU锁,它需要对原始数据make a copy,写这个副本并将更新过的副本保存在某处,等待时机用该副本更新原始数据。

更新时机

这 个时机就是用副本更新原始数据的时间点,这个时间点如何确定是RCU锁实现的算法核心,它直接可以确定所有的数据结构。确切来讲,Writer必须 waitting for all readers leaving,方可Update原始数据,问题是,它是怎么知道所有的Reader都离开了呢?

Linux内核对RCU锁的几种实现

1.原始实现-利用抢占禁止

Linux 内核于2.6内核引入了RCU锁的概念,在第一个版本中,它利用了抢占禁止的方式来标志有Reader持有RCU锁,这意味着期间不能发生task切换 (指的是task_struct所代表的sched entity切换)。那么所有Reader均已经释放RCU锁的标志就是,task切换了,因此很简单,用副本Update原始数据的时机就是task切 换时。
       所有的Write会将自己写的副本挂在一个list上,在task切换的时候会touch这个list,如果该list非空,则遍历每一个元素,Update原始数据。

评价[该部分与实现无关,纯形而上的,可以忽略]      

这就是第一版的原始实现,它是否合理姑且不论,确实,它可以工作。但是:
a.它这种实现是否会影响调度子系统的时延
b.由于禁用抢占,抢占粒度变粗,对交互性是否会有影响
c.对CPU间的task负载均衡的影响呢
我 们发现,由于RCU的这个实现不是靠自身机制实现的,它不可避免地会影响到系统的核心机制,比如调度,负载均衡等,这意味着它不能长久,也无法经历复杂的 演变,因为随着它在这条路上的逐步演进,对系统核心机制的影响将越来越大,故而,它必须从系统层面剥离出来。确实,它也是这么做的,这就是第二代RCU实 现-可抢占RCU锁。

2.新实现-利用阶段计数器

需要一种更加有效的方式来标志Reader已经持有锁-第一要素读标志,并且这个标志要尽可能精确,且不能使用系统核心的机制,要做成完全封闭的闭环,不依靠外部当然也就不会影响外部。
       纯天然的想法就是使用计数器,每一把RCU持有一个Reader计数器,一旦有Reader前来持锁,只需要一个原子操作,将该计数器加1即 可,Writer写数据时,发现计数器不是0就意味着需要make a copy了-第二要素写时拷贝(COW-Copy On Write)。现在的问题是第三要素,Writer怎么知道所有的Reade都已经将锁释放了呢??
       纯天然的想法就是在某个Reader释放锁的时候,计数器减1,当计数器重新变为0的时候,这就是副本更新原始数据的时机。确实是这样,但是按照持锁和解 锁的分布看,它们应该是均等的,这意味着计数器的值会在一个期望值上下波动,变成0的希望及其渺茫,因此需要引入另一个参量,即阶段。
       将唯一的那个RCU计数器分裂为两个计数器:old readers和new readers。
       太初,任选某一个时刻,将RCU锁当前的计数器(称为原始计数器)值复制一份存入old readers,计数器清0,原始计数器改称为new readers。复制结束的当下,new readers计数器为0,old readers计数器为现阶段持有锁的reader的数量。并且持锁者task(即task_struct)与RCU锁之间保持关联(难道不是一个 task_struct字段可以搞定的吗?),task永远知道自己是new reader还是old reader。
       此时,就可以明确定义lock和unlock的行为了:
lock--设置自己的task为new reader,将RCU的new reader计数器加1。
unlock--获取自己的task是new reader还是old reader,将自己所在的reader计数器减1。
此时很明确的事实是,old reader计数器总是会递减而不会递增,而new reader不但会递增也会递减,这样,选择Update的时机也很明确了,那就是,old reader计数器变为0,这个时刻,就该将所有的副本覆盖原始数据了。
       现在总结所有的三个要素:

读标志

为该RCU锁的new reader计数器加1

写时拷贝

如果该RCU锁的old reader计数器不为0,则执行写时复制。

更新时机

每次unlock操作,都会将本task的reader计数器(或者是new reader,或者是old reader)减1,一旦该RCU锁的old reader计数器变成0,则执行所有的Update操作。

评价[该部分与实现无关,纯形而上的,可以忽略]

持有RCU锁的reader,可以睡眠,可以被抢占,可以调度到别的CPU上,完全是封闭的,和系统其它的机制无关。然而,我一直在思考一个更好的实现,只因疯子不给力!!

3.RCU Tree实现(实在是没有2好)

今天实在没有时间了,要出去。后续补充。




 本文转自 dog250 51CTO博客,原文链接:http://blog.51cto.com/dog250/1673351
相关文章
|
19天前
|
算法 Linux
深入探索Linux内核的内存管理机制
本文旨在为读者提供对Linux操作系统内核中内存管理机制的深入理解。通过探讨Linux内核如何高效地分配、回收和优化内存资源,我们揭示了这一复杂系统背后的原理及其对系统性能的影响。不同于常规的摘要,本文将直接进入主题,不包含背景信息或研究目的等标准部分,而是专注于技术细节和实际操作。
|
19天前
|
存储 缓存 网络协议
Linux操作系统的内核优化与性能调优####
本文深入探讨了Linux操作系统内核的优化策略与性能调优方法,旨在为系统管理员和高级用户提供一套实用的指南。通过分析内核参数调整、文件系统选择、内存管理及网络配置等关键方面,本文揭示了如何有效提升Linux系统的稳定性和运行效率。不同于常规摘要仅概述内容的做法,本摘要直接指出文章的核心价值——提供具体可行的优化措施,助力读者实现系统性能的飞跃。 ####
|
20天前
|
监控 算法 Linux
Linux内核锁机制深度剖析与实践优化####
本文作为一篇技术性文章,深入探讨了Linux操作系统内核中锁机制的工作原理、类型及其在并发控制中的应用,旨在为开发者提供关于如何有效利用这些工具来提升系统性能和稳定性的见解。不同于常规摘要的概述性质,本文将直接通过具体案例分析,展示在不同场景下选择合适的锁策略对于解决竞争条件、死锁问题的重要性,以及如何根据实际需求调整锁的粒度以达到最佳效果,为读者呈现一份实用性强的实践指南。 ####
|
20天前
|
缓存 监控 网络协议
Linux操作系统的内核优化与实践####
本文旨在探讨Linux操作系统内核的优化策略与实际应用案例,深入分析内核参数调优、编译选项配置及实时性能监控的方法。通过具体实例讲解如何根据不同应用场景调整内核设置,以提升系统性能和稳定性,为系统管理员和技术爱好者提供实用的优化指南。 ####
|
22天前
|
负载均衡 算法 Linux
深入探索Linux内核调度机制:公平与效率的平衡####
本文旨在剖析Linux操作系统内核中的进程调度机制,特别是其如何通过CFS(完全公平调度器)算法实现多任务环境下资源分配的公平性与系统响应速度之间的微妙平衡。不同于传统摘要的概览性质,本文摘要将直接聚焦于CFS的核心原理、设计目标及面临的挑战,为读者揭开Linux高效调度的秘密。 ####
33 3
|
24天前
|
消息中间件 安全 Linux
深入探索Linux操作系统的内核机制
本文旨在为读者提供一个关于Linux操作系统内核机制的全面解析。通过探讨Linux内核的设计哲学、核心组件、以及其如何高效地管理硬件资源和系统操作,本文揭示了Linux之所以成为众多开发者和组织首选操作系统的原因。不同于常规摘要,此处我们不涉及具体代码或技术细节,而是从宏观的角度审视Linux内核的架构和功能,为对Linux感兴趣的读者提供一个高层次的理解框架。
|
Linux 网络安全 数据安全/隐私保护
linux之间copy传输文件方法
不同的Linux之间copy文件通常有4种方法 1.ftp 2.samba服务 3.sftp 4.scp 前三种方法都比较繁琐,最简单的方法就是scp 命令scp 介绍 scp 本地用户名@IP地址:文件名1 远程用户名@IP地址:文件名2   [本地用户名@IP地址:] 可以不输入,可能需要输入远程用户名所对应的密码.   可能有用的几个参数:   -v 和大多数li
2437 0
|
1月前
|
Linux 网络安全 数据安全/隐私保护
Linux 超级强大的十六进制 dump 工具:XXD 命令,我教你应该如何使用!
在 Linux 系统中,xxd 命令是一个强大的十六进制 dump 工具,可以将文件或数据以十六进制和 ASCII 字符形式显示,帮助用户深入了解和分析数据。本文详细介绍了 xxd 命令的基本用法、高级功能及实际应用案例,包括查看文件内容、指定输出格式、写入文件、数据比较、数据提取、数据转换和数据加密解密等。通过掌握这些技巧,用户可以更高效地处理各种数据问题。
106 8
|
1月前
|
监控 Linux
如何检查 Linux 内存使用量是否耗尽?这 5 个命令堪称绝了!
本文介绍了在Linux系统中检查内存使用情况的5个常用命令:`free`、`top`、`vmstat`、`pidstat` 和 `/proc/meminfo` 文件,帮助用户准确监控内存状态,确保系统稳定运行。
338 6
|
1月前
|
Linux
在 Linux 系统中,“cd”命令用于切换当前工作目录
在 Linux 系统中,“cd”命令用于切换当前工作目录。本文详细介绍了“cd”命令的基本用法和常见技巧,包括使用“.”、“..”、“~”、绝对路径和相对路径,以及快速切换到上一次工作目录等。此外,还探讨了高级技巧,如使用通配符、结合其他命令、在脚本中使用,以及实际应用案例,帮助读者提高工作效率。
84 3