Linux内核29-原子操作

简介: Linux内核29-原子操作

1 引言


汇编指令读写内存变量的过程我们称为read-modify-write,简称为RMW操作。也就是说,它们读写一个内存区域两次,第一次读取旧值,第二次写入新值。

假设有两个不同的内核控制路径运行在两个CPU上,同时尝试RMW操作相同的内存区域且执行的是非原子操作。起初,两个CPU尝试读取相同位置,但是内存仲裁器(促使串行访问RAM的电路)确定一个可以访问,让另一个等待。但是,当第一个读操作完成,延时的CPU也会读取相同的旧值。但是等到两个CPU都往这个内存区域写入新值的时候,还是由内存仲裁器决定谁先访问,然后写操作都会成功。但是,最终的结果却是最后写入的值,先写入的值会被覆盖掉。

防止RMW操作造成的竞态条件最简单的方式就是保证这样的指令操作是原子的,也就是这个指令的执行过程不能被打断。这就是原子操作的由来。


2 X86体系架构


2.1 X86原子指令

让我们看一下X86的汇编指令有哪些是原子的:

  • 进行零或一对齐内存访问的汇编指令是原子的。
  • RMW操作汇编指令(比如incdec),如果在read之后,write之前内存总线没有被其它CPU抢占,那么这些指令就是原子的。
  • 所以,基于上一点,RMW操作汇编指令前缀lock(0xf0)就称为原子操作指令。当控制单元检测到这个前缀,它会锁住内存总线,直到指令完成。
  • 带有前缀rep(0xf2、0xf3,强迫控制单元重复指令多次)的汇编指令就不是原子的。

通过上面的描述可知,X86体系架构本身有一些指令就是原子指令。对于RMW操作指令(比如incdec),本身不是原子指令,但是可以通过在指令前面,使用前缀lock指令锁住内存总线,阻止在写内存时,其它CPU抢占,从而实现原子操作。


2.2 ARM原子指令


但是,ARM体系架构中不存在lock指令,所以它在原子指令的实现上是不一样的。ARMv6之前的版本,因为不支持多核,所以只要关闭中断即可;而ARMv6及以后的版本,支持多核系统,只关闭中断是不可以实现原子指令的。于是,该版本引入了新的独占指令ldrexstrex,通过这两个指令实现原子操作。比如,下面以原子加法为例,代码如下:

static inline void atomic_add(int i, atomic_t *v)
{
    unsigned long tmp;
    int result;
    __asm__ __volatile__("@ atomic_add\n"
    "1: ldrex %0, [%3]\n"       // ---------- (0)
    " add %0, %0, %4\n"         // ---------- (1)
    " strex %1, %0, [%3]\n"     // ---------- (2)
    " teq %1, #0\n"             // ---------- (3)
    " bne 1b"                   // ---------- (4)
    : "=&r" (result), "=&r" (tmp), "+Qo" (v->counter)
    : "r" (&v->counter), "Ir" (i)
    : "cc");
}

代码解析:

  • (0)从v->counter地址处取出其值,将其存入result;
  • (1)计算result=result+i;
  • (2)将result的结果存入v->counter地址处,这一步操作是否成功的结果写入到tmp临时变量中;
  • (3)判断tmp是否等于0;
  • (4)第(3)结果如果等于0,则成功;如果不等于0,则跳转到标签1处继续执行,直到成功。

所以说,X86这种锁内存总线的方式简单好用,但是毕竟牺牲了性能;而ARM这种独占指令则更为高效,只不过实现上更为复杂一点。


3 Linux原子操作


但是,我们在编写完C代码后,编译器不能保证给你使用原子指令进行替代。因此,Linux内核提供了atomic_t类型变量并提供了相关的操作函数和宏(如表5-4所示)。

表5-4 Linux中的原子操作

函数 描述
atomic_read(v) 返回*v
atomic_set(v,i) *v=i
atomic_add(i,v) *v+i
atomic_sub(i,v) *v-i
atomic_sub_and_test(i, v) 如果*v-i = 0
返回1;否则0
atomic_inc(v) *v+1
atomic_dec(v) *v-1
atomic_dec_and_test(v) 如果*v-1 = 0
返回1;否则0
atomic_inc_and_test(v) 如果*v+1 = 0
返回1;否则0
atomic_add_negative(i, v) 如果*v+i < 0
返回1;否则0
atomic_inc_return(v) 返回*v-1
atomic_dec_return(v) 返回*v+i
atomic_add_return(i, v) 返回*v-i


相关文章
|
16天前
|
算法 Linux
深入探索Linux内核的内存管理机制
本文旨在为读者提供对Linux操作系统内核中内存管理机制的深入理解。通过探讨Linux内核如何高效地分配、回收和优化内存资源,我们揭示了这一复杂系统背后的原理及其对系统性能的影响。不同于常规的摘要,本文将直接进入主题,不包含背景信息或研究目的等标准部分,而是专注于技术细节和实际操作。
|
16天前
|
存储 缓存 网络协议
Linux操作系统的内核优化与性能调优####
本文深入探讨了Linux操作系统内核的优化策略与性能调优方法,旨在为系统管理员和高级用户提供一套实用的指南。通过分析内核参数调整、文件系统选择、内存管理及网络配置等关键方面,本文揭示了如何有效提升Linux系统的稳定性和运行效率。不同于常规摘要仅概述内容的做法,本摘要直接指出文章的核心价值——提供具体可行的优化措施,助力读者实现系统性能的飞跃。 ####
|
17天前
|
监控 算法 Linux
Linux内核锁机制深度剖析与实践优化####
本文作为一篇技术性文章,深入探讨了Linux操作系统内核中锁机制的工作原理、类型及其在并发控制中的应用,旨在为开发者提供关于如何有效利用这些工具来提升系统性能和稳定性的见解。不同于常规摘要的概述性质,本文将直接通过具体案例分析,展示在不同场景下选择合适的锁策略对于解决竞争条件、死锁问题的重要性,以及如何根据实际需求调整锁的粒度以达到最佳效果,为读者呈现一份实用性强的实践指南。 ####
|
17天前
|
缓存 监控 网络协议
Linux操作系统的内核优化与实践####
本文旨在探讨Linux操作系统内核的优化策略与实际应用案例,深入分析内核参数调优、编译选项配置及实时性能监控的方法。通过具体实例讲解如何根据不同应用场景调整内核设置,以提升系统性能和稳定性,为系统管理员和技术爱好者提供实用的优化指南。 ####
|
19天前
|
负载均衡 算法 Linux
深入探索Linux内核调度机制:公平与效率的平衡####
本文旨在剖析Linux操作系统内核中的进程调度机制,特别是其如何通过CFS(完全公平调度器)算法实现多任务环境下资源分配的公平性与系统响应速度之间的微妙平衡。不同于传统摘要的概览性质,本文摘要将直接聚焦于CFS的核心原理、设计目标及面临的挑战,为读者揭开Linux高效调度的秘密。 ####
32 3
|
22天前
|
负载均衡 算法 Linux
深入探索Linux内核调度器:公平与效率的平衡####
本文通过剖析Linux内核调度器的工作机制,揭示了其在多任务处理环境中如何实现时间片轮转、优先级调整及完全公平调度算法(CFS),以达到既公平又高效地分配CPU资源的目标。通过对比FIFO和RR等传统调度策略,本文展示了Linux调度器如何在复杂的计算场景下优化性能,为系统设计师和开发者提供了宝贵的设计思路。 ####
34 6
|
22天前
|
消息中间件 安全 Linux
深入探索Linux操作系统的内核机制
本文旨在为读者提供一个关于Linux操作系统内核机制的全面解析。通过探讨Linux内核的设计哲学、核心组件、以及其如何高效地管理硬件资源和系统操作,本文揭示了Linux之所以成为众多开发者和组织首选操作系统的原因。不同于常规摘要,此处我们不涉及具体代码或技术细节,而是从宏观的角度审视Linux内核的架构和功能,为对Linux感兴趣的读者提供一个高层次的理解框架。
|
23天前
|
缓存 并行计算 Linux
深入解析Linux操作系统的内核优化策略
本文旨在探讨Linux操作系统内核的优化策略,包括内核参数调整、内存管理、CPU调度以及文件系统性能提升等方面。通过对这些关键领域的分析,我们可以理解如何有效地提高Linux系统的性能和稳定性,从而为用户提供更加流畅和高效的计算体验。
29 2
|
23天前
|
缓存 网络协议 Linux
深入探索Linux操作系统的内核优化策略####
本文旨在探讨Linux操作系统内核的优化方法,通过分析当前主流的几种内核优化技术,结合具体案例,阐述如何有效提升系统性能与稳定性。文章首先概述了Linux内核的基本结构,随后详细解析了内核优化的必要性及常用手段,包括编译优化、内核参数调整、内存管理优化等,最后通过实例展示了这些优化技巧在实际场景中的应用效果,为读者提供了一套实用的Linux内核优化指南。 ####
45 1
|
23天前
|
算法 前端开发 Linux
深入理解Linux内核调度器:CFS与实时性的平衡####
本文旨在探讨Linux操作系统的核心组件之一——完全公平调度器(CFS)的工作原理,分析其在多任务处理环境中如何实现进程间的公平调度,并进一步讨论Linux对于实时性需求的支持策略。不同于传统摘要仅概述内容要点,本部分将简要预览CFS的设计哲学、核心算法以及它是如何通过红黑树数据结构来维护进程执行顺序,同时触及Linux内核为满足不同应用场景下的实时性要求而做出的权衡与优化。 ####