Linux内核27-优化和内存屏障

简介: Linux内核27-优化和内存屏障

1. 引言


我们都知道,带有优化的编译器,会尝试重新排序汇编指令,以提高程序的执行速度。但是,当在处理同步问题的时候,重新排序的指令应该被避免。因为重新排序可能会打乱我们之前想要的同步效果。其实,所有的同步原语都可以充当优化和内存屏障。

优化屏障保证屏障原语前后的C语言转换成汇编语言之后,指令序列不会发生变化。比如说,对于Linux内核的barrier()宏,展开后就是asm volatile("":::"memory"),就是一个优化屏障。asm告知编译器插入一条汇编指令,volatile关键字禁止编译器用程序的其它指令重新洗牌asm指令。memory关键字强迫编译器假设RAM中所有的位置都被汇编指令更改了;因此,编译器不会使用CPU寄存器中的值优化asm指令之前的代码。我们需要注意的是优化屏障不能保证汇编指令的执行不会乱序,这是由内存屏障保障的。

内存屏障确保屏障原语前的指令完成后,才会启动原语之后的指令操作。


2. 架构相关的内存屏障实现


X86系统中,下面这些汇编指令都是串行的,可以充当内存屏障:

  • 所有操作I/O端口的指令;
  • 前缀lock的指令;
  • 所有写控制寄存器,系统寄存器或debug寄存器的指令(比如,clisti指令,可以改变eflags寄存器的IF标志);
  • lfencesfencemfence汇编指令,分别用来实现读内存屏障、写内存屏障和读/写内存屏障;
  • 特殊的汇编指令,比如iret指令,可以终止中断或异常处理程序。

ARM系统中,使用ldrexstrex汇编指令实现内存屏障。


3. Linux内核使用的内存屏障原语


Linux内核中使用的内存屏障原语如下,如表5-6所示。当然了,这些原语完全可以作为优化屏障,阻止编译器优化该屏障前后的汇编指令。读内存屏障只对内存的读操作指令有效;写内存屏障只对内存的写操作指令有效。smp_xxx()之类的内存屏障只对发生在多核系统里的竞态条件有效,单核系统中,什么也没有做。其它的内存屏障对多核系统和单核系统都有效。

表5-6 Linux内存屏障

macro 描述
mb() MP和UP的内存屏障
rmb() MP和UP的读内存屏障
wmb() MP和UP的写内存屏障
smp_mb() MP内存屏障
smp_rmb() MP读内存屏障
smp_wmb() MP写内存屏障

内存屏障的实现跟系统架构息息相关。在X86系统上,如果支持lfence汇编指令,则rmb()实现为:

asm volatile("lfence":::"memory")

如不支持lfence汇编指令,则rmb()实现为:

asm volatile("lock;addl $0,0(%%esp)":::"memory")

asm volatile的作用之前的文章已经介绍过,不再赘述。lock;addl $0,0(%%esp)":::"memory"的意思是,对栈顶保存的内存地址内的内容加上0,所以这条命令本身没有意义,主要还是lock前缀,对数据总线加锁,从而使该条指令对CPU而言,称为内存屏障。

wmb()的实现事实上非常简单,就是barrier()的宏声明。这是因为,现有的Intel处理器不会对写内存访问进行重新排序,所以无法插入特定的内存屏障指令。但是,该宏还是会禁止编译器打乱指令。

值得注意的是多核处理器中,所有的原子操作指令都会前缀lock,所以都可以充当内存屏障。


4. 总结


内存屏障主要解决的还是硬件数据总线上对于指令的读取可能会发生乱序问题。所以,内存屏障的使用场合就是对系统进行设置或者配置时,因为这些设置关系到后面的程序能否正确工作,所以需要内存屏障,保证程序运行之前,系统的配置已经生效。

相关文章
|
2天前
|
算法 Linux 开发者
深入探究Linux内核中的内存管理机制
本文旨在对Linux操作系统的内存管理机制进行深入分析,探讨其如何通过高效的内存分配和回收策略来优化系统性能。文章将详细介绍Linux内核中内存管理的关键技术点,包括物理内存与虚拟内存的映射、页面置换算法、以及内存碎片的处理方法等。通过对这些技术点的解析,本文旨在为读者提供一个清晰的Linux内存管理框架,帮助理解其在现代计算环境中的重要性和应用。
|
2天前
|
人工智能 算法 大数据
Linux内核中的调度算法演变:从O(1)到CFS的优化之旅###
本文深入探讨了Linux操作系统内核中进程调度算法的发展历程,聚焦于O(1)调度器向完全公平调度器(CFS)的转变。不同于传统摘要对研究背景、方法、结果和结论的概述,本文创新性地采用“技术演进时间线”的形式,简明扼要地勾勒出这一转变背后的关键技术里程碑,旨在为读者提供一个清晰的历史脉络,引领其深入了解Linux调度机制的革新之路。 ###
|
4天前
|
算法 Linux 定位技术
Linux内核中的进程调度算法解析####
【10月更文挑战第29天】 本文深入剖析了Linux操作系统的心脏——内核中至关重要的组成部分之一,即进程调度机制。不同于传统的摘要概述,我们将通过一段引人入胜的故事线来揭开进程调度算法的神秘面纱,展现其背后的精妙设计与复杂逻辑,让读者仿佛跟随一位虚拟的“进程侦探”,一步步探索Linux如何高效、公平地管理众多进程,确保系统资源的最优分配与利用。 ####
24 4
|
5天前
|
缓存 负载均衡 算法
Linux内核中的进程调度算法解析####
本文深入探讨了Linux操作系统核心组件之一——进程调度器,着重分析了其采用的CFS(完全公平调度器)算法。不同于传统摘要对研究背景、方法、结果和结论的概述,本文摘要将直接揭示CFS算法的核心优势及其在现代多核处理器环境下如何实现高效、公平的资源分配,同时简要提及该算法如何优化系统响应时间和吞吐量,为读者快速构建对Linux进程调度机制的认知框架。 ####
|
7天前
|
缓存 Linux
揭秘Linux内核:探索CPU拓扑结构
【10月更文挑战第26天】
23 1
|
7天前
|
缓存 运维 Linux
深入探索Linux内核:CPU拓扑结构探测
【10月更文挑战第18天】在现代计算机系统中,CPU的拓扑结构对性能优化和资源管理至关重要。了解CPU的核心、线程、NUMA节点等信息,可以帮助开发者和系统管理员更好地调优应用程序和系统配置。本文将深入探讨如何在Linux内核中探测CPU拓扑结构,介绍相关工具和方法。
9 0
|
7天前
|
存储 缓存 监控
|
5天前
|
缓存 算法 Linux
Linux内核中的内存管理机制深度剖析####
【10月更文挑战第28天】 本文深入探讨了Linux操作系统的心脏——内核,聚焦其内存管理机制的奥秘。不同于传统摘要的概述方式,本文将以一次虚拟的内存分配请求为引子,逐步揭开Linux如何高效、安全地管理着从微小嵌入式设备到庞大数据中心数以千计程序的内存需求。通过这段旅程,读者将直观感受到Linux内存管理的精妙设计与强大能力,以及它是如何在复杂多变的环境中保持系统稳定与性能优化的。 ####
11 0
|
3月前
|
存储 编译器 C语言
【C语言篇】数据在内存中的存储(超详细)
浮点数就采⽤下⾯的规则表⽰,即指数E的真实值加上127(或1023),再将有效数字M去掉整数部分的1。
331 0
|
13天前
|
存储 C语言
数据在内存中的存储方式
本文介绍了计算机中整数和浮点数的存储方式,包括整数的原码、反码、补码,以及浮点数的IEEE754标准存储格式。同时,探讨了大小端字节序的概念及其判断方法,通过实例代码展示了这些概念的实际应用。
25 1