Linux内核27-优化和内存屏障

简介: Linux内核27-优化和内存屏障

1. 引言


我们都知道,带有优化的编译器,会尝试重新排序汇编指令,以提高程序的执行速度。但是,当在处理同步问题的时候,重新排序的指令应该被避免。因为重新排序可能会打乱我们之前想要的同步效果。其实,所有的同步原语都可以充当优化和内存屏障。

优化屏障保证屏障原语前后的C语言转换成汇编语言之后,指令序列不会发生变化。比如说,对于Linux内核的barrier()宏,展开后就是asm volatile("":::"memory"),就是一个优化屏障。asm告知编译器插入一条汇编指令,volatile关键字禁止编译器用程序的其它指令重新洗牌asm指令。memory关键字强迫编译器假设RAM中所有的位置都被汇编指令更改了;因此,编译器不会使用CPU寄存器中的值优化asm指令之前的代码。我们需要注意的是优化屏障不能保证汇编指令的执行不会乱序,这是由内存屏障保障的。

内存屏障确保屏障原语前的指令完成后,才会启动原语之后的指令操作。


2. 架构相关的内存屏障实现


X86系统中,下面这些汇编指令都是串行的,可以充当内存屏障:

  • 所有操作I/O端口的指令;
  • 前缀lock的指令;
  • 所有写控制寄存器,系统寄存器或debug寄存器的指令(比如,clisti指令,可以改变eflags寄存器的IF标志);
  • lfencesfencemfence汇编指令,分别用来实现读内存屏障、写内存屏障和读/写内存屏障;
  • 特殊的汇编指令,比如iret指令,可以终止中断或异常处理程序。

ARM系统中,使用ldrexstrex汇编指令实现内存屏障。


3. Linux内核使用的内存屏障原语


Linux内核中使用的内存屏障原语如下,如表5-6所示。当然了,这些原语完全可以作为优化屏障,阻止编译器优化该屏障前后的汇编指令。读内存屏障只对内存的读操作指令有效;写内存屏障只对内存的写操作指令有效。smp_xxx()之类的内存屏障只对发生在多核系统里的竞态条件有效,单核系统中,什么也没有做。其它的内存屏障对多核系统和单核系统都有效。

表5-6 Linux内存屏障

macro 描述
mb() MP和UP的内存屏障
rmb() MP和UP的读内存屏障
wmb() MP和UP的写内存屏障
smp_mb() MP内存屏障
smp_rmb() MP读内存屏障
smp_wmb() MP写内存屏障

内存屏障的实现跟系统架构息息相关。在X86系统上,如果支持lfence汇编指令,则rmb()实现为:

asm volatile("lfence":::"memory")

如不支持lfence汇编指令,则rmb()实现为:

asm volatile("lock;addl $0,0(%%esp)":::"memory")

asm volatile的作用之前的文章已经介绍过,不再赘述。lock;addl $0,0(%%esp)":::"memory"的意思是,对栈顶保存的内存地址内的内容加上0,所以这条命令本身没有意义,主要还是lock前缀,对数据总线加锁,从而使该条指令对CPU而言,称为内存屏障。

wmb()的实现事实上非常简单,就是barrier()的宏声明。这是因为,现有的Intel处理器不会对写内存访问进行重新排序,所以无法插入特定的内存屏障指令。但是,该宏还是会禁止编译器打乱指令。

值得注意的是多核处理器中,所有的原子操作指令都会前缀lock,所以都可以充当内存屏障。


4. 总结


内存屏障主要解决的还是硬件数据总线上对于指令的读取可能会发生乱序问题。所以,内存屏障的使用场合就是对系统进行设置或者配置时,因为这些设置关系到后面的程序能否正确工作,所以需要内存屏障,保证程序运行之前,系统的配置已经生效。

相关文章
|
15天前
|
算法 Linux
深入探索Linux内核的内存管理机制
本文旨在为读者提供对Linux操作系统内核中内存管理机制的深入理解。通过探讨Linux内核如何高效地分配、回收和优化内存资源,我们揭示了这一复杂系统背后的原理及其对系统性能的影响。不同于常规的摘要,本文将直接进入主题,不包含背景信息或研究目的等标准部分,而是专注于技术细节和实际操作。
|
15天前
|
存储 缓存 网络协议
Linux操作系统的内核优化与性能调优####
本文深入探讨了Linux操作系统内核的优化策略与性能调优方法,旨在为系统管理员和高级用户提供一套实用的指南。通过分析内核参数调整、文件系统选择、内存管理及网络配置等关键方面,本文揭示了如何有效提升Linux系统的稳定性和运行效率。不同于常规摘要仅概述内容的做法,本摘要直接指出文章的核心价值——提供具体可行的优化措施,助力读者实现系统性能的飞跃。 ####
|
21天前
|
存储 缓存 监控
Docker容器性能调优的关键技巧,涵盖CPU、内存、网络及磁盘I/O的优化策略,结合实战案例,旨在帮助读者有效提升Docker容器的性能与稳定性。
本文介绍了Docker容器性能调优的关键技巧,涵盖CPU、内存、网络及磁盘I/O的优化策略,结合实战案例,旨在帮助读者有效提升Docker容器的性能与稳定性。
54 7
|
16天前
|
监控 算法 Linux
Linux内核锁机制深度剖析与实践优化####
本文作为一篇技术性文章,深入探讨了Linux操作系统内核中锁机制的工作原理、类型及其在并发控制中的应用,旨在为开发者提供关于如何有效利用这些工具来提升系统性能和稳定性的见解。不同于常规摘要的概述性质,本文将直接通过具体案例分析,展示在不同场景下选择合适的锁策略对于解决竞争条件、死锁问题的重要性,以及如何根据实际需求调整锁的粒度以达到最佳效果,为读者呈现一份实用性强的实践指南。 ####
|
16天前
|
缓存 监控 网络协议
Linux操作系统的内核优化与实践####
本文旨在探讨Linux操作系统内核的优化策略与实际应用案例,深入分析内核参数调优、编译选项配置及实时性能监控的方法。通过具体实例讲解如何根据不同应用场景调整内核设置,以提升系统性能和稳定性,为系统管理员和技术爱好者提供实用的优化指南。 ####
|
19天前
|
负载均衡 算法 Linux
深入探索Linux内核调度机制:公平与效率的平衡####
本文旨在剖析Linux操作系统内核中的进程调度机制,特别是其如何通过CFS(完全公平调度器)算法实现多任务环境下资源分配的公平性与系统响应速度之间的微妙平衡。不同于传统摘要的概览性质,本文摘要将直接聚焦于CFS的核心原理、设计目标及面临的挑战,为读者揭开Linux高效调度的秘密。 ####
32 3
|
21天前
|
存储 算法 Java
Java 内存管理与优化:掌控堆与栈,雕琢高效代码
Java内存管理与优化是提升程序性能的关键。掌握堆与栈的运作机制,学习如何有效管理内存资源,雕琢出更加高效的代码,是每个Java开发者必备的技能。
46 5
|
21天前
|
负载均衡 算法 Linux
深入探索Linux内核调度器:公平与效率的平衡####
本文通过剖析Linux内核调度器的工作机制,揭示了其在多任务处理环境中如何实现时间片轮转、优先级调整及完全公平调度算法(CFS),以达到既公平又高效地分配CPU资源的目标。通过对比FIFO和RR等传统调度策略,本文展示了Linux调度器如何在复杂的计算场景下优化性能,为系统设计师和开发者提供了宝贵的设计思路。 ####
33 6
|
21天前
|
消息中间件 安全 Linux
深入探索Linux操作系统的内核机制
本文旨在为读者提供一个关于Linux操作系统内核机制的全面解析。通过探讨Linux内核的设计哲学、核心组件、以及其如何高效地管理硬件资源和系统操作,本文揭示了Linux之所以成为众多开发者和组织首选操作系统的原因。不同于常规摘要,此处我们不涉及具体代码或技术细节,而是从宏观的角度审视Linux内核的架构和功能,为对Linux感兴趣的读者提供一个高层次的理解框架。
|
21天前
|
并行计算 算法 测试技术
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面,旨在通过综合策略提升程序性能,满足实际需求。
50 1
下一篇
DataWorks