Linux内核26-ARM的WFI和WFE指令

简介: Linux内核26-ARM的WFI和WFE指令

1 前言


今天在理解读写自旋锁的实现的时候,看到了WFE指令,对其不理解。通过调查,弄清楚了它的来龙去脉,记录一下。在此,还要特别感谢窝窝科技的这篇文章【ARM WFI和WFE指令】,让我茅塞断开。

WFI(Wait for interrupt)WFE(Wait for event)是两个让ARM核进入低功耗待机模式的指令,由ARM架构规范定义,由ARM核实现。


2 WFI和WFE


  • 1)共同点
    WFI和WFE的功能非常类似,以ARMv8-A为例(参考DDI0487A_d_armv8_arm.pdf的描述),主要是“将ARMv8-A PE(Processing Element, 处理单元)设置为低功耗待机状态”。
    需要说明的是,ARM架构并没有规定“低功耗待机状态”的具体形式。因而,可以由IP核自由发挥,根据ARM的建议,一般可以实现为standby(关闭clock、保持供电)、dormantshutdown等等。但有个原则,不能造成内存一致性的问题。以Cortex-A57 ARM core为例,它把WFI和WFE实现为“put the core in a low-power state by disabling the clocks in the core while keeping the core powered up”,即我们通常所说的standby模式,保持供电,关闭clock。
  • 2)不同点
    那它们的区别体现在哪呢?主要体现进入和退出的方式上。
    对WFI来说,执行WFI指令后,ARM核会立即进入低功耗待机模式,直到有WFI唤醒事件发生。
    而WFE则稍微不同,执行WFE指令后,根据事件寄存器(一个单bit的寄存器,每个PE一个)的状态,有两种情况:如果事件寄存器为1,该指令会把它清零,然后执行完成(不会standby);如果事件寄存器为0,和WFI类似,进入低功耗待机模式,直到有WFE唤醒事件发生。
    WFI唤醒事件和WFE唤醒事件可以分别让ARM核从WFI和WFE状态唤醒,这两类事件大部分相同,如任意的IRQ中断、FIQ中断等等。一些细微的差别,可以参考“DDI0487A_d_armv8_arm.pdf“的描述。而最大的不同是,WFE可以被任何PE上执行的SEV指令唤醒。
    所谓的SEV指令,就是一个用来改变事件寄存器的指令,有两个:SEV会修改所有PE上的寄存器;SEVL,只修改本PE的寄存器值。下面让我们看看WFE这种特殊设计的使用场景。


3 使用场景


  • 1)WFI
    WFI一般用于cpu空闲时。
  • 2)WFE
    WFE的一个典型使用场景,是用在spinlock中(可参考arch_spin_lock,对arm64来说,位于arm64/include/asm/spinlock.h中)。spinlock的功能,是在不同CPU核之间,保护共享资源。使用WFE的流程是:
  1. CPU核1访问资源,申请lock,获得资源。
  2. CPU核2访问资源,此时资源不空闲,执行WFE指令,让CPU核进入低功耗待机模式。
  3. CPU核1释放资源,释放lock,释放资源,同时执行SEV指令,唤醒核2。
  4. CPU核2申请lock,获得资源。

我们在学习spinlock的时候,已经知道,当申请lock失败的时候,CPU核会进入忙等待,比如著名的x86架构。而ARM本身就是低功耗处理器的代名词,所以通过在申请lock的过程中,插入WFE指令,可以节省一点功耗,充分将低功耗设计发挥到了极致。


4 补充


当没有获取spinlock的时候,CPU核会调用wfe,等待其他cpu使用sev来唤醒自己。

在ARM64中,arch_spin_unlock并没有显示的调用sev来唤醒其他cpu,而是通过stlr指令完成的。在ARM ARM文档中有说:在执行store操作的时候,如果要操作的地址被标记为exclusive的,那么global monitor的状态会从exclusive access变成open access,同时会触发一个事件,唤醒wfe中的cpu。

相关文章
|
4天前
|
消息中间件 Linux
Linux:进程间通信(共享内存详细讲解以及小项目使用和相关指令、消息队列、信号量)
通过上述讲解和代码示例,您可以理解和实现Linux系统中的进程间通信机制,包括共享内存、消息队列和信号量。这些机制在实际开发中非常重要,能够提高系统的并发处理能力和数据通信效率。希望本文能为您的学习和开发提供实用的指导和帮助。
47 20
|
10天前
|
Ubuntu Linux 开发者
Ubuntu20.04搭建嵌入式linux网络加载内核、设备树和根文件系统
使用上述U-Boot命令配置并启动嵌入式设备。如果配置正确,设备将通过TFTP加载内核和设备树,并通过NFS挂载根文件系统。
50 15
|
1月前
|
算法 Linux
深入探索Linux内核的内存管理机制
本文旨在为读者提供对Linux操作系统内核中内存管理机制的深入理解。通过探讨Linux内核如何高效地分配、回收和优化内存资源,我们揭示了这一复杂系统背后的原理及其对系统性能的影响。不同于常规的摘要,本文将直接进入主题,不包含背景信息或研究目的等标准部分,而是专注于技术细节和实际操作。
|
1月前
|
存储 缓存 网络协议
Linux操作系统的内核优化与性能调优####
本文深入探讨了Linux操作系统内核的优化策略与性能调优方法,旨在为系统管理员和高级用户提供一套实用的指南。通过分析内核参数调整、文件系统选择、内存管理及网络配置等关键方面,本文揭示了如何有效提升Linux系统的稳定性和运行效率。不同于常规摘要仅概述内容的做法,本摘要直接指出文章的核心价值——提供具体可行的优化措施,助力读者实现系统性能的飞跃。 ####
|
1月前
|
监控 算法 Linux
Linux内核锁机制深度剖析与实践优化####
本文作为一篇技术性文章,深入探讨了Linux操作系统内核中锁机制的工作原理、类型及其在并发控制中的应用,旨在为开发者提供关于如何有效利用这些工具来提升系统性能和稳定性的见解。不同于常规摘要的概述性质,本文将直接通过具体案例分析,展示在不同场景下选择合适的锁策略对于解决竞争条件、死锁问题的重要性,以及如何根据实际需求调整锁的粒度以达到最佳效果,为读者呈现一份实用性强的实践指南。 ####
|
1月前
|
缓存 监控 网络协议
Linux操作系统的内核优化与实践####
本文旨在探讨Linux操作系统内核的优化策略与实际应用案例,深入分析内核参数调优、编译选项配置及实时性能监控的方法。通过具体实例讲解如何根据不同应用场景调整内核设置,以提升系统性能和稳定性,为系统管理员和技术爱好者提供实用的优化指南。 ####
|
1月前
|
负载均衡 算法 Linux
深入探索Linux内核调度机制:公平与效率的平衡####
本文旨在剖析Linux操作系统内核中的进程调度机制,特别是其如何通过CFS(完全公平调度器)算法实现多任务环境下资源分配的公平性与系统响应速度之间的微妙平衡。不同于传统摘要的概览性质,本文摘要将直接聚焦于CFS的核心原理、设计目标及面临的挑战,为读者揭开Linux高效调度的秘密。 ####
39 3
|
2月前
|
负载均衡 算法 Linux
深入探索Linux内核调度器:公平与效率的平衡####
本文通过剖析Linux内核调度器的工作机制,揭示了其在多任务处理环境中如何实现时间片轮转、优先级调整及完全公平调度算法(CFS),以达到既公平又高效地分配CPU资源的目标。通过对比FIFO和RR等传统调度策略,本文展示了Linux调度器如何在复杂的计算场景下优化性能,为系统设计师和开发者提供了宝贵的设计思路。 ####
44 6
|
1月前
|
消息中间件 安全 Linux
深入探索Linux操作系统的内核机制
本文旨在为读者提供一个关于Linux操作系统内核机制的全面解析。通过探讨Linux内核的设计哲学、核心组件、以及其如何高效地管理硬件资源和系统操作,本文揭示了Linux之所以成为众多开发者和组织首选操作系统的原因。不同于常规摘要,此处我们不涉及具体代码或技术细节,而是从宏观的角度审视Linux内核的架构和功能,为对Linux感兴趣的读者提供一个高层次的理解框架。
|
2月前
|
缓存 网络协议 Linux
深入探索Linux操作系统的内核优化策略####
本文旨在探讨Linux操作系统内核的优化方法,通过分析当前主流的几种内核优化技术,结合具体案例,阐述如何有效提升系统性能与稳定性。文章首先概述了Linux内核的基本结构,随后详细解析了内核优化的必要性及常用手段,包括编译优化、内核参数调整、内存管理优化等,最后通过实例展示了这些优化技巧在实际场景中的应用效果,为读者提供了一套实用的Linux内核优化指南。 ####
55 1