1 前言
今天在理解读写自旋锁的实现的时候,看到了WFE指令,对其不理解。通过调查,弄清楚了它的来龙去脉,记录一下。在此,还要特别感谢窝窝科技的这篇文章【ARM WFI和WFE指令】,让我茅塞断开。
WFI(Wait for interrupt)
和WFE(Wait for event)
是两个让ARM核进入低功耗待机
模式的指令,由ARM架构规范定义,由ARM核实现。
2 WFI和WFE
- 1)共同点
WFI和WFE的功能非常类似,以ARMv8-A为例(参考DDI0487A_d_armv8_arm.pdf
的描述),主要是“将ARMv8-A PE
(Processing Element
, 处理单元)设置为低功耗待机状态
”。
需要说明的是,ARM架构并没有规定“低功耗待机状态
”的具体形式。因而,可以由IP核自由发挥,根据ARM的建议,一般可以实现为standby
(关闭clock、保持供电)、dormant
、shutdown
等等。但有个原则,不能造成内存一致性的问题。以Cortex-A57 ARM core
为例,它把WFI和WFE实现为“put the core in a low-power state by disabling the clocks in the core while keeping the core powered up
”,即我们通常所说的standby模式,保持供电,关闭clock。 - 2)不同点
那它们的区别体现在哪呢?主要体现进入和退出的方式上。
对WFI来说,执行WFI指令后,ARM核会立即进入低功耗待机模式,直到有WFI唤醒事件发生。
而WFE则稍微不同,执行WFE指令后,根据事件寄存器(一个单bit的寄存器,每个PE一个)的状态,有两种情况:如果事件寄存器为1,该指令会把它清零,然后执行完成(不会standby);如果事件寄存器为0,和WFI类似,进入低功耗待机模式,直到有WFE唤醒事件发生。
WFI唤醒事件和WFE唤醒事件可以分别让ARM核从WFI和WFE状态唤醒,这两类事件大部分相同,如任意的IRQ中断、FIQ中断等等。一些细微的差别,可以参考“DDI0487A_d_armv8_arm.pdf
“的描述。而最大的不同是,WFE可以被任何PE上执行的SEV
指令唤醒。
所谓的SEV
指令,就是一个用来改变事件寄存器的指令,有两个:SEV
会修改所有PE上的寄存器;SEVL
,只修改本PE的寄存器值。下面让我们看看WFE这种特殊设计的使用场景。
3 使用场景
- 1)WFI
WFI
一般用于cpu空闲时。 - 2)WFE
WFE的一个典型使用场景,是用在spinlock
中(可参考arch_spin_lock
,对arm64来说,位于arm64/include/asm/spinlock.h
中)。spinlock的功能,是在不同CPU核之间,保护共享资源。使用WFE的流程是:
- CPU核1访问资源,申请lock,获得资源。
- CPU核2访问资源,此时资源不空闲,执行WFE指令,让CPU核进入低功耗待机模式。
- CPU核1释放资源,释放lock,释放资源,同时执行SEV指令,唤醒核2。
- CPU核2申请lock,获得资源。
我们在学习spinlock的时候,已经知道,当申请lock失败的时候,CPU核会进入忙等待,比如著名的x86架构。而ARM本身就是低功耗处理器的代名词,所以通过在申请lock的过程中,插入WFE指令,可以节省一点功耗,充分将低功耗设计发挥到了极致。
4 补充
当没有获取spinlock的时候,CPU核会调用wfe,等待其他cpu使用sev来唤醒自己。
在ARM64中,arch_spin_unlock
并没有显示的调用sev来唤醒其他cpu,而是通过stlr指令完成的。在ARM ARM文档中有说:在执行store操作的时候,如果要操作的地址被标记为exclusive的,那么global monitor的状态会从exclusive access变成open access,同时会触发一个事件,唤醒wfe中的cpu。