写给新手的MMU工作原理

简介: 写给新手的MMU工作原理

很多人接触Linux的内存管理是从malloc()这个C语言库函数开始,也是从那时开始就知道了虚拟内存的概念。但很多人可能并不知道虚拟地址是如何转换成物理地址的,今天带你搞懂虚拟地址到物理地址的转换过程,这其实也是MMU的工作原理。

1、预备知识

我们知道,在Linux中,每个进程都有自己独立的地址空间,且互不干扰。每个进程的地址空间又分为用户空间和内核空间,但这些地址空间使用的都是虚拟地址,它们和物理地址空间关系是怎样的呢?虚拟地址空间和物理地址空间的关系如下:

对于不同的进程,面对的都是同一个内核,其内核空间的地址对应的物理地址都是一样的,因此进程1和进程2中内核空间都映射到了相同的物理内存PA1上。

而不同进程的用户空间是不一样的,即便相同的虚拟地址,也会被映射到不同的物理地址上。如图中两个进程相同用户空间的地址0x123456分别被映射到了PA2PA3物理地址上。

那么如何完成上述虚拟地址到物理地址的转换呢?

完成虚拟地址到物理地址的转换,我们需要借助一个硬件——MMU

MMU: Memory manager unit,内存管理单元,负责将虚拟地址(VA)转为物理地址(PA)。

在介绍MMU是如何将虚拟地址转为物理地址之前,我们需要了解一些内存管理机制。

2、分页机制

在Linux系统上,现在用到的内存管理机制,大部分是分页机制。在分页机制出现之前,还出现过动态分区法、分段机制。

动态分区法是还没用引入虚拟地址之前使用的,使用的都是物理内存,属于非常早期的机制。分段机制则引入了虚拟地址的概念,而分页机制在分段机制后出现,主要解决分段机制内存碎片的问题。本篇以分页机制讲解虚拟地址到物理地址的转换,下面介绍分页机制的一些基本概念。

分页机制的基本概念:

  • 分页:将内存划分为固定长度的单元,每个单元就是一页
  • :对于虚拟地址空间,将地址空间划分为固定大小单元的单元,每个单元称为一页
  • 页帧:对于物理地址空间,将地址空间分为固定大小的单元,每个单元称为页帧
  • VPN:Virtual Page Number,虚拟页面号
  • PFN:Physical Frame Number,物理页帧号

分页管理内存的核心问题就是虚拟地址页到物理地址页帧的映射关系

3、虚拟地址到物理地址转换过程

虚拟地址和物理地址都被划分了两部分:

虚拟地址由虚拟页面号VPN和虚拟地址偏移VA offset两部分组成。同样,物理地址由物理页帧号PFN和物理地址偏移PA offset两部分组成。

虚拟地址转换成物理地址时,需要将VPN转成PFNPA offset通常就是VA offset

所以物理地址 = PFN + VA offset

这里的核心就是VPN到PFN的映射,而VPN到PFN的映射关系是通过页表记录。就是说,页表存储了VPN和PFN的映射关系,MMU根据VPN,在页表中找到PFN,再把PFN和VA offset相加,就得到了物理地址,从而将虚拟地址转为物理地址。

这里要区分一下,页表存储了VA到PA的映射关系,所以说找到页表就找到了物理地址。但是这个页表是软件提供的,MMU只负责将虚拟地址翻译成物理地址,翻译的依据就是页表,MMU本身不负责创建页表。所以说,在开启MMU之前,系统就要提前建立好虚拟地址到物理地址的映射关系,然后保存到页表中,这样开启MMU时,MMU才能正确找到对应的物理地址。

4、页表在哪

页表都存储在物理内存中, MMU将虚拟地址转换为物理地址,需要访问物理内存中对应的页表。

实际上,页表通常就是用一个数组来表示。

这里可能会一些疑问:

疑问:放到物理内存,每次转换都要访问内存,速度不慢吗?

答:慢。怎么解决呢?如果有cache是不是就很快了?是的,这块cache就叫TLB。

疑问:都放到物理内存,占用物理内存空间不大吗?

答:大,怎么解决?多级页表+缺页异常!多级页表可以减少内存占用,而通常只需将一级页表存储到物理内存,查找的时候,找不到二级页表,触发一个缺页异常,这时再分配页表,从而节省内存。

关于页表放到物理内存的问题,涉及到cache和其他的一些知识,内容很多且比较复杂,暂时不深究,知道页表是放在内存中的即可。

5、MMU如何知道页表在哪

前面说页表存储在物理内存中,那么MMU怎么知道这个页表在内存中的具体地址呢?

通常CPU会提供一个页表基址寄存器给操作系统使用,用于给MMU指示页表的基地址。不同处理器架构对应的寄存器也不一样:

x86:CR3(Control Register 3)

ARM-v8:系统寄存器TTBR(Translation Table Base egister)

RISC-V:SATP(Supervisor Address Translation and Protection)

页表基址寄存器存储了第一级页表的基地址,通过访问该寄存器,就能知道页表在那个位置。

6、多级页表转换过程

实际使用中,都是用多级页表来存储虚拟地址和物理地址的映射关系,

以二级页表为例(假设是32位系统),其虚拟地址转换为物理地址的过程如图所示:

PGD:Pgea Global Directory,全局页目录,存储了下一级页表的基地址

PTE:Page Table Entrys,页表入口,PTE才是真正存储了物理地址的页表

VA到PA的转换过程

MMU通过访问页表基址寄存器,得到一级页表PGD的基地址,再结合虚拟地址中的PGD index找到了下一级页表PTE的基地址;得到了PTE的基址,再结合虚拟地址中的PTE index找到PFN,然后再和VA相加得到物理地址。

这里需要注意,使用多少级的页表、以及虚拟地址、物理地址的格式、PTE的格式等等,与32系统还是64位系统有关,也与处理器的架构有关,需要根据不同系统、不同处理器架构分析。

但是MMU工作原理都是一样的,不管是二级页表、三级页表还是四级页表,都是通过第一级页表找到第二级页表,通过第二级页表找到第三级页表......最终找到物理地址。只要明白了MMU的工作原理,分析其他的页表也是大同小异。

总结

本文带大家了解了虚拟地址和物理地址的一些概念,以及MMU将虚拟地址转为物理地址的过程,相信通过以上内容,对虚拟地址、物理地址、MMU、多级页表等这些概念都不陌生了。

本文只讲解了MMU是通过页表将虚拟地址转为了物理地址的,但没有说页表是如何创建的,因为页表的创建每个处理器架构都不一样,本文只讲通用性的MMU原理,后续再深入分析页表创建。


相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
相关文章
|
并行计算 安全 开发者
RISC-V生态全景解析(五):Vector向量计算技术与SIMD技术的对比
芯片开放社区(OCC)面向开发者推出RISC-V系列内容,通过多角度、全方位解读RISC-V,系统性梳理总结相关理论知识,构建RISC-V知识图谱,促进开发者对RISC-V生态全貌的了解。
3976 0
RISC-V生态全景解析(五):Vector向量计算技术与SIMD技术的对比
|
2月前
|
存储 弹性计算 人工智能
阿里云服务器租用价格表(2026年最新)轻量、ECS、GPU 收费标准
阿里云服务器涵盖轻量应用服务器、云服务器ECS及GPU服务器三大类,适配从个人开发到企业核心业务的不同需求,价格差异显著。以下结合最新收费信息,用通俗语言梳理各机型配置与价格,包含优惠活动、续费规则及附加资源成本,帮助用户精准把控预算。
1078 4
|
资源调度 算法 Linux
Linux进程/线程的调度机制介绍:详细解析Linux系统中进程/线程的调度优先级规则
Linux进程/线程的调度机制介绍:详细解析Linux系统中进程/线程的调度优先级规则
4080 0
|
存储 缓存 Linux
内存系列学习(三):ARM处理器地址变换过程
内存系列学习(三):ARM处理器地址变换过程
1625 0
|
Ubuntu NoSQL Linux
一文讲明Docker的基本使用,常见Docker命令使用 、Docker的安装使用等【详细说明+图解+概念+实践】
这篇文章详细介绍了Docker的基本使用,包括Docker的安装、常用命令、架构概念等,并通过图解和实践帮助读者快速掌握Docker的使用方法。
一文讲明Docker的基本使用,常见Docker命令使用 、Docker的安装使用等【详细说明+图解+概念+实践】
|
Ubuntu Linux
内核实验(八):实现O-NONBLOCK非阻塞读写
本文通过修改之前的内核模块代码,介绍了如何在Linux内核中实现O_NONBLOCK非阻塞读写机制,并通过在Qemu虚拟机上的测试验证了非阻塞读写操作的正确性。
275 0
内核实验(八):实现O-NONBLOCK非阻塞读写
|
存储 自然语言处理 算法
OpenIM Bot: 用LLM构建企业专属的智能客服
OpenIM Bot 通过结合LLM和RAG技术,构建企业专属的智能客服系统。该系统通过优化向量存储、混合检索和查询分析,解决了LLM的幻觉、新鲜度、token长度和数据安全问题,提升了用户体验。向量存储和预处理步骤确保文档高质量,而混合检索结合文本和语义搜索,增强了检索结果的准确性。通过迭代优化,OpenIM Bot 提供了高效、智能的支持服务,减轻了支持团队的负担,提升了问题解决效率。
1621 3
OpenIM Bot: 用LLM构建企业专属的智能客服
|
网络协议 网络虚拟化
遇到ARP欺骗攻击,咋整?别慌!这3招教制服它!
遇到ARP欺骗攻击,咋整?别慌!这3招教制服它!
1848 0
|
块存储 芯片 内存技术
计算机组成原理(4)-----Cache的原理及相关知识点(1)
计算机组成原理(4)-----Cache的原理及相关知识点
1540 2
|
传感器 编解码 Linux
V4L2框架 | MIPI Camera指令调试笔记
V4L2框架 | MIPI Camera指令调试笔记
8463 2