为什么进程切换比线程切换代价大,效率低?【TLB:页表缓存/快表】

简介: 为什么进程切换比线程切换代价大,效率低?【TLB:页表缓存/快表】

参考:

一、为什么进程切换比线程切换代价大,效率更低?

首先,先给出标题的答案(关键在于进程切换涉及到TLB的失效及更新,线程不涉及):

因为,每次进程切换时,都会涉及页表的切换,不过**切换页表这个操作本身是不太耗时的。但是在切换之后,TLB(页表缓存/快表)就失效了,所以在进行地址转化时就需要重新去查找页表,这就造成了程序运行的效率低下。
而同一个进程的线程之间是共用一个页表的,所以线程之间的切换是不需要切换页表的,因此线程切换不存在上述代价大,效率低的问题。**

其次,再来了解下几个基本概念:

  • 虚拟内存技术:提供一种虚拟地址到实际物理地址的映射,将连续的虚拟地址暴露给程序,而实际上他们在物理内存(比如内存条)上面是不连续的。

虚拟内存能够很好的帮助程序员避免麻烦的内存管理与冲突等问题,并且将内存作为模块化独立出来。

  • 虚拟内存地址:程序所使用的内存地址(Virtual Memory Address)。
  • 物理内存地址:实际存在硬件里面的空间地址(Physical Memory Address)。

二、内存分页与页表

  • 内存分页:是把整个虚拟内存和物理内存空间切成一段段固定大小的尺寸。这样一个连续并且尺寸固定的内存空间叫做(Page)。

在 Linux 下,页是访问内存的最小单位,每一页大小为 4KB

  • 页表:记录【进程 虚拟地址】与【内存 物理地址】的映射关系。

每个进程都拥有自己的虚拟地址空间,也拥有一个页表。
在这里插入图片描述
如果程序要访问虚拟地址时,由操作系统转换成不同的物理地址,这样不同的进程在运行时,写入的是不同的物理地址,这样就不会冲突了。

页表是存储在内存里的,而CPU芯片中的 内存管理单元 (MMU)就负责将虚拟内存地址转换成物理地址的工作。

而当进程访问的虚拟地址在页表中查不到时,系统会产生一个缺页异常,进入系统内核空间分配物理内存、更新进程页表,最后再返回用户空间,恢复进程的运行。

页表使用虚拟地址的页号作为索引,以找到实际物理存储器中的页号,即:key = 虚拟地址的页号, val = 实际物理存储器中的页号。索引的过程如下图:
在这里插入图片描述

三、TLB(页表缓存/快表)

大家都知道, 计算机中的cpu的处理速度是要远快于内存操作的,那么每次cpu要读取数据时都需要等待内存就绪才行,这在一定程度上限制了cpu的执行效率。

于是计算机科学家们根据局部性原理,就在 CPU 芯片中加入了一个专门存放程序最常访问页表项的 Cache 高速缓存,这个 Cache 就是 TLB(Translation Lookaside Buffer) ,通常称为 页表缓存转址旁路缓存快表等,可以极大提高地址转换速度,加速对于页表的访问。

  • 理解:TLB可以看作是一种硬件的哈希表,来快速查找 高速cache 中是否存在特定地址的数据,而其中应用到的内存淘汰策略则是常被提到的LRU内存淘汰策略。
  • 作用:可以加速页表读取,极大提高虚拟地址到物理地址的转换速度。
  • 过程:那么对于一次存取,就会有分 3 种的情况:

    • TLB hit:命中缓存直接访问内存取数据
    • TLB miss:未命中缓存,但是在内存中有对应页 → 【要再去页表中找地址】
    • TLB miss:同时内存中也没有对应页,发生缺页 → 【要向磁盘要数据,同时更新 TLB 和 页表】

总之,就是先查找 TLB,如果缺失,那么查找页表;还缺就是发生缺页了,需要通过磁盘加载所需数据到物理内存中。如果查找 TLB 命中,那么根据 TLB 获取物理地址,然后查找数据 cache,后续就算普通的 cache 查找了。

加入 TLB 之后,虚拟地址到物理地址的完整地址映射长这样:
在这里插入图片描述

最后,附上一张关于 TLB 的总流程图:
在这里插入图片描述

最后再补充一点:
对于一个内存地址是如何转换为实际的物理内存地址的呢? 其实分为 3 个步骤:

  • 把虚拟内存地址切分成页号偏移量
  • 根据页号,从页表里面查询对应的物理页号
  • 直接拿物理页号加上前面的偏移量,就得到了实际的物理内存地址

四、总结

  • 为什么进程切换比线程切换代价大,效率低?

    • 关键在于进程切换涉及到TLB的失效及更新,线程不涉及
  • 内存分页会把整个虚拟内存和物理内存空间切成一段段尺寸固定大小的在 Linux 下,页是访问内存的最小单位,占 4KB。
  • 页表记录【虚拟地址空间】与【物理地址空间】的映射关系。
  • 为了加速页表的读取,出现了一种存放 程序最常访问页表项的 Cache 高速缓存,称之为TLB,可以极大提高虚拟地址到物理地址的转换速度。
目录
相关文章
|
2月前
|
Java 测试技术 API
【JUC】(1)带你重新认识进程与线程!!让你深层次了解线程运行的睡眠与打断!!
JUC是什么?你可以说它就是研究Java方面的并发过程。本篇是JUC专栏的第一章!带你了解并行与并发、线程与程序、线程的启动与休眠、打断和等待!全是干货!快快快!
532 2
|
2月前
|
JSON 网络协议 安全
【Java】(10)进程与线程的关系、Tread类;讲解基本线程安全、网络编程内容;JSON序列化与反序列化
几乎所有的操作系统都支持进程的概念,进程是处于运行过程中的程序,并且具有一定的独立功能,进程是系统进行资源分配和调度的一个独立单位一般而言,进程包含如下三个特征。独立性动态性并发性。
196 1
|
2月前
|
JSON 网络协议 安全
【Java基础】(1)进程与线程的关系、Tread类;讲解基本线程安全、网络编程内容;JSON序列化与反序列化
几乎所有的操作系统都支持进程的概念,进程是处于运行过程中的程序,并且具有一定的独立功能,进程是系统进行资源分配和调度的一个独立单位一般而言,进程包含如下三个特征。独立性动态性并发性。
216 1
|
10月前
|
存储 Linux API
【Linux进程概念】—— 操作系统中的“生命体”,计算机里的“多线程”
在计算机系统的底层架构中,操作系统肩负着资源管理与任务调度的重任。当我们启动各类应用程序时,其背后复杂的运作机制便悄然展开。程序,作为静态的指令集合,如何在系统中实现动态执行?本文带你一探究竟!
【Linux进程概念】—— 操作系统中的“生命体”,计算机里的“多线程”
|
8月前
|
并行计算 Linux
Linux内核中的线程和进程实现详解
了解进程和线程如何工作,可以帮助我们更好地编写程序,充分利用多核CPU,实现并行计算,提高系统的响应速度和计算效能。记住,适当平衡进程和线程的使用,既要拥有独立空间的'兄弟',也需要在'家庭'中分享和并行的成员。对于这个世界,现在,你应该有一个全新的认识。
308 67
|
调度 开发者 Python
深入浅出操作系统:进程与线程的奥秘
在数字世界的底层,操作系统扮演着不可或缺的角色。它如同一位高效的管家,协调和控制着计算机硬件与软件资源。本文将拨开迷雾,深入探索操作系统中两个核心概念——进程与线程。我们将从它们的诞生谈起,逐步剖析它们的本质、区别以及如何影响我们日常使用的应用程序性能。通过简单的比喻,我们将理解这些看似抽象的概念,并学会如何在编程实践中高效利用进程与线程。准备好跟随我一起,揭开操作系统的神秘面纱,让我们的代码运行得更加流畅吧!
|
6月前
|
调度 开发工具 Android开发
【HarmonyOS Next】鸿蒙应用进程和线程详解
进程的定义: 进程是系统进行资源分配的基本单位,是操作系统结构的基础。 在鸿蒙系统中,一个应用下会有三类进程:
234 0
|
9月前
|
SQL 监控 网络协议
YashanDB进程线程体系
YashanDB进程线程体系
|
11月前
|
消息中间件 调度
如何区分进程、线程和协程?看这篇就够了!
本课程主要探讨操作系统中的进程、线程和协程的区别。进程是资源分配的基本单位,具有独立性和隔离性;线程是CPU调度的基本单位,轻量且共享资源,适合并发执行;协程更轻量,由程序自身调度,适合I/O密集型任务。通过学习这些概念,可以更好地理解和应用它们,以实现最优的性能和资源利用。
367 11
|
11月前
|
Java Linux 调度
硬核揭秘:线程与进程的底层原理,面试高分必备!
嘿,大家好!我是小米,29岁的技术爱好者。今天来聊聊线程和进程的区别。进程是操作系统中运行的程序实例,有独立内存空间;线程是进程内的最小执行单元,共享内存。创建进程开销大但更安全,线程轻量高效但易引发数据竞争。面试时可强调:进程是资源分配单位,线程是CPU调度单位。根据不同场景选择合适的并发模型,如高并发用线程池。希望这篇文章能帮你更好地理解并回答面试中的相关问题,祝你早日拿下心仪的offer!
270 6

热门文章

最新文章