浅谈OS虚拟内存

简介: 浅谈OS虚拟内存

虚拟内存


当一个可执行文件被加载到内存中执行时,就成为了一个运行的程序,也就是一个“进程”在DOS时期采用的是“实地址”模式,进程直接使用物理地址,但是这种模式下,进程可以任意修改物理内存,很容易发生占用其他进程的内存的情况,甚至可能会覆盖操作系统使用的内存。


所以出现了“保护模式”,进程不直接使用物理内存地址,而是使用虚拟的内存地址,这些地址被称为线性地址,操作系统负责把虚拟地址映射到物理内存



怎么映射?首先要知道“保护模式”提供内存分页机制,比如在32位系统下物理内存中每4KB作为一页,从虚拟内存到物理内存,是以页为单位映射的。


操作系统会以链表的形式,记录各个进程的控制信息,这在windows中称为进程控制块PCB,在Linux中对应task_struct结构体。

每个进程的控制信息中都有这样一个指针,存储的是当前进程“页目录”的物理地址,页目录也是一个内存页,存储的是一系列指针,指向同样用来存储物理内存页起始地址的“页表”,32位下,一个内存地址占4字节,一个页目录就可以寻址1024个页表,1个页表又可以寻址1024个物理内存页,每个页4KB,这样正好等于4GB,也就是说32位下只需要又这样两级页表,就足够寻址4GB大小的内存空间了


而一个32位的线性地址中,前10位可以从页目录中选择一个页表,接下来 10位,又可以从对应页表中锁定一个物理内存页,最后剩下的12位,用来存储一个相对于内存页起始地址的偏移值offset,12位正好覆盖4K个偏移值,也就足够定位到这一页的每一个地址了。


这样就实现了虚拟内存中一个内存页到一个物理内存页的映射,不仅没有在进程中直接使用物理内存的地址,而且每个进程对应自己的页表。这样在不同进程中,相同的线性地址会被映射到不同的物理地址,从而实现进程地址空间的隔离。还可以通过把同一组物理页面映射到不同进程的页表中,来实现进程间共享内存

再来看页表中存储的这些记录,它们也不知是内存页起始地址那么简单,因为内存页大小都是4KB,所以内存页的起始地址一定是4K的整数倍,也是就说低12位一定是0,因此页表里每一条记录都有12位的空闲空间可以使用,它们可以用来标识对应物理内存页是否可读,可写,可执行等信息。其中就有一位用于标识该物理内存页是否已经映射


因为进程向操作系统申请映射内存时,通常不会一申请就立马分配,操作系统会先记录,例如Linux中,通过进程对应的task_struct可以找到记录内存分配的链表,每个链表项都是一个VMA(Virtual Memory Area)结构体,里面记录着该进程已经申请的一段连续内存地址区间。例如进程申请地址区间[a,b)这段内存,它的VMA链表就会增加一项,或者对相邻区间进行扩张,标记上地址区间[a,b)已经申请了,但是真正的映射要到进程访问这段内存时才会进行


所以说进程的虚拟地址空间,只是它可以申请使用的一个范围,只有真正被映射到物理内存,才算是能够合法使用的虚拟内存,而没有被映射到物理内存的部分,不属于合法的线性地址,要使用就必须先映射


既然进程使用的都是线性地址,那么程序执行时CPU拿到的也是这样的线性地址,而线性地址到物理地址的转换,会交由CPU中的内存管理单元(MMU)负责,当前进程持有的页目录的物理地址会被保存到特定寄存器,这样CPU就可以借助页目录和页表,把线性地址转换成物理地址了


此外,由于频繁查页表会影响效率,CPU会把当前进程已经转换过的地址映射关系缓存到TLB(Translation Lookaside Buffer)中,需要转换地址时,先去TLB中查找,没有的话再去查页表,然后写入TLB



如果要切换到另一个进程执行,那么寄存器存储的页目录也会改变,之前的TLB缓存就会失效。需要重新查询页表,建立新的缓存数据,这也是进程切换代价比较高的一个原因。


如果CPU查页表时发现,对应物理内存页还没有完成映射,就会发生Page Fault,处理这个异常的Page Fault Handler,就会去进程控制信息这里查询该进程是否申请了这段内存,如果已经申请了,就实际分配物理页面并完成页表映射。然后就可以正常使用了。若没有申请过,就会发生内存访问异常,这样设计的目的(真正的映射要到进程访问这段内存时才会进行),是为了保障系统运行效率,毕竟内存映射比较耗时。

番外


虚拟地址到物理地址是通过索引查找,相当于220个长度的连续数组才能表示物理地址,如果你分成两段,第一段只需要210,也就是1k连续的地址,当你用高10位在1k里面索引到一个位置,这个位置只是告诉你另外10位表示连续的1k在哪里,你中间10位再到这个1k的范围里面索引,你想象一下一个数组,保存的是指针,这些指针指向的一堆小段地址是不是不用连续就能通过两级索引查到?我们的进程虽然说可以使用的地址空间是4g,但实际上用不了那么多,所以物理页只要一点点,那么我数组里面大部指针都是空的,要多少内存,我就挂多少,当我访问到一个虚拟地址,因为很少访问,比如游戏里的一个小地图,发现指针是空,触发缺页中断,操作系统就搞一块物理地址,挂到你数组里面的指针,此时内存有了,然后再把硬盘上的数据加载上来,然后中断程序告诉你,再看看?你程序重新访问刚才的虚拟地址,有了,所以继续执行。硬盘上的数据加载到哪里,其实已经再程序的二进制里面固定了,也就二进制里的写好的虚拟地址,这涉及到重定位的知识。每个进程都是独立的,都会单独保存一个这种二级索引,也就是这个数组的首地址,叫页目录,task结构体里有一个叫mm的结构体里保存它,当任务切换的时候,就把这个首地址加载到cr3寄存器,该进程所有的虚拟内存到物理内存的映射都依靠它,所以进程空间是独立的。假设1000个进程,都是一级索引,连续内存占用就非常大了,哪怕没有物理地址,数组占用空间就得留那么多,说不定什么时候就要用。最后,软硬件一起实现的,64位更多,可以是5级。

目录
相关文章
|
3月前
|
存储 Linux 调度
深入理解操作系统:从进程管理到内存分配
【8月更文挑战第44天】本文将带你深入操作系统的核心,探索其背后的原理和机制。我们将从进程管理开始,理解如何创建、调度和管理进程。然后,我们将探讨内存分配,了解操作系统如何管理计算机的内存资源。最后,我们将通过一些代码示例,展示这些概念是如何在实际操作系统中实现的。无论你是初学者还是有经验的开发者,这篇文章都将为你提供新的视角和深入的理解。
|
4月前
|
安全 索引
操作系统中的内存管理策略
【8月更文挑战第23天】
111 1
|
24天前
|
C语言 开发者 内存技术
探索操作系统核心:从进程管理到内存分配
本文将深入探讨操作系统的两大核心功能——进程管理和内存分配。通过直观的代码示例,我们将了解如何在操作系统中实现这些基本功能,以及它们如何影响系统性能和稳定性。文章旨在为读者提供一个清晰的操作系统内部工作机制视角,同时强调理解和掌握这些概念对于任何软件开发人员的重要性。
|
23天前
|
Linux 调度 C语言
深入理解操作系统:从进程管理到内存优化
本文旨在为读者提供一次深入浅出的操作系统之旅,从进程管理的基本概念出发,逐步探索到内存管理的高级技巧。我们将通过实际代码示例,揭示操作系统如何高效地调度和优化资源,确保系统稳定运行。无论你是初学者还是有一定基础的开发者,这篇文章都将为你打开一扇了解操作系统深层工作原理的大门。
|
1月前
|
算法 调度 开发者
深入理解操作系统:从进程管理到内存分配
本文旨在为读者提供一个深入浅出的操作系统知识之旅,从进程管理的基础概念出发,探索内存分配的策略与技巧。我们将通过实际代码示例,揭示操作系统背后的逻辑与奥秘,帮助读者构建起对操作系统工作原理的直观理解。文章不仅涵盖理论知识,还提供实践操作的指导,使读者能够将抽象的概念转化为具体的技能。无论你是初学者还是有一定基础的开发者,都能在这篇文章中找到有价值的信息和启发。
|
1月前
|
算法 调度 C++
深入理解操作系统:从进程管理到内存分配
【10月更文挑战第42天】本文将带你进入操作系统的神秘世界,探索其核心概念和关键技术。我们将从进程管理开始,了解操作系统如何协调和管理多个程序的运行;然后,我们将深入研究内存分配,看看操作系统如何有效地分配和管理计算机的内存资源。通过这篇文章,你将获得对操作系统工作原理的深入理解,并学会如何编写高效的代码来利用这些原理。
|
2月前
|
分布式计算 算法 大数据
探索操作系统的核心:调度与内存管理机制
【10月更文挑战第11天】 本文深入探讨了操作系统中两大核心功能——调度与内存管理机制。通过分析调度算法、进程状态转换及内存分配策略等关键方面,揭示了它们如何共同维护系统性能和稳定性。旨在为读者提供对操作系统内部运作的深刻理解,同时引起对优化策略的思考。
83 5
|
2月前
|
算法
深入理解操作系统:内存管理机制的探索之旅
【10月更文挑战第2天】在数字世界的浩瀚海洋中,操作系统犹如一艘精密的航船,承载着软件与硬件的和谐共舞。本文将揭开内存管理的神秘面纱,从基础概念到高级策略,引领读者领略操作系统内存分配的智慧。通过深入浅出的解释和生动的比喻,我们一同遨游在内存的江河之中,感受操作系统如何巧妙地协调资源,确保数据的有序流动。让我们跟随内存的脚步,探索那些隐藏在每次点击、每次命令背后的奥秘。
|
2月前
|
监控 开发者
深入理解操作系统:内存管理的艺术
【10月更文挑战第2天】在数字世界的幕后,操作系统扮演着至关重要的角色。本文将深入探索操作系统的心脏——内存管理,揭示它是如何协调和管理计算机的宝贵资源。通过浅显易懂的语言和生活化的比喻,我们将一起走进内存管理的奥秘世界,了解它的原理、机制以及为何对整个系统的性能和稳定性有着不可替代的影响。无论你是技术新手还是资深开发者,这篇文章都将为你打开新的视角,让你对日常使用的设备有更深层次的认识和尊重。
|
2月前
|
缓存 算法 调度
深入浅出操作系统:从进程管理到内存优化
本文旨在为读者提供一次深入浅出的操作系统之旅。我们将从进程管理的基本概念出发,逐步深入到内存管理的复杂世界,最终探索如何通过实践技巧来优化系统性能。文章将结合理论与实践,通过代码示例,帮助读者更好地理解操作系统的核心机制及其在日常技术工作中的重要性。无论你是初学者还是有一定经验的开发者,这篇文章都将为你打开一扇通往操作系统深层次理解的大门。