内存
每一个要运行的程序,必须先进入内存然而,每一台计算机的内存容 量都是有限而宝贵的。存储管理的任务是方便用户使用存储资源,在有限的物理空间内使更多的用户进程高效地获得和使用尽可能多的存储空间,从而提高系统 的整体性能。现代操作系统中普遍采用基于虚拟存储器的概念来统一管理内存和外存,实现逻辑上的大容量存储空间。
本节首先介绍虚拟存储器的基本概念及使用虚拟存储器的依据和出发点——局部性原理,即在程序的运行过程中,总是集中地访问某一个程序段。
根据 这样的原理,可以把物理内存按照一定的规则划分为小部分,每次只装入某个进 程必要的一部分内容就开始运行,在运行过程中,再根据需要装入新的内容。 不同的划分规则形成不同的存储管理技术,我们简单介绍分区、页式、段 式和段页式管理的基本思想。接着介绍Intel 80386硬件存储管理机制,最后学 习Linux系统在这种硬件平台的基本存储管理机制。
1虚拟储存区
计算机系统的存储器分为内存(主存)和外存(硬盘)。内存的价格昂贵,速度高,存储容量有限;外存价格便宜,速度慢,存储容量很大,适合于存放大量数据。为了使更多的用户进程合理、充分地使用存储资源,操作系统统一管理内存和外存,即把内存中暂时不用的内容放在硬盘上,内存中就可以腾出一部分空间,可以从硬盘装入其他迫切需要的内容。因此,从效果上看,计算机系统好像为用户提供了一个其存储容量比实际主存大得多的存储器。人们称这个存储器为虚拟存储器.
定义:一种将主存用作辅助存储器高速缓存的技术
2局部性原理
实验证明,在几乎所有进程的执行过程中,某一个特定的时间段 中,CPU不是随机地访问整个程序或数据,而是集中地访问程序或数据的某一个部分。进程的这种访问特性称为局部性原理
与CPU访问该局部内的数据和代码的次数相比,局部段的变化很缓 慢,正是基于这样的原理,我们才有可能实现虚拟存储管理。把进程的 所有内容划分为一个个小的部分,首先只把系统所必需的部分数据装入 内存,其余部分就放在外存中,开始运行之后,再把所需要的其他部分 换入内存,同时把不再需要的部分从内存中换到硬盘或者清除掉。当然,与之相配合,实际的内存也要划分为对应的小部分。
3 虚拟地址 和 虚拟地址空间
每一个进程都具有各自独立的虚拟地址空间,而整个系统只有一个物理地址空间。
任何一个要执行的进程,都必须进入真正的内存中,在内存 的物理空间中存在,这就需要在虚拟地址空间和物理地址空间之间建立 适当的映射关系。
通过这种映射关系,逐部分地把存在于虚拟地址空间 中的进程要执行的 。
物理地址(physical address):主存储器的地址。
缺页(page fault):访问的 而不在主存储器中。
虚拟地址(virtual address):虚拟空间的地址,当需要 访问主存时需要通过地址 。
地址转换(address translation):也称为地址映 射,在访问内存时将虚拟地址映射为物理地址的整个过程 。
页表(page table):保存虚拟地址和物理地址之间转换关系的表,页表保存在主存 中, 通常使用虚页号来索引,如果这个虚页当前在主存中, 页表中对应项 将包含虚夜对应的物理页号。
4内存管理方式
虚拟存储的每一个要运行的程序,都必须首先进入内存,但是,每一台计算机的内存容量都是有限而宝贵的。管理技术,通常是基于局部性原理的,即把整个进程的虚拟地址空间划分为小的部分,同时把内存也划分为小的部分,在虚拟地址空间和物理地址空间之间建立特定的映射关系,进程的内容分批分期进入内存中特定的位置,其余部分在外存中,在需要的时候再传递到内存,用内存和外存的统一管理来实现内存扩充。在虚拟存储技术的发展过程中,使用了不同的地址空间划分方法和映射关系,这些不同的划分和映射对应于不同的存储管理方式.
5 页(了解)
把进程的虚拟地址空间划分为相等大小的部分,每个部分称为页(page),同时把物理内存空间也按照页的大小划分为小的部分,称为页面(page frame,也称为页架或页框)。对于80386体系,页和页面的大小都为4K字节。
页式管理: 页表(左)及相应的页、页面对应关系(右)示意图
内存中同时存在多个进程,每个进程的地址都是以0地址作为起始 地址的虚拟地址空间,这个虚地址空间可以是线性的(一维的),也可 以是多维的,这要取决于系统采用的存储管理方式。进程中的每一个指 令和数据在这样的虚地址空间中都有一个惟一确定的地址,即虚拟地 址。
6 段页※(掌握)
段页式存储管理,综合利用段式和页式管理的思想,把整个二维虚拟空 间先分段,然后在段内分页。以页为最小的存储管理单位来实现虚拟存储。
一方面可以按照程序的逻辑关系来划分进程空间的段,另一方面使 用页来存放每一个段的内容,内外存交换以统一格式和大小的页来进 行。
这种管理模式下,虚拟地址要包括三个部分:段号、页号和页内偏移地址,地址变换也要经过两层次映射才能够实现,首先从二维虚拟空 间映射到一个线性虚拟空间,然后再从线性空间映射到物理空间。
可以想象,整个变换过程更为复杂,需要大量的硬件支持和系统开销。
定义
代码段: 代码段是用来存放可执行文件的操作指令, 也就是说它可以是可 执行程序在内存中的镜像. 代码段需要防止正在运行时被非法修改, 所以 只准许读取操作, 不允许写入操作
数据段: 数据段用来存放可执行文件中已初始化全局变量, 也就是存放程序静态分配的变量和全局变量
BBS段: BBS段包含程序未初始化的全局变量, 在内存中, BBS段全部置零
堆(heap): 堆是用于存放进程运行中被动态分配的内存段,它的大小并不固定,可以动态扩张或缩减,当进程调用malloc等函数分配内存,新分配的内存就被动态添加到堆中;利用free等函数释放内存。
栈: 栈是.用户存放程序临时创建的局部变量, 也就是{}中定义的变 量(不包括static声明的)
段页纠错小案例
代码:说明各个变量存储的地方
#include<stdio.h> bool istrue; int our=555; int main() { char c[]=malloc(10); static int a=100; char buf[]="Hello world!"; int i=0; char *str="Hello world!"; return 0; }
答案
注意问题:
1.buf str都在栈中存储,但是buf存储的内容在数据段,str存储的内容在代码段(一般来说但凡可以通过下标修改的都在数据段,不可以修改的都在代码段,对象和对象的数据不是一个在一个地方存储)