【Linux】进程地址空间

简介: 【Linux】进程地址空间

1. 显示相同地址,却是不同的值

下面在Linux上验证

创建test.c文件

st.c  ⮀                                                                                                                                                                ⮂⮂ buffers 
    1 #include<stdio.h>
    2 #include<unistd.h>
    3 #include<assert.h>
    4 int value=100;//全局变量
    5 int main()
    6 {
    7   pid_t id=fork();
    8   assert(id>=0);
    9   if(id==0)
   10   {
   11     //child
   12     while(1)
   13     {
   14     printf("我是子进程,我的pid是:%d,我的ppid是%d,value是:%d,&value是:%d\n",getpid(),getppid(),value,&value);
   15     sleep(1);
   16     value++;//只有子进程会进行修改
   17     }
   18     
   19   }
   20   else 
   21   {
   22     //father
   23     while(1)
   24     {
   25     printf("我是父进程,我的pid是:%d,我的ppid是%d,value是:%d,&value是:%d\n",getpid(),getppid(),value,&value);
   26     sleep(2);
   27     }                                                                                                                                                                               
   28   }  
   29   return 0;
   30 }            

设置一个全局变量value ,只在子进程中进行修改


使用 make , . /mytest ,执行mtest可执行程序


子进程被全局数据的修改,被不影响父进程 ,说明进程具有独立性,而进程是由内核数据结构+代码和数据组成的,独立性体现在数据上,所以通过写时拷贝的做法

使一个进程的变量被修改,不影响另一个进程的变量

value通过写时拷贝变成两个变量,打印不同变量的地址时,应该是两个变量的地址,那为什么显示是相同的呢?

假设是物理地址,不可能同一个变量的地址,而读取到不同的值

我们在语言层面用的地址,不是物理地址,而是虚拟地址或者线性地址、

2 . 引入地址空间

假设有一个富翁,私生子比较多,但是彼此不知道各自的存在

大富翁给A花了大饼,说等他死后,10亿家产都是A的,同样的大饼大富翁也给B、C、D画上了,A 、B、C、D四个人都认为大富翁死后自己继承10亿家产

A找到大富翁,想要5万块买个表,大富翁答应了

D打电话给大富翁说想要5亿美金,摆平社会上的事,大富翁拒绝了

无论是A要到了,还是D没要到,每一个人依旧认为未来自己一定会具有10亿美金

大富翁给每一个人画的饼叫做 进程地址空间

A B C D称之为 进程,大富翁 称之为操作系统,10亿美金称之为 内存

大富翁需要将饼管理起来,管理的本质是 先描述,再组织

饼本质就是一个内核数据结构 mm_struct

3.代码区、数据区、堆区如何理解?

上小学的时候,小花和小胖是同桌,小胖特别调皮天天欺负小花,桌子共100cm,小花在桌子上画了一条线,

1-50是小花的地方,51-100是小胖的地方


小花画线的本质是 区域划分

把桌子看作一个线性结构,对线性区域进行指定start和end即可完成区域划分

从而说明进程地址空间就是一个线性区域

地址空间上的虚拟地址,一个地址表示一个字节,即虚拟地址地址空间的宽度代表为字节

cpu与内存链接的线称之为系统总线

cpu与内存在32位计算机下为32根,常识来讲计算机只认识二进制,所以线上的光电信号也只能是 0与1,32根线每一根线只能由0或者1两种状态,共有2^ 32 可能性,从总线中最多出来2^32个地址

地址空间存在自己的编制,地址是连续的

把地址空间的整个范围称之为线性空间

该空间中每一个地址表示对应的数字所对应的地址最小是1字节


定义一个整数相当于在内存中开辟4个字节,连续4个字节对应的起始地址对应整形变量的起始地址

一个整数4个字节,而每个字节都有自己的地址,所以一个整数要有四个地址,而正常来说会取首地址作为整数的地址

地址空间是一段线性范围,从全0到全FFFF(16进制),因为数字是线性的,每一个数字表示一个地址,每个地址对应一个字节

地址空间是线性结构的

4.确定地址空间

32位下地址空间默认为0-42亿多

假设空间范围为4GB

设置进程地址空间的结构

struct mm_struct

{

int code_start;

long code_end;

long init_start;

long init_end;

}

用于表示4GB的空间范围内代码区、全局区等


如果限定了区域,那么区域之间的数据是什么?


假设区域为 [1000, 2000] ,表示为地址空间所匹配的1000号地址和2000号地址

就叫做虚拟地址/线性地址

小胖总是越界,小花就把线向小胖那边移了30cm

小花的行为就叫做 扩大区域,对于小胖来讲就叫做缩小区域

修改开头和结尾就是区域的扩大和缩小的调整

5. 对第一个问题的解答

直接用的是虚拟地址,找到地址不是目的,而是该地址所对应的内容

页表:将虚拟地址转化成物理地址,左侧填充虚拟地址,右侧填充物理地址

当有一个虚拟地址,通过特定的地址空间想访问特定的区域时,CPU会自动根据页表将虚拟地址转化为物理地址

创建子进程,就要创建子进程的PCB,及地址空间和页表结构 子进程的相关内核数据结构的属性字段会继承父进程

大富翁 A有个儿子是E,A跟E说,我们家有10个亿是你爷爷的,所以E要继承给他10亿的大饼 所以子进程在虚拟地址处也有对应的地址


正常来说,子进程要对value对修改,把value变成200,父进程通过映射关系找到value,读到200

但因为进程具有独立性,子进程对数据的修改,不影响父进程

子进程要对value修改时,在内存中重新申请一块空间,拷贝value值给新空间,重新映射指向新开辟的空间,导致不影响父进程的value值

,最终将新开辟的空间value值改成200


因为拷贝了物理地址空间,所以在页表的value不影响虚拟地址,但两者却在不同的物理地址处,访问的数据就不一样

6. 扩展1:为什么地址空间要存在?

如果没有地址空间,操作系统如何工作 ?

磁盘中存在很多可执行程序

进程被加载到物理内存中,其中包括了PCB、代码和数据

CPU读取进程的代码和数据按顺序去执行

操作系统加载第二个进程时,在物理内存中申请没有被用到的空间,把PCB、代码和数据放入空间中


如果不需要虚拟地址,CPU直接识别PCB,根据PCB找到所对应的代码去执行

假设一个进程的代码中有一个寻址操作,放到CPU中,CPU内部进行寻址,读取某个变量,但是在读取的过程中代码有问题,给CPU的地址也是有问题,如:越界,访问到另一个进程的数据,若再写入数据,则破坏了另一个进程的数据

一个进程因为野指针问题访问到另一个进程的上下文,导致另一个进程出现故障,进程与进程之间的独立性无法保证

7. 扩展2 malloc的本质

操作系统一般不答应任何的浪费或者不高效

向操作系统申请内存,不一定立马使用

在你申请成功之后,和使用之前,就以一段小小的时间窗口——没有被正常使用,但是别人用不了——闲置状态

当malloc申请空间时,在地址空间中申请空间,在页表处只填写虚拟地址,物理地址处不填写,就不需要在物理地址处申请空间,过一会,进程尝试对空间写入,在重新申请空间把映射关系创建好,整体机制被叫做 缺页中断


8. 拓展3:重新理解地址空间

程序在被编译的时候,没有被加载到内存,程序内部有地址

源代码被编译的时候,就是按照虚拟地址空间的方式进行对代码和数据就已经编号了对应的编制

虚拟地址不只会影响操作系统,还要让编译器遵守规则


可执行程序,有一个地址0x11,同时call 函数调用这个地址,

将程序加载到内存时,两者都有自己的物理地址,通过页表的虚拟地址找到函数调用,将函数调用拿到CPU中,通过 call 0x11 调用的虚拟地址,再通过页表找到 0x11

CPU读到的数据中涵盖地址,这个地址是虚拟地址

9. 进程地址空间+页表的意义:

1.防止地址随意访问,保护物理内存与其他进程

若没有地址空间的存在,则直接使用cPU调用物理地址,会有野指针的问题存在

2.将进程管理和内存管理进行解耦合

因为有虚拟地址和页表的存在,所以不关心进程对应的物理地址所处位置


相关文章
|
6月前
|
并行计算 Linux
Linux内核中的线程和进程实现详解
了解进程和线程如何工作,可以帮助我们更好地编写程序,充分利用多核CPU,实现并行计算,提高系统的响应速度和计算效能。记住,适当平衡进程和线程的使用,既要拥有独立空间的'兄弟',也需要在'家庭'中分享和并行的成员。对于这个世界,现在,你应该有一个全新的认识。
250 67
|
5月前
|
Web App开发 Linux 程序员
获取和理解Linux进程以及其PID的基础知识。
总的来说,理解Linux进程及其PID需要我们明白,进程就如同汽车,负责执行任务,而PID则是独特的车牌号,为我们提供了管理的便利。知道这个,我们就可以更好地理解和操作Linux系统,甚至通过对进程的有效管理,让系统运行得更加顺畅。
138 16
|
5月前
|
Unix Linux
对于Linux的进程概念以及进程状态的理解和解析
现在,我们已经了解了Linux进程的基础知识和进程状态的理解了。这就像我们理解了城市中行人的行走和行为模式!希望这个形象的例子能帮助我们更好地理解这个重要的概念,并在实际应用中发挥作用。
108 20
|
4月前
|
监控 Shell Linux
Linux进程控制(详细讲解)
进程等待是系统通过调用特定的接口(如waitwaitpid)来实现的。来进行对子进程状态检测与回收的功能。
86 0
|
4月前
|
存储 负载均衡 算法
Linux2.6内核进程调度队列
本篇文章是Linux进程系列中的最后一篇文章,本来是想放在上一篇文章的结尾的,但是想了想还是单独写一篇文章吧,虽然说这部分内容是比较难的,所有一般来说是简单的提及带过的,但是为了让大家对进程有更深的理解与认识,还是看了一些别人的文章,然后学习了学习,然后对此做了总结,尽可能详细的介绍明白。最后推荐一篇文章Linux的进程优先级 NI 和 PR - 简书。
118 0
|
4月前
|
存储 Linux Shell
Linux进程概念-详细版(二)
在Linux进程概念-详细版(一)中我们解释了什么是进程,以及进程的各种状态,已经对进程有了一定的认识,那么这篇文章将会继续补全上篇文章剩余没有说到的,进程优先级,环境变量,程序地址空间,进程地址空间,以及调度队列。
84 0
|
4月前
|
Linux 调度 C语言
Linux进程概念-详细版(一)
子进程与父进程代码共享,其子进程直接用父进程的代码,其自己本身无代码,所以子进程无法改动代码,平时所说的修改是修改的数据。为什么要创建子进程:为了让其父子进程执行不同的代码块。子进程的数据相对于父进程是会进行写时拷贝(COW)。
82 0
|
6月前
|
JavaScript Linux Python
在Linux服务器中遇到的立即重启后的绑定错误:地址已被使用问题解决
总的来说,解决"地址已被使用"的问题需要理解Linux的网络资源管理机制,选择合适的套接字选项,以及合适的时间点进行服务重启。以上就是对“立即重启后的绑定错误:地址已被使用问题”的全面解答。希望可以帮你解决问题。
335 20
|
7月前
|
存储 Linux 调度
【Linux】进程概念和进程状态
本文详细介绍了Linux系统中进程的核心概念与管理机制。从进程的定义出发,阐述了其作为操作系统资源管理的基本单位的重要性,并深入解析了task_struct结构体的内容及其在进程管理中的作用。同时,文章讲解了进程的基本操作(如获取PID、查看进程信息等)、父进程与子进程的关系(重点分析fork函数)、以及进程的三种主要状态(运行、阻塞、挂起)。此外,还探讨了Linux特有的进程状态表示和孤儿进程的处理方式。通过学习这些内容,读者可以更好地理解Linux进程的运行原理并优化系统性能。
241 4
|
7月前
|
Linux Shell
Linux 进程前台后台切换与作业控制
进程前台/后台切换及作业控制简介: 在 Shell 中,启动的程序默认为前台进程,会占用终端直到执行完毕。例如,执行 `./shella.sh` 时,终端会被占用。为避免不便,可将命令放到后台运行,如 `./shella.sh &`,此时终端命令行立即返回,可继续输入其他命令。 常用作业控制命令: - `fg %1`:将后台作业切换到前台。 - `Ctrl + Z`:暂停前台作业并放到后台。 - `bg %1`:让暂停的后台作业继续执行。 - `kill %1`:终止后台作业。 优先级调整:
352 5