【Linux进行时】进程地址空间

简介: 我们在讲C语言的时候,老师给大家画过这样的空间布局图,但是我们对它不了解

进程地址空间

例子引入:

我们在讲C语言的时候,老师给大家画过这样的空间布局图,但是我们对它不了解

#include<stdio.h>
#include<assert.h>
#include<unistd.h>
int g_value=100;
int main()
{
  pid_t id=fork();
  assert(id>=0);
  if(id==0)
  {
   //child
   while(1)
  {
   printf("我是子进程,我的id是:%d,我的父进程是:%d,  g_value:%d,&g_value:%p\n",getpid(),getppid(),g_value,&g_value);
   sleep(1);
  }
  }                                                                                                                             
  else
  {
   //father
   while(1)
   {
   printf("我是父进程,我的id是:%d,我的父进程是:%d,g_value:%d,&g_value:%p\n",getpid(),getppid(),g_value,&g_value);
   sleep(2);
   }          
   }  
  return 0;
}          
• 1
• 2
• 3
• 4
• 5
• 6
• 7
• 8
• 9
• 10
• 11
• 12
• 13
• 14
• 15
• 16
• 17
• 18
• 19
• 20
• 21
• 22
• 23
• 24
• 25
• 26
• 27
• 28
• 29

这里没什么问题,就是他们的g_valule 和其地址都是一样的,

我们将代码调整一下,让子进程的g_value++

#include<stdio.h>
#include<assert.h>
#include<unistd.h>
int g_value=100;
int main()
{
  pid_t id=fork();
  assert(id>=0);
  if(id==0)
  {
   //child
   while(1)
  {
   printf("我是子进程,我的id是:%d,我的父进程是:%d,g_value:%d,&g_value:%p\n",getpid(),getppid(),g_value,&g_value);
   sleep(1);
   g_value++;//只有子进程会进行修改
  }
  }                                                                                                                             
  else
  {
   //father
   while(1)
   {
   printf("我是父进程,我的id是:%d,我的父进程是:%d,g_value:%d,&g_value:%p\n",getpid(),getppid(),g_value,&g_value);
   sleep(2);
   }          
   }  
  return 0;
}                                 
• 1
• 2
• 3
• 4
• 5
• 6
• 7
• 8
• 9
• 10
• 11
• 12
• 13
• 14
• 15
• 16
• 17
• 18
• 19
• 20
• 21
• 22
• 23
• 24
• 25
• 26
• 27
• 28
• 29

我们可以发现子进程的g_value变了,但是父进程没有变,两个的地址还是一样的

❓为什么他们两个地址相同但是读出来的数据不同呢?(下文会解答)

🔥子进程对全局数据修改,并不影响父进程!——进程具有独立性!

❓这个地址会是物理地址?💡不会

显然这个地址绝对不是物理地址!所以我们平常在语言层面用的地址,绝对不是物理地址,所以以前用的指针绝对不是地址,其实这个地址叫做虚拟地址or线性地址

故事引入:

香港某个老板非常滴有钱,有10亿美金,他有 4个私生子,每个私生子都并不知道对方的存在,他们都以为自己是独生子。因为他们彼此不知道对方的存在,所以他们在生活和工作上也没有交集,不会有任何互相的影响(这就是独立性的体现)。财阀老板为了维护自己的独立性:

他就对大儿子说:“儿子,你好好学习,以后老爹钱都是你的。”,大儿子一听卧槽真好,高枕无忧,就好好学习,一想到自己以后有钱,就更想学习了。

然后又对二儿子说:“儿子,好好工作,等以后我就把公司给你。”,二儿子一听热泪盈眶,于是就好好工作,等着将来有一天可以继承公司。

后来又对三儿子说:“儿子,你好好干活,等你长大老爹的家产交给你!”,三儿子知道自己以后会继承老爹的所有财产,开心坏了,就努力的干活。

后来又对四儿子说:“儿子,你好好干活,等你长大老爹的家产交给你!”,四儿子知道自己以后会继承老爹的所有财产,开心坏了,就努力的干活。

只要在财阀爹的可承受范围内,孩子要多少钱他都给多少钱,所以三个儿子自然都认为自己有很多钱。财阀老板给他的三个儿子画了一张虚拟的、不存在的大饼,让他们都能努力学习工作干活(这个步骤就是给他们分别建立了进程地址空间)。

画的饼:进程地址空间,10亿美金:内存,老板:操作系统,四个私生子是进程

❓大富翁,要不要把“饼”管理起来呢?

显然需要的,遵循先描述再组织的原则

所以,进程地址空间,就是就是给进程画的大饼

进程地址空间 → 逻辑上抽象的概念 → 让每个进程都认为自己独占系统的所有资源

**概念:**操作系统通过软件的方式,给进程提供一个软件视角,认为自己是独占系统的所有资源(内存)。

区域和页表:

什么叫做区域?我们来拿一张桌子来理解,初中的时候小花和小胖分过 “38线”

三八线的本质就是区域划分!

🔥地址空间本身就是一个线性区域,地址空间是线性结构的!

struct mm_struct {
    long code_start;
    long code_end;
    long init_start;
    long init_end;
    long uninit_start;
    long uninit_end;
    long heap_start;
    long heap_end;
    long stack_start;
    long stack_end;
    ...
}
• 1
• 2
• 3
• 4
• 5
• 6
• 7
• 8
• 9
• 10
• 11
• 12
• 13
• 14
• 15
• 16
• 17

如果限定了区域,那么区域之间的数据是什么?

是虚拟地址or线性地址

🔥程序加载到内存,由程序变成进程后,由操作系统给每个进程构建的一个页表结构,就是 页表

🔥数据和代码真正只能在内存中!

找到地址不是目的,而是手段

回到之前那个问题:

❓为什么他们两个地址相同但是读出来的数据不同呢?

💡如果子进程对数据进行了修改,因为进程具有独立性,子进程的修改不能影响父进程

子进程这里的 物理地址改了,但是虚拟地址没有改

写时拷贝发生在物理地址,虚拟地址没有变

因为进程具有独立性,比如如果此时子进程把变量改了(写入),就会导致父进程识别的问题就出现了父进程和子进程不一的情况,因为进程是具有独立性的,所以我们就要做到互不影响。我们的子进程要进行修改了,影响到父进程怎么办?没关系!操作系统会出手!当我们识别到子进程要修改时,操作系统会重新给子进程开辟一段空间,并且把 100 拷贝下来,重新给进程建立映射关系,所以子进程的页表就不再指向父进程所对应的 100 了,而直接指向新的 100。你在做修改时又把它的值从 100 改成 200 时,我们就出现了 “改的时候永远改的是页表的右侧,左侧不变” 的情况,所以最后你看到了父子进程的虚拟地址一样,但是经过页表映射到了不同的物理内存,所以了你看到了一个是 100 一个是 200,父子进程的数据不同的结果。

我们的操作系统当我们的父子对数据进行修改时,操作系统会给修改的一方重新开辟一块空间,并且把原始数据拷贝到新空间当中,这种行为就是 写时拷贝!

当父子有任何一个进程尝试修改对应变量时,有一个人想修改,就会触发写时拷贝,让他去拷贝新的物理内存,这只需要重新构建也表的映射关系,虚拟地址是不发生任何变化的,所以最终你看的结果是虚拟地址不变,而内容不同。

这个结构也体现了进程具有独立性

pid_t id=fork()
if(){}
else
{}
• 1
• 2
• 3
• 4

❓fork在返回的时候,父子都有,return两次,id是不是pid_T类型定义的变量呢?

💡是的,返回的本质就是写入!谁先返回,谁就让OS发生写时拷贝

如果是父进程就返回pid,如果是子进程就返回0

为什么进程地址空间要存在?

❓如果没有地址空间,我们OS是如何工作呢?

💡这里就是害怕野指针的情况,要寻找一个地址因为你的代码错误找到了一个越界地址时写入时会使别人的进程错了而且很不安全,因此有了页表和虚拟空间

🔥这两个存在的意义:1.防止地址随意访问,保护物理内存与其他进程

❓常量字符串不能修改,这是为什么呢?💡因为页表访问的时候是有权限的,权限不能修改

char*str=“hello world”;
*str=‘H’;
• 1
• 2

🔥先来将另外一个扩充:malloc的本质——

❓向OS申请内存,操作系统立马给你,还是说在你需要的时候给你?

💡1.在你需要的时候给你,OS一般不允许任何的浪费或者不高效

2.申请内存==立马使用呢?不一定等于立马使用

3.在你申请成功之后,和你使用之前就有一段小小的时间窗口,这个空间没有被正常使用,但是别人用不了—-闲置状态

🔥如果有500进程这样的话,这样操作系统就有大块的空间处于这种状态,这种情况叫做缺页中断

❓因为有页表,你关心不关心你申请的空间是在物理空间的哪一块呢?💡不关心,一样的


相关文章
|
1月前
|
算法 Linux 调度
深入理解Linux操作系统的进程管理
本文旨在探讨Linux操作系统中的进程管理机制,包括进程的创建、执行、调度和终止等环节。通过对Linux内核中相关模块的分析,揭示其高效的进程管理策略,为开发者提供优化程序性能和资源利用率的参考。
70 1
|
7天前
|
消息中间件 Linux
Linux:进程间通信(共享内存详细讲解以及小项目使用和相关指令、消息队列、信号量)
通过上述讲解和代码示例,您可以理解和实现Linux系统中的进程间通信机制,包括共享内存、消息队列和信号量。这些机制在实际开发中非常重要,能够提高系统的并发处理能力和数据通信效率。希望本文能为您的学习和开发提供实用的指导和帮助。
55 20
|
27天前
|
存储 监控 Linux
嵌入式Linux系统编程 — 5.3 times、clock函数获取进程时间
在嵌入式Linux系统编程中,`times`和 `clock`函数是获取进程时间的两个重要工具。`times`函数提供了更详细的进程和子进程时间信息,而 `clock`函数则提供了更简单的处理器时间获取方法。根据具体需求选择合适的函数,可以更有效地进行性能分析和资源管理。通过本文的介绍,希望能帮助您更好地理解和使用这两个函数,提高嵌入式系统编程的效率和效果。
94 13
|
1月前
|
SQL 运维 监控
南大通用GBase 8a MPP Cluster Linux端SQL进程监控工具
南大通用GBase 8a MPP Cluster Linux端SQL进程监控工具
|
1月前
|
运维 监控 Linux
Linux操作系统的守护进程与服务管理深度剖析####
本文作为一篇技术性文章,旨在深入探讨Linux操作系统中守护进程与服务管理的机制、工具及实践策略。不同于传统的摘要概述,本文将以“守护进程的生命周期”为核心线索,串联起Linux服务管理的各个方面,从守护进程的定义与特性出发,逐步深入到Systemd的工作原理、服务单元文件编写、服务状态管理以及故障排查技巧,为读者呈现一幅Linux服务管理的全景图。 ####
|
2月前
|
缓存 算法 Linux
Linux内核的心脏:深入理解进程调度器
本文探讨了Linux操作系统中至关重要的组成部分——进程调度器。通过分析其工作原理、调度算法以及在不同场景下的表现,揭示它是如何高效管理CPU资源,确保系统响应性和公平性的。本文旨在为读者提供一个清晰的视图,了解在多任务环境下,Linux是如何智能地分配处理器时间给各个进程的。
|
2月前
|
存储 运维 监控
深入Linux基础:文件系统与进程管理详解
深入Linux基础:文件系统与进程管理详解
94 8
|
2月前
|
网络协议 Linux 虚拟化
如何在 Linux 系统中查看进程的详细信息?
如何在 Linux 系统中查看进程的详细信息?
223 1
|
2月前
|
Linux
如何在 Linux 系统中查看进程占用的内存?
如何在 Linux 系统中查看进程占用的内存?
|
2月前
|
算法 Linux 定位技术
Linux内核中的进程调度算法解析####
【10月更文挑战第29天】 本文深入剖析了Linux操作系统的心脏——内核中至关重要的组成部分之一,即进程调度机制。不同于传统的摘要概述,我们将通过一段引人入胜的故事线来揭开进程调度算法的神秘面纱,展现其背后的精妙设计与复杂逻辑,让读者仿佛跟随一位虚拟的“进程侦探”,一步步探索Linux如何高效、公平地管理众多进程,确保系统资源的最优分配与利用。 ####
79 4