【Linux】—— 进程地址空间

简介: 【Linux】—— 进程地址空间

序言:

在上篇中,我们讲解了关于进程优先级的概念。本期,我将给大家介绍的是关于进程地址空间的话题。


(一)程序地址空间回顾

我们在学习C/C++语言的时候,大家可能都见过这样的空间布局图:

一个程序有哪些section:

  • 如上图,从低地址到高地址,一个程序由代码段、数据段、 BSS 段组成。

1. 数据段:存放程序中已初始化的全局变量和静态变量的一块内存区域。

2. 代码段:存放程序执行代码的一块内存区域。只读,代码段的头部还会包含一些只读的常数变量。

3. BSS 段:存放程序中未初始化的全局变量和静态变量的一块内存区域。

4. 可执行程序在运行时又会多出两个区域:堆区和栈区。

  • 堆区:动态申请内存用。堆从低地址向高地址增长。
  • 栈区:存储局部变量、函数参数值。栈从高地址向低地址增长。是一块连续的空间。

5. 最后还有一个文件映射区,位于堆和栈之间

  • 堆 heap :由new分配的内存块,其释放由程序员控制(一个new对应一个delete)
  • 栈 stack :是那些编译器在需要时分配,在不需要时自动清除的存储区。存放局部变量、函数参数。
  • 常量存储区 :存放常量,不允许修改。

💨 程序启动的过程:

1. 操作系统首先创建相应的进程并分配私有的进程空间,然后操作系统的加载器负责把可执行文件的 数据段和代码段映射到进程的虚拟内存空间中。

2. 加载器读入可执行程序的导入符号表,根据这些符号表可以查找出该可执行程序的所有依赖的动态 链接库。

3. 加载器针对该程序的每一个动态链接库调用LoadLibrary

  • (1)查找对应的动态库文件,加载器为该动态链接库确定一个合适的基地址。
  • (2)加载器读取该动态链接库的导入符号表和导出符号表,比较应用程序要求的导入符号是否匹 配该库的导出符号。
  • (3)针对该库的导入符号表,查找对应的依赖的动态链接库,如有跳转,则跳到3
  • (4)调用该动态链接库的初始化函数

4. 初始化应用程序的全局变量,对于全局对象自动调用构造函数。

5. 进入应用程序入口点函数开始执行。

以上便是关于程序地址空间的基本介绍。但是此时有个问题:

  • 那就是对于上述那张内存布局图,大家认为它是“内存”吗?

带着上述问题,我将带着大家进入本期的学习。


(二)代码演示

具体代码如下:

#include <stdio.h>
#include <assert.h>
#include <unistd.h>
int g_value = 100; //全局变量
int main()
{
    pid_t id = fork();
    assert(id >= 0);
    if(id == 0)
    {
        //child
        while(1)
        {
      printf("我是子进程, 我的id是: %d, 我的父进程是: %d, g_value: %d, &g_value : %p\n",\
                   getpid(), getppid(), g_value, &g_value);
            sleep(1);
           
        }
    }
    else
    {
        //father
        while(1)
        {
        printf("我是父进程, 我的id是: %d, 我的父进程是: %d, g_value: %d, &g_value : %p\n",\
                    getpid(), getppid(), g_value, &g_value);
            sleep(1);
        }
    }
}

输出演示

【分析】

我们发现,输出出来的变量值和地址是一模一样的,很好理解呀,因为子进程按照父进程为模版,父子并没有对变量进行进行任何修改。


紧接着将代码稍加改动:

输出演示

【分析】

我们发现,父子进程,输出地址是一致的,但是变量内容不一样!即子进程修改全局数据,并不影响父进程。(这是因为进程具有独立性,变量内容不一样,所以父子进程输出的变量绝对不是同一个变量)

但是我们可以发现此时父子进程地址都是一样的。(说明:该地址绝对不是物理地址!在Linux地址下,这种地址叫做 虚拟地址);

我们在用C/C++语言所看到的地址,全部都是虚拟地址!物理地址,用户一概看不到,由OS统一管理


(三)进程地址空间的引入

接下来,我用一个例子帮助大家理解其中的概念。从而引入相应的进程地址空间。

背景

  • 假设现在有一个升价10亿美元的大富翁,而他呢因为很有钱而且生性荡漾因此有很多的私生子在外面;
  • 而四个私生子之间彼此并不知道对方的存在,他们都认为自己是大富翁的犊子;

 

【故事】

1、故事开始是这样的。有一天大富翁分别对这四个孩子说:孩子呀!你好好混在外面,等我老去的那一天我的财产都是你的。此时,在现在的我们理解来就是在四个孩子的脑海中 “画了一张饼” ;

2、这时,这四个孩子分别由于不同的原因而去求助大富翁的资金帮助。其中A,B,C这三个孩子因为都是奋发图强的好孩子,因此大富翁就都给他们了,但是D这个孩子一天不务正业,对大富翁说 :“爸,我在社会上遇到点事,先给我5亿吧”。结果很明显,大富翁说:“你老子我再有钱也不是让你这么画的呀,一边去”。

注意:此时,四个孩子脑海中依旧有着大富翁对他们承诺。而我们把就把大富翁给四个孩子画的这张饼称作 “进程地址空间”。而我们弹的ABCD这四个孩子,我们则称作 “进程”。

3、此时假设大富翁其实不止有四个私生子,当等到他们相认的时候大富翁都对这些孩子 承诺了一件事。此时问题来了,由于数量太多,我们要不要把“画的饼” 管理起来呢?

4、答案很容易理解当然是要的,因此类比到此饼的实质就是——》进程地址空间——》本质就是一个内核数据结构(struct mm_struct{}

 

 

而对于(struct mm_struct{}),它里面大概以下这些内容:

而假设如果我们限定区域,例如【1000,2000】,那么这些区域之间的数据则叫做虚拟地址或者线性地址

因此,现在我们很好的理解之前我们说的:对于堆取或者栈区的扩大,就相当于修改上图中的【start,end】。

所以之前说‘程序的地址空间’是不准确的,准确的应该说成 进程地址空间 ,那该如何理解呢?

  • 看图:

 

根据上图,我们就可以理解开始时的代码为什么父子进程地址都是一样的。

  • 假设此时子进程要对进行修改,而父进程在读取时依旧是映射到刚才那个地址空间处吗?其实并不是这样,因为进程具有独立性,所以子进程对数据进行修改不会影响父进程,所以是通过虚拟地址经过页表找到它的物理内存,当他想修改时操作系统会告诉它“对不起,你不能对其进行修改” ,因此会在内存里面重新申请一块空间,把你要修改的数据赋值到新的地址空间之后在进行相应的操作。所以最终会看到父子进程的地址空间不一样。

 


总结

以上便是关于进程地址空间的相关理解了、感谢大家的观看与支持!!!

相关文章
|
并行计算 Linux
Linux内核中的线程和进程实现详解
了解进程和线程如何工作,可以帮助我们更好地编写程序,充分利用多核CPU,实现并行计算,提高系统的响应速度和计算效能。记住,适当平衡进程和线程的使用,既要拥有独立空间的'兄弟',也需要在'家庭'中分享和并行的成员。对于这个世界,现在,你应该有一个全新的认识。
428 67
|
12月前
|
Web App开发 Linux 程序员
获取和理解Linux进程以及其PID的基础知识。
总的来说,理解Linux进程及其PID需要我们明白,进程就如同汽车,负责执行任务,而PID则是独特的车牌号,为我们提供了管理的便利。知道这个,我们就可以更好地理解和操作Linux系统,甚至通过对进程的有效管理,让系统运行得更加顺畅。
347 16
|
Unix Linux
对于Linux的进程概念以及进程状态的理解和解析
现在,我们已经了解了Linux进程的基础知识和进程状态的理解了。这就像我们理解了城市中行人的行走和行为模式!希望这个形象的例子能帮助我们更好地理解这个重要的概念,并在实际应用中发挥作用。
240 20
|
JavaScript Linux Python
在Linux服务器中遇到的立即重启后的绑定错误:地址已被使用问题解决
总的来说,解决"地址已被使用"的问题需要理解Linux的网络资源管理机制,选择合适的套接字选项,以及合适的时间点进行服务重启。以上就是对“立即重启后的绑定错误:地址已被使用问题”的全面解答。希望可以帮你解决问题。
624 20
|
11月前
|
监控 Shell Linux
Linux进程控制(详细讲解)
进程等待是系统通过调用特定的接口(如waitwaitpid)来实现的。来进行对子进程状态检测与回收的功能。
257 0
|
11月前
|
存储 负载均衡 算法
Linux2.6内核进程调度队列
本篇文章是Linux进程系列中的最后一篇文章,本来是想放在上一篇文章的结尾的,但是想了想还是单独写一篇文章吧,虽然说这部分内容是比较难的,所有一般来说是简单的提及带过的,但是为了让大家对进程有更深的理解与认识,还是看了一些别人的文章,然后学习了学习,然后对此做了总结,尽可能详细的介绍明白。最后推荐一篇文章Linux的进程优先级 NI 和 PR - 简书。
327 0
|
11月前
|
存储 Linux Shell
Linux进程概念-详细版(二)
在Linux进程概念-详细版(一)中我们解释了什么是进程,以及进程的各种状态,已经对进程有了一定的认识,那么这篇文章将会继续补全上篇文章剩余没有说到的,进程优先级,环境变量,程序地址空间,进程地址空间,以及调度队列。
205 0
|
11月前
|
Linux 调度 C语言
Linux进程概念-详细版(一)
子进程与父进程代码共享,其子进程直接用父进程的代码,其自己本身无代码,所以子进程无法改动代码,平时所说的修改是修改的数据。为什么要创建子进程:为了让其父子进程执行不同的代码块。子进程的数据相对于父进程是会进行写时拷贝(COW)。
265 0
|
存储 Linux 调度
【Linux】进程概念和进程状态
本文详细介绍了Linux系统中进程的核心概念与管理机制。从进程的定义出发,阐述了其作为操作系统资源管理的基本单位的重要性,并深入解析了task_struct结构体的内容及其在进程管理中的作用。同时,文章讲解了进程的基本操作(如获取PID、查看进程信息等)、父进程与子进程的关系(重点分析fork函数)、以及进程的三种主要状态(运行、阻塞、挂起)。此外,还探讨了Linux特有的进程状态表示和孤儿进程的处理方式。通过学习这些内容,读者可以更好地理解Linux进程的运行原理并优化系统性能。
495 4
|
Linux Shell
Linux 进程前台后台切换与作业控制
进程前台/后台切换及作业控制简介: 在 Shell 中,启动的程序默认为前台进程,会占用终端直到执行完毕。例如,执行 `./shella.sh` 时,终端会被占用。为避免不便,可将命令放到后台运行,如 `./shella.sh &`,此时终端命令行立即返回,可继续输入其他命令。 常用作业控制命令: - `fg %1`:将后台作业切换到前台。 - `Ctrl + Z`:暂停前台作业并放到后台。 - `bg %1`:让暂停的后台作业继续执行。 - `kill %1`:终止后台作业。 优先级调整:
1409 5