【Linux】进程地址空间

简介: 【Linux】进程地址空间

👉进程地址空间👈


相信大家在学习 C/C++ 的时候,肯定是见过类似下面的内存地址空间的图片。那它真的是内存吗?其实它并不是真正的内存,那它究竟是什么呢?我们先看来一下下面的代码,再一起探究它究竟是什么。

f9264c6f67a84490b023d2ccff76d839.png

#include <stdio.h>
#include <unistd.h>
int global_val = 100;
int main()
{
    pid_t id = fork();
    if(id < 0)
    {
        perror("fork");
        return 1;
    }
    else if(id == 0)
    {
        int count = 0;
        while(1)
        {
            printf("我是子进程, pid:%d, ppid:%d | global_val:%d, &global_val:%p\n", getpid(), getppid(), global_val, &global_val);
            sleep(1);
            ++count;
            if(count == 5)
            {
                global_val = 200;
                printf("子进程已经修改全局变量啦...........\n");
            }
        }
    }
    else
    {
        while(1)
        {
            printf("我是父进程, pid:%d, ppid:%d | global_val:%d, &global_val:%p\n", getpid(), getppid(), global_val, &global_val);
            sleep(1);
        } 
    }
    return 0;
}


cd4b4f76d559494e854390afb0dc0e78.png

a2eeb8743db14603bab328e918a3b078.png

通过上图,我们可以看到:多进程在读取同一个地址的时候,却读取出来了两个值。这是为什么呢?了解这个之前,我们需要知道:使用 fork 函数创建子进程后,子进程也会有自己的内核数据结构,其内核数据结构是拷贝父进程的内核数据结构的。由于进程的独立性,子进程修改global_val的值,并不会影响父进程global_val的值,这个是比较好理解的。但是为什么父子进程的global_val的地址却相同呢?其实这也就说明了这个地址并不是物理地址。因为物理地址的值只能有一个,不可能有两个。


所以,C/C++ 中的地址(指针)不是物理地址。那不是物理地址,是什么地址呢?其实这个地址是虚拟地址(线性地址)。所以,最开始提到的 C/C++ 地址空间是虚拟地址空间。那么想要解释上面的现象,我们就必须了解虚拟地址空间了。


那么,我给大家讲个故事来感性地理解一下虚拟地址空间。美国有个大富翁,他有十亿美金和三个私生子,私生子不知道彼此的存在。大富翁对每个私生子都说过:儿子啊,我有十亿美金的存款。你好好打理生意,等我驾鹤西去了,这些存款都是归你的。那么,他的私生子呢就找他们的老爸要钱打理生意为了得到十亿美金存款。其实这个故事里的大富翁就对应着操作系统,十亿美元对应着内存,私生子就对应的进程,私生子要的各种资源就对应着程序申请的对象空间,而大富翁给私生子画的大饼就对应着进程地址空间。也就是说,操作系统给每个进程都画了个大饼进程地址空间,让进程会认为自己是进程地址空间的,事实上并不是。


我们现在知道了,操作系统给进程画了个大饼进程地址空间。那操作系统是如何画饼的呢?对一个人画饼,首先那个人要记性好。画饼的本质是在人的大脑里构建一个蓝图,可以用一个结构体来表示。


c37259816ac14dcdba04ab9471f53834.png


进程需要被管理,操作系统给进程画的大饼进程地址空间也要被管理。那么管理的方式就是先描述,再组织。进程地址空间的本质也是内核的一种数据结构struct mm_struct。


结构体struct mm_struct中包含了代码区、数据区、栈区和堆区的起始地址和结束地址,起始地址和结束地址之间的空间就是各自的虚拟地址。当一个进程创建时,操作系统会给进程申请结构体struct mm_struct 并将每个区域划分好,并且进程的进程控制块里有指针struct mm_struct* mm指向申请的结构体。

6ad168272f2d4394bb324d6dcc7ebc6c.png

关于栈区和堆区需要注意的是,栈区和堆区的区域大小是可以调整的,其调整的本质是修改栈区和堆区的起始地址和结束地址。定义局部变量、new 和 malloc 就是扩大栈区或者堆区,函数调用完毕和 free 就是缩小栈区和堆区。


190db6b27d6143269571bab8269b4d6c.png


程序想要运行起来,必须先加载到内存。那么,程序的代码和数据就会在内存中占用一个的空间,这些空间也是有地址的。我们也知道,程序运行起来会有对应的进程控制struct task_struct,进程控制块内有struct mm_struct指针指向对应的进程地址空间。而进程地址空间通过页表映射就可以找到对应的物理地址。


d7ff8b9eea8a492f86aed232674f968e.png


注:真正的页表是多级页表,是一个树状结构。以上的示意图并不是页表真正的样子。

每个进程都会有各自的进程控制块task_struct


进程地址空间mm_struct和页表。

1e2a67e32a35418a9ebf6a54ee3285e6.png


那为什么要存在进程地址空间呢?不能让进程直接访问物理内存呢?第一,是为了安全保护内存,防止进程越界非法修改数据(页表是可以拦截进程的非法读取和非法写入的)。第二,进程地址空间的存在,可以更方便地进行进程和进程的代码数据的解耦,保证了进程的独立性!第三,让进程以统一的视角来看待进程对应的代码和数据等各个区域,方便使用,编译器也以统一的视角来进行编译代码,规则是一样的,编译即可直接使用。


下图可以解答最开始的问题!!!


4efc7dca1638412186353f900565ed31.png

8101b3c377d64fe3afa9168b450caf9b.png

再谈进程地址空间


可执行程序在没有被加载到内存的时候,可执行程序内部早就有地址了,该地址是逻辑地址。编译器也要遵守虚拟地址空间,编译器编译代码的时候,就是按照虚拟地址空间进行对代码和数据进行编址的!上面说到的地址是程序内部使用的地址,当程序被加载到物理内存中的时候,该程序对应的指令和数据就都具有了物理地址。CPU 读取的都是指令,指令内部是有地址的(虚拟地址),通过页表映射找到物理地址执行相应指令。


  • 可执行程序内部有互相跳转的地址,即虚拟地址
  • 程序被加载到内存中,有标识物理内存中代码和数据的地址
  • CPU 见不到物理内存的地址,见到的只是虚拟地址

👉总结👈


本篇博客主要讲解了什么是进程地址空间、为什么要有进程地址空间等等。那么以上就是本篇博客的全部内容了,如果大家觉得有收获的话,可以点个三连支持一下!谢谢大家!💖💝❣️

相关文章
|
5月前
|
并行计算 Linux
Linux内核中的线程和进程实现详解
了解进程和线程如何工作,可以帮助我们更好地编写程序,充分利用多核CPU,实现并行计算,提高系统的响应速度和计算效能。记住,适当平衡进程和线程的使用,既要拥有独立空间的'兄弟',也需要在'家庭'中分享和并行的成员。对于这个世界,现在,你应该有一个全新的认识。
243 67
|
4月前
|
Web App开发 Linux 程序员
获取和理解Linux进程以及其PID的基础知识。
总的来说,理解Linux进程及其PID需要我们明白,进程就如同汽车,负责执行任务,而PID则是独特的车牌号,为我们提供了管理的便利。知道这个,我们就可以更好地理解和操作Linux系统,甚至通过对进程的有效管理,让系统运行得更加顺畅。
129 16
|
4月前
|
Unix Linux
对于Linux的进程概念以及进程状态的理解和解析
现在,我们已经了解了Linux进程的基础知识和进程状态的理解了。这就像我们理解了城市中行人的行走和行为模式!希望这个形象的例子能帮助我们更好地理解这个重要的概念,并在实际应用中发挥作用。
103 20
|
3月前
|
监控 Shell Linux
Linux进程控制(详细讲解)
进程等待是系统通过调用特定的接口(如waitwaitpid)来实现的。来进行对子进程状态检测与回收的功能。
78 0
|
3月前
|
存储 负载均衡 算法
Linux2.6内核进程调度队列
本篇文章是Linux进程系列中的最后一篇文章,本来是想放在上一篇文章的结尾的,但是想了想还是单独写一篇文章吧,虽然说这部分内容是比较难的,所有一般来说是简单的提及带过的,但是为了让大家对进程有更深的理解与认识,还是看了一些别人的文章,然后学习了学习,然后对此做了总结,尽可能详细的介绍明白。最后推荐一篇文章Linux的进程优先级 NI 和 PR - 简书。
111 0
|
3月前
|
存储 Linux Shell
Linux进程概念-详细版(二)
在Linux进程概念-详细版(一)中我们解释了什么是进程,以及进程的各种状态,已经对进程有了一定的认识,那么这篇文章将会继续补全上篇文章剩余没有说到的,进程优先级,环境变量,程序地址空间,进程地址空间,以及调度队列。
72 0
|
3月前
|
Linux 调度 C语言
Linux进程概念-详细版(一)
子进程与父进程代码共享,其子进程直接用父进程的代码,其自己本身无代码,所以子进程无法改动代码,平时所说的修改是修改的数据。为什么要创建子进程:为了让其父子进程执行不同的代码块。子进程的数据相对于父进程是会进行写时拷贝(COW)。
79 0
|
5月前
|
JavaScript Linux Python
在Linux服务器中遇到的立即重启后的绑定错误:地址已被使用问题解决
总的来说,解决"地址已被使用"的问题需要理解Linux的网络资源管理机制,选择合适的套接字选项,以及合适的时间点进行服务重启。以上就是对“立即重启后的绑定错误:地址已被使用问题”的全面解答。希望可以帮你解决问题。
321 20
|
6月前
|
存储 Linux 调度
【Linux】进程概念和进程状态
本文详细介绍了Linux系统中进程的核心概念与管理机制。从进程的定义出发,阐述了其作为操作系统资源管理的基本单位的重要性,并深入解析了task_struct结构体的内容及其在进程管理中的作用。同时,文章讲解了进程的基本操作(如获取PID、查看进程信息等)、父进程与子进程的关系(重点分析fork函数)、以及进程的三种主要状态(运行、阻塞、挂起)。此外,还探讨了Linux特有的进程状态表示和孤儿进程的处理方式。通过学习这些内容,读者可以更好地理解Linux进程的运行原理并优化系统性能。
235 4
|
6月前
|
Linux Shell
Linux 进程前台后台切换与作业控制
进程前台/后台切换及作业控制简介: 在 Shell 中,启动的程序默认为前台进程,会占用终端直到执行完毕。例如,执行 `./shella.sh` 时,终端会被占用。为避免不便,可将命令放到后台运行,如 `./shella.sh &`,此时终端命令行立即返回,可继续输入其他命令。 常用作业控制命令: - `fg %1`:将后台作业切换到前台。 - `Ctrl + Z`:暂停前台作业并放到后台。 - `bg %1`:让暂停的后台作业继续执行。 - `kill %1`:终止后台作业。 优先级调整:
335 5