【Linux】进程地址空间

简介: 【Linux】进程地址空间

👉进程地址空间👈


相信大家在学习 C/C++ 的时候,肯定是见过类似下面的内存地址空间的图片。那它真的是内存吗?其实它并不是真正的内存,那它究竟是什么呢?我们先看来一下下面的代码,再一起探究它究竟是什么。

f9264c6f67a84490b023d2ccff76d839.png

#include <stdio.h>
#include <unistd.h>
int global_val = 100;
int main()
{
    pid_t id = fork();
    if(id < 0)
    {
        perror("fork");
        return 1;
    }
    else if(id == 0)
    {
        int count = 0;
        while(1)
        {
            printf("我是子进程, pid:%d, ppid:%d | global_val:%d, &global_val:%p\n", getpid(), getppid(), global_val, &global_val);
            sleep(1);
            ++count;
            if(count == 5)
            {
                global_val = 200;
                printf("子进程已经修改全局变量啦...........\n");
            }
        }
    }
    else
    {
        while(1)
        {
            printf("我是父进程, pid:%d, ppid:%d | global_val:%d, &global_val:%p\n", getpid(), getppid(), global_val, &global_val);
            sleep(1);
        } 
    }
    return 0;
}


cd4b4f76d559494e854390afb0dc0e78.png

a2eeb8743db14603bab328e918a3b078.png

通过上图,我们可以看到:多进程在读取同一个地址的时候,却读取出来了两个值。这是为什么呢?了解这个之前,我们需要知道:使用 fork 函数创建子进程后,子进程也会有自己的内核数据结构,其内核数据结构是拷贝父进程的内核数据结构的。由于进程的独立性,子进程修改global_val的值,并不会影响父进程global_val的值,这个是比较好理解的。但是为什么父子进程的global_val的地址却相同呢?其实这也就说明了这个地址并不是物理地址。因为物理地址的值只能有一个,不可能有两个。


所以,C/C++ 中的地址(指针)不是物理地址。那不是物理地址,是什么地址呢?其实这个地址是虚拟地址(线性地址)。所以,最开始提到的 C/C++ 地址空间是虚拟地址空间。那么想要解释上面的现象,我们就必须了解虚拟地址空间了。


那么,我给大家讲个故事来感性地理解一下虚拟地址空间。美国有个大富翁,他有十亿美金和三个私生子,私生子不知道彼此的存在。大富翁对每个私生子都说过:儿子啊,我有十亿美金的存款。你好好打理生意,等我驾鹤西去了,这些存款都是归你的。那么,他的私生子呢就找他们的老爸要钱打理生意为了得到十亿美金存款。其实这个故事里的大富翁就对应着操作系统,十亿美元对应着内存,私生子就对应的进程,私生子要的各种资源就对应着程序申请的对象空间,而大富翁给私生子画的大饼就对应着进程地址空间。也就是说,操作系统给每个进程都画了个大饼进程地址空间,让进程会认为自己是进程地址空间的,事实上并不是。


我们现在知道了,操作系统给进程画了个大饼进程地址空间。那操作系统是如何画饼的呢?对一个人画饼,首先那个人要记性好。画饼的本质是在人的大脑里构建一个蓝图,可以用一个结构体来表示。


c37259816ac14dcdba04ab9471f53834.png


进程需要被管理,操作系统给进程画的大饼进程地址空间也要被管理。那么管理的方式就是先描述,再组织。进程地址空间的本质也是内核的一种数据结构struct mm_struct。


结构体struct mm_struct中包含了代码区、数据区、栈区和堆区的起始地址和结束地址,起始地址和结束地址之间的空间就是各自的虚拟地址。当一个进程创建时,操作系统会给进程申请结构体struct mm_struct 并将每个区域划分好,并且进程的进程控制块里有指针struct mm_struct* mm指向申请的结构体。

6ad168272f2d4394bb324d6dcc7ebc6c.png

关于栈区和堆区需要注意的是,栈区和堆区的区域大小是可以调整的,其调整的本质是修改栈区和堆区的起始地址和结束地址。定义局部变量、new 和 malloc 就是扩大栈区或者堆区,函数调用完毕和 free 就是缩小栈区和堆区。


190db6b27d6143269571bab8269b4d6c.png


程序想要运行起来,必须先加载到内存。那么,程序的代码和数据就会在内存中占用一个的空间,这些空间也是有地址的。我们也知道,程序运行起来会有对应的进程控制struct task_struct,进程控制块内有struct mm_struct指针指向对应的进程地址空间。而进程地址空间通过页表映射就可以找到对应的物理地址。


d7ff8b9eea8a492f86aed232674f968e.png


注:真正的页表是多级页表,是一个树状结构。以上的示意图并不是页表真正的样子。

每个进程都会有各自的进程控制块task_struct


进程地址空间mm_struct和页表。

1e2a67e32a35418a9ebf6a54ee3285e6.png


那为什么要存在进程地址空间呢?不能让进程直接访问物理内存呢?第一,是为了安全保护内存,防止进程越界非法修改数据(页表是可以拦截进程的非法读取和非法写入的)。第二,进程地址空间的存在,可以更方便地进行进程和进程的代码数据的解耦,保证了进程的独立性!第三,让进程以统一的视角来看待进程对应的代码和数据等各个区域,方便使用,编译器也以统一的视角来进行编译代码,规则是一样的,编译即可直接使用。


下图可以解答最开始的问题!!!


4efc7dca1638412186353f900565ed31.png

8101b3c377d64fe3afa9168b450caf9b.png

再谈进程地址空间


可执行程序在没有被加载到内存的时候,可执行程序内部早就有地址了,该地址是逻辑地址。编译器也要遵守虚拟地址空间,编译器编译代码的时候,就是按照虚拟地址空间进行对代码和数据进行编址的!上面说到的地址是程序内部使用的地址,当程序被加载到物理内存中的时候,该程序对应的指令和数据就都具有了物理地址。CPU 读取的都是指令,指令内部是有地址的(虚拟地址),通过页表映射找到物理地址执行相应指令。


  • 可执行程序内部有互相跳转的地址,即虚拟地址
  • 程序被加载到内存中,有标识物理内存中代码和数据的地址
  • CPU 见不到物理内存的地址,见到的只是虚拟地址

👉总结👈


本篇博客主要讲解了什么是进程地址空间、为什么要有进程地址空间等等。那么以上就是本篇博客的全部内容了,如果大家觉得有收获的话,可以点个三连支持一下!谢谢大家!💖💝❣️

相关文章
|
6天前
|
算法 Linux 调度
深入理解Linux操作系统的进程管理
本文旨在探讨Linux操作系统中的进程管理机制,包括进程的创建、执行、调度和终止等环节。通过对Linux内核中相关模块的分析,揭示其高效的进程管理策略,为开发者提供优化程序性能和资源利用率的参考。
25 1
|
1天前
|
SQL 运维 监控
南大通用GBase 8a MPP Cluster Linux端SQL进程监控工具
南大通用GBase 8a MPP Cluster Linux端SQL进程监控工具
|
9天前
|
运维 监控 Linux
Linux操作系统的守护进程与服务管理深度剖析####
本文作为一篇技术性文章,旨在深入探讨Linux操作系统中守护进程与服务管理的机制、工具及实践策略。不同于传统的摘要概述,本文将以“守护进程的生命周期”为核心线索,串联起Linux服务管理的各个方面,从守护进程的定义与特性出发,逐步深入到Systemd的工作原理、服务单元文件编写、服务状态管理以及故障排查技巧,为读者呈现一幅Linux服务管理的全景图。 ####
|
1月前
|
缓存 监控 Linux
linux进程管理万字详解!!!
本文档介绍了Linux系统中进程管理、系统负载监控、内存监控和磁盘监控的基本概念和常用命令。主要内容包括: 1. **进程管理**: - **进程介绍**:程序与进程的关系、进程的生命周期、查看进程号和父进程号的方法。 - **进程监控命令**:`ps`、`pstree`、`pidof`、`top`、`htop`、`lsof`等命令的使用方法和案例。 - **进程管理命令**:控制信号、`kill`、`pkill`、`killall`、前台和后台运行、`screen`、`nohup`等命令的使用方法和案例。
119 4
linux进程管理万字详解!!!
|
14天前
|
缓存 算法 Linux
Linux内核的心脏:深入理解进程调度器
本文探讨了Linux操作系统中至关重要的组成部分——进程调度器。通过分析其工作原理、调度算法以及在不同场景下的表现,揭示它是如何高效管理CPU资源,确保系统响应性和公平性的。本文旨在为读者提供一个清晰的视图,了解在多任务环境下,Linux是如何智能地分配处理器时间给各个进程的。
|
24天前
|
存储 运维 监控
深入Linux基础:文件系统与进程管理详解
深入Linux基础:文件系统与进程管理详解
64 8
|
22天前
|
网络协议 Linux 虚拟化
如何在 Linux 系统中查看进程的详细信息?
如何在 Linux 系统中查看进程的详细信息?
41 1
|
22天前
|
Linux
如何在 Linux 系统中查看进程占用的内存?
如何在 Linux 系统中查看进程占用的内存?
|
1月前
|
算法 Linux 定位技术
Linux内核中的进程调度算法解析####
【10月更文挑战第29天】 本文深入剖析了Linux操作系统的心脏——内核中至关重要的组成部分之一,即进程调度机制。不同于传统的摘要概述,我们将通过一段引人入胜的故事线来揭开进程调度算法的神秘面纱,展现其背后的精妙设计与复杂逻辑,让读者仿佛跟随一位虚拟的“进程侦探”,一步步探索Linux如何高效、公平地管理众多进程,确保系统资源的最优分配与利用。 ####
69 4
|
1月前
|
缓存 负载均衡 算法
Linux内核中的进程调度算法解析####
本文深入探讨了Linux操作系统核心组件之一——进程调度器,着重分析了其采用的CFS(完全公平调度器)算法。不同于传统摘要对研究背景、方法、结果和结论的概述,本文摘要将直接揭示CFS算法的核心优势及其在现代多核处理器环境下如何实现高效、公平的资源分配,同时简要提及该算法如何优化系统响应时间和吞吐量,为读者快速构建对Linux进程调度机制的认知框架。 ####