Linux进程概念（三）（下）

2023-06-15 224

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Linux进程概念（三）

当然获取环境变量还有一种方法，C语言提供了一个第三方的变量：

这个是全局环境变量的指针，也就是指向env[]那个表，这样main函数不用传参也可以获取环境变量。

使用之前必须声明一下自己要用environ变量。

进程地址空间

之前有过一张在C/C++语言层面上的地址空间图：

磁盘上面写的程序都是需要先加载到内存里才能运行的，那么这张图是物理方面的内存嘛？并不是，来看这段代码：

每个进程都是有独立性的，按理来说应该是都有单独的空间，可是在两个进程运行中，全局变量a的地址竟然是一样的，这难道说明a是被两个进程公用的吗？但是a在子进程当中又被改掉了，可是父进程当中的却没有改变，地址也完全相同。

这是因为当前显示a的地址是虚拟地址。

我们之前在用VS编译器调试的时候看到的地址都是虚拟地址，物理地址普通用户看不到，这些都由操作系统来管理。

什么是进程地址空间

下面我用32位机器举例子。

那么既然地址空间是虚拟空间，到底有什么用处，到底是怎么实现的呢？

虚拟空间是操作系统防止用户把物理内存给玩坏所弄出来的空间，是通过页表来进行映射和管理的：

在32位的机器中，操作系统会给每个进程“画个大饼”，说你们每个进程都可以分配到2^32字节（约等于4GB）的空间大小，并且每个地址都是独立不冲突的。

普通进程当然不可能一下子全都使用掉，所以理论上来说每个进程都可以有4GB的空间，但是如果某个进程需要的不是特别多或者是需要的特别多，这个时候操作系统就会调整大小了。

首先来看看进程地址空间是什么原理：

在linux源码当中，地址空间是一个mm_struct的数据结构，大概是这样的

struct mm_struct
{
  uint32_t code_start,code_end;
  uint32_t data_start,data_end;
  uint32_t heap_start,heap_end;
  uint32_t stack_start,stack_end;
};

不同区域分别赋值不同的地址就好了，如果有需要再去调整就好了，毕竟这是虚拟地址，怎么搞都搞不坏。

也就是说虚拟空间的本质就是控制这些数据而已。

进程地址空间，页表，内存的关系

一个程序在磁盘里，先放入内存中，然后代码跑起来，代码也是需要储存在内存上的，并且内存当中是类似于数组形式的，一个page位4kb大小。

进程在运行的时候有自己的虚拟地址空间，然后通过页表来映射到物理内存上的。

这些都是由操作系统完成的。

这也就能解释刚开始代码为什么是显示的是同一个地址，子进程改变了数值父进程却没有改变。

因为每个进程都有独立的进程地址空间和页表：

页表不单单只是映射，并且还会去判断，拦截（所有进程都不例外）像刚开始写的那段代码，因为子进程是父进程创建的，那么子进程的地址空间内容是从父进程拷贝而来的，但是页表会发现原本映射出来的位置已经被占有了，这个时候就会在另一处先开辟空间，然后拷贝父进程在内存中的内容到新开辟的空间当中，然后更改页表的映射，这个叫做写时拷贝，这样父进程和子进程就是两个完全独立的空间。

为什么存在进程地址空间

1.防止进程在物理内存当中进行越界的非法操作。（上面的例子已证明）

2.更方便进程和进程的数据代码解耦，保证了进程独立性的特征。（上面的例子已证明）

遵守进程地址空间的不仅仅是操作系统还有编译器！

假设我写了一个程序my.exe。

程序在磁盘的时候是有地址的，逻辑地址（在linux当中也可以称为虚拟地址）

在进程指向进程地址空间的时候，CPU去读取指令，main函数，因为每一条指令都是有虚拟地址的，所以就能找到fun函数，还有a的位置。

CPU的寄存器中储存的就是虚拟地址，通过main函数的虚拟地址然后找到内存中的main然后解析代码，然后调用fun的时候又通过页表映射到了进程地址空间当中，CPU又拿到了fun函数的虚拟地址，然后再映射到物理内存当中，这就是我们调试代码中看到的内存地址编号就是虚拟地址空间。

上面的运行模式也说明了CPU从头到尾都没有见到过物理内存地址，就算是内存中代码的内部使用的也全都是虚拟地址。

至于逻辑地址和虚拟地址的区别，现在用的逻辑地址也是划分区域，代码区，数据区等等，恰好与虚拟地址的编号差不多，所以加载到内存当中使用的就是虚拟地址了。

旧版的逻辑地址就比较繁琐了，是靠偏移量来找到物理内存中数据的地址。

这说明进程地址空间方便了进程以统一视角来看到对应的代码，数据等各个区域，也方便编译器用同一个规则进行编译。（规则是一样的，编译完即可使用）

最后说明：

命令行参数环境变量就是那个environ。

Linux进程概念（三）（下）

进程地址空间

什么是进程地址空间

进程地址空间，页表，内存的关系

为什么存在进程地址空间

热门文章

最新文章

相关课程

相关电子书

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Linux进程概念（三）（下）

进程地址空间

什么是进程地址空间

进程地址空间，页表，内存的关系

为什么存在进程地址空间

热门文章

最新文章

相关课程

相关电子书

推荐镜像