当然获取环境变量还有一种方法,C语言提供了一个第三方的变量:
这个是全局环境变量的指针,也就是指向env[]那个表,这样main函数不用传参也可以获取环境变量。
使用之前必须声明一下自己要用environ变量。
进程地址空间
之前有过一张在C/C++语言层面上的地址空间图:
磁盘上面写的程序都是需要先加载到内存里才能运行的,那么这张图是物理方面的内存嘛?并不是,来看这段代码:
每个进程都是有独立性的,按理来说应该是都有单独的空间,可是在两个进程运行中,全局变量a的地址竟然是一样的,这难道说明a是被两个进程公用的吗?但是a在子进程当中又被改掉了,可是父进程当中的却没有改变,地址也完全相同。
这是因为当前显示a的地址是虚拟地址。
我们之前在用VS编译器调试的时候看到的地址都是虚拟地址,物理地址普通用户看不到,这些都由操作系统来管理。
什么是进程地址空间
下面我用32位机器举例子。
那么既然地址空间是虚拟空间,到底有什么用处,到底是怎么实现的呢?
虚拟空间是操作系统防止用户把物理内存给玩坏所弄出来的空间,是通过页表来进行映射和管理的:
在32位的机器中,操作系统会给每个进程“画个大饼”,说你们每个进程都可以分配到2^32字节(约等于4GB)的空间大小,并且每个地址都是独立不冲突的。
普通进程当然不可能一下子全都使用掉,所以理论上来说每个进程都可以有4GB的空间,但是如果某个进程需要的不是特别多或者是需要的特别多,这个时候操作系统就会调整大小了。
首先来看看进程地址空间是什么原理:
在linux源码当中,地址空间是一个mm_struct的数据结构,大概是这样的
struct mm_struct { uint32_t code_start,code_end; uint32_t data_start,data_end; uint32_t heap_start,heap_end; uint32_t stack_start,stack_end; };
不同区域分别赋值不同的地址就好了,如果有需要再去调整就好了,毕竟这是虚拟地址,怎么搞都搞不坏。
也就是说虚拟空间的本质就是控制这些数据而已。
进程地址空间,页表,内存的关系
一个程序在磁盘里,先放入内存中,然后代码跑起来,代码也是需要储存在内存上的,并且内存当中是类似于数组形式的,一个page位4kb大小。
进程在运行的时候有自己的虚拟地址空间,然后通过页表来映射到物理内存上的。
这些都是由操作系统完成的。
这也就能解释刚开始代码为什么是显示的是同一个地址,子进程改变了数值父进程却没有改变。
因为每个进程都有独立的进程地址空间和页表:
页表不单单只是映射,并且还会去判断,拦截(所有进程都不例外)像刚开始写的那段代码,因为子进程是父进程创建的,那么子进程的地址空间内容是从父进程拷贝而来的,但是页表会发现原本映射出来的位置已经被占有了,这个时候就会在另一处先开辟空间,然后拷贝父进程在内存中的内容到新开辟的空间当中,然后更改页表的映射,这个叫做写时拷贝,这样父进程和子进程就是两个完全独立的空间。
为什么存在进程地址空间
1.防止进程在物理内存当中进行越界的非法操作。(上面的例子已证明)
2.更方便进程和进程的数据代码解耦,保证了进程独立性的特征。(上面的例子已证明)
3.
遵守进程地址空间的不仅仅是操作系统还有编译器!
假设我写了一个程序my.exe。
程序在磁盘的时候是有地址的,逻辑地址(在linux当中也可以称为虚拟地址)
在进程指向进程地址空间的时候,CPU去读取指令,main函数,因为每一条指令都是有虚拟地址的,所以就能找到fun函数,还有a的位置。
CPU的寄存器中储存的就是虚拟地址,通过main函数的虚拟地址然后找到内存中的main然后解析代码,然后调用fun的时候又通过页表映射到了进程地址空间当中,CPU又拿到了fun函数的虚拟地址,然后再映射到物理内存当中,这就是我们调试代码中看到的内存地址编号就是虚拟地址空间。
上面的运行模式也说明了CPU从头到尾都没有见到过物理内存地址,就算是内存中代码的内部使用的也全都是虚拟地址。
至于逻辑地址和虚拟地址的区别,现在用的逻辑地址也是划分区域,代码区,数据区等等,恰好与虚拟地址的编号差不多,所以加载到内存当中使用的就是虚拟地址了。
旧版的逻辑地址就比较繁琐了,是靠偏移量来找到物理内存中数据的地址。
这说明进程地址空间方便了进程以统一视角来看到对应的代码,数据等各个区域,也方便编译器用同一个规则进行编译。(规则是一样的,编译完即可使用)
最后说明:
命令行参数环境变量就是那个environ。