进程概念二
1. 进程状态
为了弄明白正在运行的进程是什么意思,我们需要知道进程的不同状态。一个进程可以有几个状态(在Linux内核当中,进程有时候也叫作任务)。下面的状态,在源码里定义
/* * The task state array is a strange "bitmap" of * reasons to sleep. Thus "running" is zero, and * you can test for combinations of others with * simple bit tests. */ static const char * const task_state_array[] = { "R (running)", /* 0 */ "S (sleeping)", /* 1 */ "D (disk sleep)", /* 2 */ "T (stopped)", /* 4 */ "t (tracing stop)", /* 8 */ "X (dead)", /* 16 */ "Z (zombie)", /* 32 */ };
- R运行状态:并不意味着进程一定在运行中,它表明进程要么是在运行中,要么是在运行队列当中
- S睡眠状态:意味着进程是在等待事件完成(这里的睡眠也叫作可中断睡眠)
- D磁盘休眠状态:有时候也叫不可中断休眠状态,在这个状态的进程通常会等待IO的结束
- T停止状态:可以通过发送SIGSTOP信号给进程来停止(T)状态。这个被暂停的进程可以通过发送SIGSTOP信号让进程继续运行
- X死亡状态:这个状态只是一个返回状态,不会在任务列表当中看到这个状态
阻塞:进程因为等待某种条件就绪,而导致的一种不推进的状态
进程卡住了,阻塞一定是在等待某种资源
为什么会阻塞?
进程要通过等待的方式,等具体的资源被别人用完之后,再被自己使用。
阻塞:进程等待某种资源就绪的过程
进程只要是R状态,就一定是在CPU上运行吗?
并不直接代表进程在运行,而代表该进程在运行队列当中排队。
2. 进程状态查看
可以通过命令
ps ajx | 后面跟选项
3. 僵尸进程
- 僵尸状态是一个比较特殊的状态。当进程退出并且父进程没有读取到子进程退出的返回代码就会产生僵尸进程
- 僵尸进程会以终止状态保持在进程表中,并且一直在等待父进程读取退出状态码
- 只要子进程退出,父进程还在运行,但父进程没有读取到子进程状态,子进程进入僵尸状态
创建一个僵尸进程的例子:
编译器在另一个终端下,启动监控:
3.1 僵尸进程的危害
- 进程的退出状态必须被维持下去,因为它要告诉父进程,任务现在怎么样了,如果父进程一直不读取僵尸进程就会一直维持下去
- 维护退出状态本身就是要用数据维护,也属于进程基本信息,换句话说Z状态一直不退出,PCB一直都要维护的
- 那么如果一个父进程创建了很多子进程,就是不回收会不会造成资源的浪费,是的因为数据结构对象本身就要占用内存
4. 孤儿进程
- 父进程如果提前退出,那么子进程后退出,进入Z之后,该如何处理?
父进程先退出,子进程就称之为“孤儿进程”,孤儿进程被1号进程领养,肯定是1号进程来回收
#include <stdio.h> #include <unistd.h> #include <stdlib.h> int main() { pid_t id = fork(); if(id < 0){ perror("fork"); return 1; } else if(id == 0){//child printf("I am child, pid : %d\n", getpid()); sleep(10); }else{//parent printf("I am parent, pid: %d\n", getpid()); sleep(3); exit(0); } return 0; }
先让父进程退出,子进程休眠查看子进程的进程状态
5. 环境变量
环境变量一般是指在操作系统中用来指定操作系统运行环境的一些参数,环境变量通常有些特殊用途,还有在系统当中通常具有全局性
环境变量本质就是一个内存级的一张表,这张表用户在登录系统的时候,进行特定用户形成属于自己的环境变量表。
环境变量中的每一个,都有自己的用途:有的是路径查找,有的时进行身份认证的,有的进行动态库查找的,有的是用来确定当前路径等等,每一个环境变量都有自己的特定的应用场景
5.1 常见环境变量
- PATH:指定命令搜索路径
- HOME:指定用户的主工作目录(即用户登录到LInux系统当中,默认的目录)
- SHELL:当前shell,它的值通常是/bin/bash
5.2 查看环境变量的方法
echo $NAME
NAME:你的环境变量名称
5.3 测试PATH
为什么有些指令可以直接执行,不需要带路径,但是我们的二进制文件需要带路径。
将我们的程序所在的路径加入到PATH当中
export PATH=$PATH:~/code/test_3_8
我们可以发现直接,输入就可以运行了
5.4 环境变量相关的命令
- echo:显示某个环境变量值
- export:设置一个新的环境变量
- env:显示所所有的环境变量
- unset:清除环境变量
- set:显示本地定义的shell变量和环境变量
5.5 环境变量的组织方式
每个程序都会收到一个环境表,环境表是一个字符指针数组,每个指针指向一个以‘\0’结尾的环境字符串
5.6 通过代码获取环境变量
- 命令行第三个参数
- 通过第三方变量environ获取
环境变量通常具有全局属性,可以被子进程继承下去
6. 程序地址空间
之前的学习当中,我们都见过这样的空间布局图
让我们来用一段代码感受一下:
输入的结果如下图所示:
我们发现输出的变量和地址是一样的,进程按照父进程为模板,父子并没有对变量进行任何的修改。
输出结果如下所示:
我们发现父子进程的地址是一样的,但是内容不一样。
变量内容不一样,所以父子进程输出的变量绝对不是同一个变量。地址却是一样的说明该地址不是物理地址。在Linux下,这种地址叫做虚拟地址。
我们用C/C++语言看到的地址,全部都是虚拟地址!物理地址,用户一概看不到,由OS统一管理
OS必须负责将虚拟地址转化成物理地址
子进程对全局数据修改,并不影响父进程!进程具有独立性
进程 = 内核数据结构 + 代码和数据
7. 进程地址空间
我么之前所说的程序地址空间是不准确的,准确的应该说成进程地址空间
,我们可以用一下这幅图来理解:
同一个变量,地址相同,其实是虚拟地址相同,内容不同其实是被映射到不同的物理地址
数据和代码真正只能在内存当中
8. 扩展
8.1 为什么有地址空间?
- 防止地址随意访问,保护物理内存与其他进程
- 将进程管理与内存管理进行解耦
- 可以让进程用统一的视角,看待自己的代码和数据
8.2 重新理解地址空间
我们的程序再被编译的时候,没有被加载到内存,请问我们的程序有没有地址呢?
虚拟地址这样的策略,不仅会影响OS,还要让我们的编译遵守这样的规则
源代码被编译的时候,就是按照虚拟地址的方式进行对代码和数据早就已经编号了对应的编制