1. 进程概念
我们知道,每个进程在内核中都有一个进程控制块(PCB)来维护进程相关的信 息,Linux内核的进程控制块是task_struct结构体。现在我们全面了解一下其中都有哪 些信息。
- 进程id。系统中每个进程有唯一的id,在C语言中用pid_t类型表示,其实就是一个非 负整数。
- 进程的状态,有运行、挂起、停止、僵尸等状态。
- 进程切换时需要保存和恢复的一些CPU寄存器。
- 描述虚拟地址空间的信息。
- 描述控制终端的信息。
- 当前工作目录(Current Working Directory)。
- umask掩码。
- 文件描述符表,包含很多指向file结构体的指针。
- 和信号相关的信息。
- 用户id和组id。
- 控制终端、Session和进程组。
- 进程可以使用的资源上限(Resource Limit)。
目前大家并不需要理解这些信息的细节,在随后的文章中我们会知道它是保 存在PCB中的。
fork和exec是本章要介绍的两个重要的系统调用。fork的作用是根据一个现有的进程复 制出一个新进程,原来的进程称为父进程(Parent Process),新进程称为子进程(Child Process)。系统中同时运行着很多进程,这些进程都是从最初只有一个进程开始一个一个 复制出来的。在Shell下输入命令可以运行一个程序,是因为Shell进程在读取用户输入的命 令之后会调用fork复制出一个新的Shell进程,然后新的Shell进程调用exec执行新的程序。
我们知道一个程序可以多次加载到内存,成为同时运行的多个进程,例如可以同时开多 个终端窗口运行/bin/bash,另一方面,一个进程在调用exec前后也可以分别执行两个不同 的程序,例如在Shell提示符下输入命令ls,首先fork创建子进程,这时子进程仍在执行/ bin/bash程序,然后子进程调用exec执行新的程序/bin/ls 。
2. 进程环境
libc中定义的全局变量environ指向环境变量表,environ没有包含在任何头文件中,所 以在使用时要用extern声明。例如:
#include <stdio.h> int main(void) { extern char **environ; int i; for(i=0; environ[i]!=NULL; i++) printf("%s\n", environ[i]); return 0; }
由于父进程在调用fork创建子进程时会把自己的环境变量表也复制给子进程,所以 a.out打印的环境变量和Shell进程的环境变量是相同的。
按照惯例,环境变量字符串都是name=value这样的形式,大多数name由大写字母加下划 线组成,一般把name的部分叫做环境变量,value的部分则是环境变量的值。环境变量定义 了进程的运行环境,一些比较重要的环境变量的含义如下:
- PATH:可执行文件的搜索路径。ls命令也是一个程序,执行它不需要提供完整的路径名/bin/ ls,然而通常我们执行当前目录下的程序a.out却需要提供完整的路径名./a.out,这 是因为PATH环境变量的值里面包含了ls命令所在的目录/bin,却不包含a.out所在的目 录。PATH环境变量的值可以包含多个目录,用:号隔开。在Shell中用echo命令可以查 看这个环境变量的值:
$ echo $PATH
- SHELL:当前Shell,它的值通常是/bin/bash。
- TERM:当前终端类型,在图形界面终端下它的值通常是xterm,终端类型决定了一些程序的输 出显示方式,比如图形界面终端可以显示汉字,而字符终端一般不行。
- LANG:语言和locale,决定了字符编码以及时间、货币等信息的显示格式。
- HOME:当前用户主目录的路径,很多程序需要在主目录下保存配置文件,使得每个用户在运 行该程序时都有自己的一套配置。
用environ指针可以查看所有环境变量字符串,但是不够方便,如果给出name要在环境变量 表中查找它对应的value,可以用getenv函数。
#include <stdlib.h> char *getenv(const char *name); getenv的返回值是指向value的指针,若未找到则为NULL。
修改环境变量可以用以下函数:
#include <stdlib.h> int setenv(const char *name, const char *value, int rewrite); void unsetenv(const char *name); putenv和setenv函数若成功则返回为0,若出错则返回非0。
setenv将环境变量name的值设置为value。如果已存在环境变量name,那么 若rewrite非0,则覆盖原来的定义; 若rewrite为0,则不覆盖原来的定义,也不返回错误。 unsetenv删除name的定义。即使name没有定义也不返回错误。
例修改环境变量
#include <stdlib.h> #include <stdio.h> int main(void) { printf("PATH=%s\n", getenv("PATH")); setenv("PATH", "hello", 1); printf("PATH=%s\n", getenv("PATH")); return 0; }
3.进程状态
修改进程资源限制,软限制可改,最大值不能超过硬限制,硬限制只有root用户可以修改
#include <sys/time.h> #include <sys/resource.h> int getrlimit(int resource, struct rlimit *rlim); int setrlimit(int resource, const struct rlimit *rlim);
查看进程资源限制:
cat /proc/self/limits ulimit -a
4. 小结
本文介绍了进程的基本概念,进程控制块信息,fork和exec两个主要的系统调用。以及进程环境的修改及获取,进程状态的修改与获取。