任务描述
fork()
函数通过系统调用创建一个与原来进程几乎完全相同的进程。那么,进程中的变量父进程和子进程是否都能使用并修改呢?
围绕问题的提出,我们尝试在父子进程中都修改同一个文件中的内容,最终将文件内容输出,便可知晓答案。
下面我们通过学习相关知识并编写代码来测试你的猜想是否正确。
相关知识
Linux 进程中的几个状态:
- R 运行状态 (
runing
),并不意味着进程一定在运行中,也可以在运行队列里 - S 睡眠状态 (
sleeping
),进程在等待事件完成(浅度睡眠,可以被唤醒) - D 磁盘睡眠状态 (
Disk sleep
),不可中断睡眠(深度睡眠,不可以被唤醒,通常在磁盘写入时发生) - T 停止状态 (
stopped
),可以通过发送 SIGSTOP 信号给进程来停止进程,可以发送 SIGCONT 信号让进程继续运行 - Z 僵尸状态 (
zombie
),子进程退出,父进程还在运行,但是父进程没有读到子进程的退出状态,子进程进入僵尸状态
为了完成本关任务,你需要掌握:1. 如何创建进程;2.fork()
函数的执行步骤。
进程的创建
在使用创建进程函数前,我们需要先导入unistd.h
库。
创建进程的函数原型是:pid_t fork(void);
例如:
- pid_t pid = fork();
pid_t
是一个整数类型,即fork()
函数会返回新进程的 ID 号(0~32768
的整数)。fork
函数在父进程中返回子进程的pid
,在子进程中返回0
。
注意在子进程中返回的0
,并不是子进程的pid
,子进程的pid
在父进程的返回值中保存。而子进程的返回值是为了标识它是子进程,用来区分父子进程的。
父子进程的注意事项:
- 新进程是当前进程的子进程。
- 父进程和子进程 ①父进程:
fork()
的调用者; ②子进程:新建的进程。 - 子进程是父进程的复制(相同的代码,相同的数据,相同的堆栈),除了 ID 号和时间信息外,两者完全相同。
- 子进程和父进程可以并发运行。
fork()
函数的执行步骤
由于子进程是父进程的复制,所以子进程中也会有创建子进程的语句,如果不加以限制,就会形成递归创建,但实际上并不是这样的。
实际流程是:父进程创建了子进程后,子进程中“创建进程”语句不再执行,并发运行其他语句。
在 Linux 的源码中我们可以找到fork
函数:
- ...
- copy_files(clone_flags,p); //克隆文件
- copy_fs(clone_flags,p); //克隆文件系统
- copy_mm(clone_flags,p); //克隆内存信息
- ...
我们可以看到有三条语句,用于拷贝进程的所有信息,这也解释了为什么说子进程是父进程的复制。
编程要求
通过提示,在右侧编辑器中补充代码,完成在指定文件中添加内容,具体要求如下:
- 创建进程;
- 父进程向文件中添加
hello
和world
!
; - 子进程向文件中添加
hello
和welcome
!
; - 只需修改文件内容即可,平台将为你输出文件内容。
提示:fork()
函数的返回值为0
时则为子进程。
测试说明
平台会对你编写的代码进行测试:
预期输出: hello world!
hello welcome!
任务描述
Linux 中,init
进程(初始化进程)是所有其他进程的父进程,那么是不是说就所有的进程都执行与init
进程相同的功能了呢?
答案当然不是,Linux 中某些子进程和父进程的执行并不是完全相同的。他们是如何做到的呢?
下面我们就一起来学习进程的加载。
相关知识
为了完成本关任务,你需要掌握如何加载非父进程的进程。
exec
函数族
Linux 中exec
函数族,它是若干函数的集合。exec
函数族的作用是根据指定的文件名或目录名找到可执行文件,并用它来取代调用进程的内容。换句话说,其功能是让子进程具有和父进程完全不同的新功能。
exec
本身并非一个函数,是指一组函数,一共有6
种在进程中启动另一个程序的方法:
int execl(const char *path, const char *arg, ...);
int execv(const char *path, char *const argv[]);
int execle(const char *path, const char *arg, ..., char * const envp[]);
int execve(const char *path, char *const argv[], char *const envp[]);
int execlp(const char *file, const char *arg, ...);
int execvp(const char *file, char *const argv[]);
exec
函数族的6
个函数看起来十分复杂,实际上无论是作用还是用法都十分相似,他们的命名规则:
l
和v
表示参数是以列表还是以数组的方式提供,且都必须以NULL
结尾;- **
p
**代表在path
环境变量中搜索file
文件; e
表示该函数取envp[]
数组,而不使用当前环境,即为程序提供新环境变量,一般很少使用。
进程调用一种 exec
函数时,该进程完全由新程序替换,而新程序则从其 main
函数开始执行。exec
只是用磁盘上的一个新程序替换了当前进程的正文段,数据段,堆段和栈段。并没有创建新进程,所以进程的 ID 是不变的。
注意: 一旦exec
函数执行成功,它就不会返回了,进程结束。但是如果exec
函数执行失败, 它会返回失败的信息,并且进程继续执行后面的代码!执行失败的话,必须用exit()
函数来让子进程退出!(exit
函数调用需导入stdlib.h
库函数)
进程加载
我们使用execl()
函数来做示例:
- int execl(const char *path, const char *arg, ...)
函数参数说明: path
:要执行的程序路径。可以是绝对路径或者是相对路径。在execv
、execve
、execl
和execle
这4
个函数中,使用带路径名的文件名作为参数。 arg
:程序的第0
个参数,即程序名自身。相当于argv[O]
。 …
:命令行参数列表。调用相应程序时有多少命令行参数,就需要有多少个输入参数项。最后应该以NULL
结尾,表明命令行参数结束。
返回值:-1
表明调用exec
失败,无返回表明调用成功。
- #include <unistd.h>
- int main()
- {
- printf("before exec\n");
- execl("/bin/ls", "ls", "-a", "-l", "-h", NULL);
- //若 execl() 执行成功,下面则不执行,因为当前进程已经被执行的 ls 替换了
- printf("after exec\n");
- return 0;
- }
执行语句说明: /bin/ls
:外部程序,这里是/bin
目录的ls
可执行程序,必须带上路径(相对或绝对) ls
:没有意义,如果需要给这个外部程序传参,这里必须要写上字符串,至于字符串内容任意 -a
,-l,-h
:给外部程序ls
传的参数 NULL
:代表给外部程序 ls
传参结束
执行结果:
编程要求
在右侧编辑器补充代码,要求如下:
- 创建进程;
- 在父进程中输出
entering main process---
; - 在子进程中使用
execl()
函数调用src/step2/hello.c
文件,测试环境中已将path
置为src/step2
,因此带路径的文件名为./hello
测试说明
平台会对你编写的代码进行测试:
预期输出: entering main process---
Hello exec! This is another task。
任务描述
学习完进程的创建和加载,我们发现系统都是先执行父进程的内容再执行子进程,那么有什么方法可以使子进程先执行,父进程后执行的吗?
通过学习相关知识,我们需要编写一个先执行子进程内容后执行父进程内容的程序。
相关知识
为了完成本关任务,你需要掌握:1. 系统进程退出方法;2.系统进程等待方法。
进程退出
进程常见退出方式:
1.正常退出:从main()
函数中返回return
退出;调用exit()
函数退出;调用_exit()
函数退出。
2.异常退出:由信号终止;调用abort
函数。
- return:是常见的退出进程方式,
main
函数中执行return
等同于执行exit
函数,main
函数中return n
;
函数返回值作为exit(n)
函数的参数。 - exit():进程结束执行时调用,完成进程资源回收。函数原型:
void exit(int status);
包含在stdlib.h
库中,参数status
为进程的终止状态,父进程可以通过wait()
获取。exit(0)
表示正常退出,exit(n)
其中n
不为0
都表示异常退出。 - _exit():正常退出的方式最终都会调用
_exit()
函数。函数原形:void _eixt(int status);
包含在unistd.h
库中,参数同exit
函数。
进程等待
创建子进程后如果父进程不等待,子进程退出后就会变成僵尸进程,直到父进程来获取退出信息才会释放剩余资源,并且此时该进程无法被信号杀死,继续占用资源造成内存泄露。因此,我们需要父进程调用等待函数来避免出现僵尸进程,进程等待函数是为了配合子进程的exit()
,进而实现释放子进程资源。
进程等待方式,使用前需导入sys/wait.h
库:
- wait() 是一个阻塞式等待,必须等到有一个子进程退出后获取退出状态,释放资源才可以返回。
- pid_t wait(int * status);
返回值: 退出的子进程的pid
,失败返回-1
。
参数: 输出型参数,用于获取子进程退出状态码,不关心可以置为NULL
。
- waitpid() 是一个指定
pid
的等待方式。
- pid_t waitpid(pid_t pid, int * status, int options);
返回值: 返回退出进程的pid
,当调用失败(没有子进程)返回-1
。可以通过perror
函数进行打印错误。
参数:pid
:pid=-1
表示等待任一进程;pid=n
则n
为指定需要等待的子进程,若n<0
则等待和其绝对值的相同的子进程;pid=0
表示等待和进程组pid
相同的进程。
status
:同wait
函数参数status
相同。
options
:选项参数,options=0
表示和wait()
一样的阻塞等待;options=WNOHANG
表示不阻塞,如果没有退出的进程或者需要等待的子进程将直接返回0
,另外这个参数还可以设置成其它属性。
编程要求
根据提示,在右侧编辑器补充代码,创建两个子进程,第一个进程打印I am first process!
,第二个进程打印I am second process!
,父进程打印I am father process!
。
要求实现先打印第一个进程内容,再打印第二个进程内容,最后打印父进程内容。
提示:进程加载execl
函数调用输出用法execl("/bin/echo","echo", "输出语句", NULL);
测试说明
平台会对你编写的代码进行测试:
预期输出: I am first process!
I am second process!
I am father process!