《Linux从练气到飞升》No.17 进程创建

简介: 《Linux从练气到飞升》No.17 进程创建

e67a66890c464e77a2fdd77ab71aefbd.png

前言

之前我们在进程基本概念中讲述过fork可以创建子进程(请在《探秘Linux》专栏中查看),但是我们只是大概讲述了一下它的功能和大致原理,算作是初识,本篇将更为详细的讲述它的用法——创建进程

fork函数

在linux中fork函数时非常重要的函数,它从已存在进程中创建一个新进程。新进程为子进程,而原进程为父进程。

在我们想要使用fork函数时,注意一下几点:

#include <unistd.h>//记得包头文件
pid_t fork(void);//fork函数的返回值是pid_t,注意转化()
返回值:子进程中返回0,父进程返回子进程id,出错返回-1

进程调用fork函数以后,内核做了什么?

  • 分配新的内存块和内核数据结构给子进程
  • 将父进程部分数据结构内容拷贝至子进程
  • 添加子进程到系统进程列表当中
  • fork返回,开始调度器调度

如下图:

当一个进程调用fork之后,就有两个二进制代码相同的进程。而且它们都运行到相同的地方。但每个进程都将可以开始它们自己的旅程,我们来测试一下~

#include <stdio.h>
#include <unistd.h>
int main( void )
{
    pid_t pid;
    printf("Before: pid is %d\n", getpid());
    if ( (pid=fork()) == -1 )perror("fork()"),exit(1);
    printf("After:pid is %d, fork return %d\n", getpid(), pid);
    sleep(1);
    return 0; 
}

运行结果:

这里看到了三行输出,

一行before,两行after。

进程4863先打印before消息,然后它有打印after。

另一个after消息有4864打印的。

注意到进程4864没有打印before,

为什么呢?如下图所示

所以,fork之前父进程独立执行,fork之后,父子两个执行流分别执行。注意,fork之后,谁先执行完全由调度器决定。

fork函数返回值

  • 子进程返回0
  • 父进程返回的是子进程的pid

写时拷贝

通常,父子代码共享,父子再不写入时,数据也是共享的,当任意一方试图写入,便以写时拷贝的方式各自一份副本。具体见下图:

fork常规用法

  • 一个父进程希望复制自己,使父子进程同时执行不同的代码段。例如,父进程等待客户端请求,生成子进程来处理请求。
  • 一个进程要执行一个不同的程序。例如子进程从fork返回后,调用exec函数

fork调用失败的原因

  • 系统中有太多的进程,进程太多,可能就没有多余的内存来创建进程了,进而导致fork调用失败。
  • 实际用户的进程数超过了限制

fork面试题

请你描述一下folk创建子进程,操作系统都做了什么?

我们推一下,fork创建子进程,也就是说系统里多了一个进程。进程等于内核数据结构加进程代码和数据,而进程代码和数据一般从磁盘中来。也就是你的c或c++程序加载之后的结果。那么我们再倒退回去,folk创建子进程,操作系统就会从磁盘中加载c或c++程序加载之后的结果,然后同时创建内核数据结构,包括地址空间、页表等,进而形成一个新的进程。

fork之后子进程是否能够使用父进程的全部代码?

创建子进程,给子进程分配对应的内核结构。必须子进程自己独有了,这是因为进程具有独立性,理论上子进程要有自己的代码和数据。可是一般而言我们没有加载的过程,也就是说子进程没有自己的代码和数据,所以子进程只能使用父进程的代码数据。但是代码都是不可被写的,只能读取,所以父子共享没有问题,但是数据可能被修改的,所以必须分离。

但是我们还没有说到一个问题:子进程代码共享是否是所有的?还是只是说fork之后的?

实际上我们的代码汇编之后会有很多行代码,而且每行代码加载到内存之后都有对应的地址,因为进程随时可能被中断,可能并没有执行完就中断了,下次回来还必须从之前的位置继续运行。就要要求 CPU必须随时记录下当前进程执行的位置,所以CPU内有对应的寄存器,数据用来记录当前进程的执行位置。我们之前讲过,寄存器在CPU内只有一份,寄存器的数据是可有多份的,这个寄存器数据也就是进程的上下文。那么这个进程的上下文数据要不要给子进程呢?答案是要的,虽然复制进程各自调的,各自会修改EIP(程序计数器),但是已经不重要了,因为子进程已经认为自己的EIP其实值就是fork之后的代码,它必须共享所有的代码。

操作系统为何要选择写时拷贝技术对父子进程进行分离?

总结起来是两点:

一、用的时候再给你分配,是高效使用内存的一种表现。

二、操作系统无法在代码执行前预知哪些空间会被访问?

展开谈谈:

试想一下,对于数据而言,创建进程的时候,就直接拷贝分离。是不是会浪费内存?可能拷贝子进程根本就不会用到的数据空间,即便是用到了,也可能只是读取,而我们创建子进程,不需要将不会被访问的或者只会读取的数据拷贝一份。

但是,什么数据值得拷贝呢?将来会被父或子进程写入的数据。但是一般而言,即便是操作系统,也无法提前知道哪些空间可能会被泄露,而且就算提前拷贝了,也不一定会立马使用。所以操作系统选择了写时拷贝技术来进行将父子进程的数据进行分离。写时拷贝是一种延迟申请技术,它可以提高整机内存的使用率的同时也完成了进程独立性的技术保证。

后记

本篇我们较为详细的讲述了fork函数的使用,以及它的相关原理,请结合进程概念那篇博客一起食用~


相关文章
|
8天前
|
Linux Shell
Linux 进程前台后台切换与作业控制
进程前台/后台切换及作业控制简介: 在 Shell 中,启动的程序默认为前台进程,会占用终端直到执行完毕。例如,执行 `./shella.sh` 时,终端会被占用。为避免不便,可将命令放到后台运行,如 `./shella.sh &`,此时终端命令行立即返回,可继续输入其他命令。 常用作业控制命令: - `fg %1`:将后台作业切换到前台。 - `Ctrl + Z`:暂停前台作业并放到后台。 - `bg %1`:让暂停的后台作业继续执行。 - `kill %1`:终止后台作业。 优先级调整:
30 5
|
8天前
|
Linux 应用服务中间件 nginx
Linux 进程管理基础
Linux 进程是操作系统中运行程序的实例,彼此隔离以确保安全性和稳定性。常用命令查看和管理进程:`ps` 显示当前终端会话相关进程;`ps aux` 和 `ps -ef` 显示所有进程信息;`ps -u username` 查看特定用户进程;`ps -e | grep &lt;进程名&gt;` 查找特定进程;`ps -p &lt;PID&gt;` 查看指定 PID 的进程详情。终止进程可用 `kill &lt;PID&gt;` 或 `pkill &lt;进程名&gt;`,强制终止加 `-9` 选项。
19 3
|
9天前
|
Linux
Linux:守护进程(进程组、会话和守护进程)
守护进程在 Linux 系统中扮演着重要角色,通过后台执行关键任务和服务,确保系统的稳定运行。理解进程组和会话的概念,是正确创建和管理守护进程的基础。使用现代的 `systemd` 或传统的 `init.d` 方法,可以有效地管理守护进程,提升系统的可靠性和可维护性。希望本文能帮助读者深入理解并掌握 Linux 守护进程的相关知识。
27 7
|
13天前
|
存储 Linux API
【Linux进程概念】—— 操作系统中的“生命体”,计算机里的“多线程”
在计算机系统的底层架构中,操作系统肩负着资源管理与任务调度的重任。当我们启动各类应用程序时,其背后复杂的运作机制便悄然展开。程序,作为静态的指令集合,如何在系统中实现动态执行?本文带你一探究竟!
【Linux进程概念】—— 操作系统中的“生命体”,计算机里的“多线程”
|
26天前
|
存储 网络协议 Linux
【Linux】进程IO|系统调用|open|write|文件描述符fd|封装|理解一切皆文件
本文详细介绍了Linux中的进程IO与系统调用,包括 `open`、`write`、`read`和 `close`函数及其用法,解释了文件描述符(fd)的概念,并深入探讨了Linux中的“一切皆文件”思想。这种设计极大地简化了系统编程,使得处理不同类型的IO设备变得更加一致和简单。通过本文的学习,您应该能够更好地理解和应用Linux中的进程IO操作,提高系统编程的效率和能力。
75 34
|
1月前
|
消息中间件 Linux C++
c++ linux通过实现独立进程之间的通信和传递字符串 demo
的进程间通信机制,适用于父子进程之间的数据传输。希望本文能帮助您更好地理解和应用Linux管道,提升开发效率。 在实际开发中,除了管道,还可以根据具体需求选择消息队列、共享内存、套接字等其他进程间通信方
65 16
|
2月前
|
消息中间件 Linux
Linux:进程间通信(共享内存详细讲解以及小项目使用和相关指令、消息队列、信号量)
通过上述讲解和代码示例,您可以理解和实现Linux系统中的进程间通信机制,包括共享内存、消息队列和信号量。这些机制在实际开发中非常重要,能够提高系统的并发处理能力和数据通信效率。希望本文能为您的学习和开发提供实用的指导和帮助。
177 20
|
3月前
|
存储 监控 Linux
嵌入式Linux系统编程 — 5.3 times、clock函数获取进程时间
在嵌入式Linux系统编程中,`times`和 `clock`函数是获取进程时间的两个重要工具。`times`函数提供了更详细的进程和子进程时间信息,而 `clock`函数则提供了更简单的处理器时间获取方法。根据具体需求选择合适的函数,可以更有效地进行性能分析和资源管理。通过本文的介绍,希望能帮助您更好地理解和使用这两个函数,提高嵌入式系统编程的效率和效果。
135 13
|
3月前
|
SQL 运维 监控
南大通用GBase 8a MPP Cluster Linux端SQL进程监控工具
南大通用GBase 8a MPP Cluster Linux端SQL进程监控工具
|
3月前
|
算法 Linux 调度
深入理解Linux操作系统的进程管理
本文旨在探讨Linux操作系统中的进程管理机制,包括进程的创建、执行、调度和终止等环节。通过对Linux内核中相关模块的分析,揭示其高效的进程管理策略,为开发者提供优化程序性能和资源利用率的参考。
132 1