Linux中fork()函数的底层实现【转】

简介: 转自:http://blog.csdn.net/duoru_xiong/article/details/76358812 1. fork(),vfork(),clone()的区别 这三个系统调用的底层都是通过do_fork()内核函数实现,只不过是通过对do_fork()传递的不同参数来实现不同的功能。

转自:http://blog.csdn.net/duoru_xiong/article/details/76358812

1. fork(),vfork(),clone()的区别

  • 这三个系统调用的底层都是通过do_fork()内核函数实现,只不过是通过对do_fork()传递的不同参数来实现不同的功能。
  • 其中参数clone_flags由两部分组成,其最低的字节为信号类型,用以规定子进程去世时应该向父进程发出的信号;第二部分是一些表示资源和特性的标志位,来标识对于父进程的资源是拷贝还是通过指针共享。
  • fork(),这些标志全为0,表示要全部拷贝;vfork(),则是父、子进程公用虚存空间;clone(),由调用者设定并作为参数传递。

所以,fork()创建进程;vfork()是创建的线程,它是创建进程的中间步骤,如若创建进程后会直接调用exec(),则可用vfork()来减少不必要的拷贝;clone()创建线程,可以是内核线程,也可以是用户线程。

2. fork()的底层实现

  • fork()是通过调用do_fork()内核函数来实现的,在do_fork()中,通过查找位图,为子进程分配新的pid参数,再通过copy_process()复制父进程的PCB以及资源,最后检查clone_flags中CLONE_STOPPED是否被设置,如若未设置,将子进程先于父进程插于运行队列并唤醒,fork()完成。
  • 在这些步骤中,copy_proceee()完成fork()大部分任务,其中dup_task_struct()完成子进程在内核分空间分配以及对父进程task_struct,thread_info的拷贝,并使这两部分互指;在检查一系列clone_flags之后确定拷贝父进程的哪些资源:

    if ((retval = copy_semundo(clone_flags, p)))
        goto bad_fork_cleanup_audit;
    if ((retval = copy_files(clone_flags, p)))
        goto bad_fork_cleanup_semundo;
    if ((retval = copy_fs(clone_flags, p)))
        goto bad_fork_cleanup_files;
    if ((retval = copy_sighand(clone_flags, p)))
        goto bad_fork_cleanup_fs;
    if ((retval = copy_signal(clone_flags, p)))
        goto bad_fork_cleanup_sighand;
    if ((retval = copy_mm(clone_flags, p)))
        goto bad_fork_cleanup_signal;
    if ((retval = copy_keys(clone_flags, p)))
        goto bad_fork_cleanup_mm;
    if ((retval = copy_namespace(clone_flags, p)))
        goto bad_fork_cleanup_keys;
    retval = copy_thread(0, clone_flags, stack_start, stack_size, p, regs);

    在此之后,设置子进程的状态,各个字段,并将其插入进程链表,copy_process()完成任务。
    在以上拷贝资源的内核函数中,最为重要的是copy_mm()以及copy_thread(),copy_mm()完成的是对父进程虚存空间的拷贝,而copy_thread()通过eax寄存器将子进程返回值强制置为0并初始化子进程内核栈。
    copy_mm()内核函数:
    (1)先完成对子进程mm_struct的拷贝:

    struct mm_struct * mm, *oldmm;
    int retval;

    tsk->min_flt = tsk->maj_flt = 0;
    tsk->nvcsw = tsk->nivcsw = 0;

    tsk->mm = NULL;
    tsk->active_mm = NULL;


  (2)判断是否是内核线程:

    if (!oldmm)
        return 0;


  (3)通过clone_flags标志位确定是否需要拷贝虚存空间:


    if (clone_flags & CLONE_VM) {//有标志位,共享父进程空间
        atomic_inc(&oldmm->mm_users);
        mm = oldmm;
        spin_unlock_wait(&oldmm->page_table_lock);
        goto good_mm;
    }
    //没有CLONE_VM标志,就必须创建一个新的地址空间。必须要有地址空间,即使此时并没有分配内存。
    retval = -ENOMEM;
    //分配一个新的内存描述符。把它的地址存放在新进程的mm中。
    mm = allocate_mm();
    if (!mm)
        goto fail_nomem;
    //并从当前进程复制mm的内容。
    memcpy(mm, oldmm, sizeof(*mm));
    if (!mm_init(mm))
        goto fail_nomem;

    ......

    //dup_mmap不但复制了线程区和页表,也设置了mm的一些属性.
    //它也会改变父进程的私有,可写的页为只读的,以使写时复制机制生效。
    retval = dup_mmap(mm, oldmm);
    if (retval)
        goto free_pt;


  至此,copy_mm()对父进程资源拷贝完毕。

 

fork()底层流程图如下:
这里写图片描述

PS:终于码完…第一篇博客, 如若有什么错误,欢迎大家指正,请将错误发送至xiongduoru@163.com,谢谢~

【作者】 张昺华
【新浪微博】 张昺华--sky
【twitter】 @sky2030_
【facebook】 张昺华 zhangbinghua
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利.
目录
相关文章
|
16天前
|
Linux
【Linux】System V信号量详解以及semget()、semctl()和semop()函数讲解
System V信号量的概念及其在Linux中的使用,包括 `semget()`、`semctl()`和 `semop()`函数的具体使用方法。通过实际代码示例,演示了如何创建、初始化和使用信号量进行进程间同步。掌握这些知识,可以有效解决多进程编程中的同步问题,提高程序的可靠性和稳定性。
65 19
|
18天前
|
Linux Android开发 开发者
linux m、mm、mmm函数和make的区别
通过理解和合理使用这些命令,可以更高效地进行项目构建和管理,特别是在复杂的 Android 开发环境中。
52 18
|
26天前
|
存储 监控 Linux
嵌入式Linux系统编程 — 5.3 times、clock函数获取进程时间
在嵌入式Linux系统编程中,`times`和 `clock`函数是获取进程时间的两个重要工具。`times`函数提供了更详细的进程和子进程时间信息,而 `clock`函数则提供了更简单的处理器时间获取方法。根据具体需求选择合适的函数,可以更有效地进行性能分析和资源管理。通过本文的介绍,希望能帮助您更好地理解和使用这两个函数,提高嵌入式系统编程的效率和效果。
94 13
|
3月前
|
消息中间件 存储 Linux
Linux手账—exec和fork
本文介绍了Linux系统中进程控制的核心功能——`fork`和`exec`系列函数。`fork`用于创建新进程(子进程),继承父进程的资源但拥有独立的地址空间;`exec`系列函数则在当前进程中执行新程序,替换原有地址空间。文章详细解析了这些函数的基本概念、用法及工作原理,强调了它们在多进程编程中的重要性。
59 0
|
4月前
|
Linux Shell
Linux系统编程:掌握popen函数的使用
记得在使用完 `popen`打开的流后,总是使用 `pclose`来正确关闭它,并回收资源。这种做法符合良好的编程习惯,有助于保持程序的健壮性和稳定性。
191 6
|
4月前
|
Linux Shell
Linux系统编程:掌握popen函数的使用
记得在使用完 `popen`打开的流后,总是使用 `pclose`来正确关闭它,并回收资源。这种做法符合良好的编程习惯,有助于保持程序的健壮性和稳定性。
203 3
|
4月前
|
Linux
在Linux内核中根据函数指针输出函数名称
在Linux内核中根据函数指针输出函数名称
|
5月前
|
Linux PHP
Linux CentOS 宝塔 Suhosin禁用php5.6版本eval函数详细图文教程
【8月更文挑战第27天】本文介绍两种禁用PHP执行的方法:使用`PHP_diseval_extension`禁用和通过`suhosin`禁用。由于`suhosin`不支持PHP8,仅适用于PHP7及以下版本,若服务器安装了PHP5.6,则需对应安装`suhosin-0.9.38`版本。文章提供了详细的安装步骤,并强调了宝塔环境下与普通环境下的PHP路径差异。安装完成后,在`php.ini`中添加`suhosin.so`扩展并设置`executor.disable_eval = on`以禁用执行功能。最后通过测试代码验证是否成功禁用,并重启`php-fpm`服务生效。
78 2
|
5月前
|
Shell Linux C语言
Linux0.11 execve函数(六)
Linux0.11 execve函数(六)
103 1
|
5月前
|
Linux API
Linux源码阅读笔记07-进程管理4大常用API函数
Linux源码阅读笔记07-进程管理4大常用API函数