linux的进程树

简介:
linux的树形进程结构为管理进程提供了很大的方便,不管是内核对进程的管理还是用户对进程的管理都受惠不少,对于审计也是很有用的,不管运行的什么进程,都会有一条不会断的线索将之绑在系统内部。整个系统的情况就是首先内核启动,接着内核线程0派生出init,然后init派生出万物,有点像上帝造人...不过如果你是撒旦,那么你可以将进程脱离出这个线索,只和调度的相关链表或者树联系,这样你的进程就成了完全的不受控体,同时也成了真正的孤儿,再没有人收养的孤儿。
     backtrace或者gdb coredump可以得到函数调用堆栈,冯氏机器上,堆栈都是线性堆积的,而进程之间却可以分时运行(并发机器和冯诺依曼机器是不同的两种类型,当前的OS实现都是在冯氏机器上模拟并发的,这就是分时),因此如果将硬件机器看作一个平台的话,所有的进程则组成了一棵树,类似backtrace,可以借助操作系统的支持得到当前进程的调用进程,也就是父进程,在linux上,利用proc文件系统很方便的实现。以下的代码可以得到一个shell脚本的调用者的进程pid和进程名字,同样的代码可以在c中实现,只是将$$换成getpid即可
pid=$$
name=`cat /proc/$pid/stat |awk '{print $2}'`
ppid=`cat /proc/$pid/stat |awk  '{print $4}'`
pname=`cat /proc/$ppid/stat |awk '{print $2}'`
#至此name表示当前shell的名称,而pname则是调用者的名称,pid为当前shell的pid,ppid为其调用者的pid(注意,若使用这几行代码,shell脚本的第一行最好是严格的#!/bin/bash,否则脚本将由bash逐行执行,父进程的名称也就一直都是bash)。如何能像pstree命令那样列出系统所有进程的关系,strace pstree之后发现,pstree其实就是读取的/proc文件系统的信息,然后自己将之组织在了一起,linux内核在/proc/pid/stat文件中导出了不少有用的信息,其中就包含有父进程的信息,参见关于/proc/pid/stat的内核函数(位于fs/proc/array.c): 
static int do_task_stat(struct task_struct *task, char * buffer, int whole)
{
    ...
    ppid = pid_alive(task) ? task->group_leader->real_parent->tgid : 0;
    ...
    res = sprintf(buffer,"%d (%s) %c %d %d %d %d %d %lu %lu /
%lu %lu %lu %lu %lu %ld %ld %ld %ld %d 0 %llu %lu %ld %lu %lu %lu %lu %lu /
%lu %lu %lu %lu %lu %lu %lu %lu %d %d %lu %lu %llu/n",
        task->pid,   //导出自己的pid
        tcomm,         //导出进程名字
        state,         //导出进程状态
        ppid,         //导出父进程pid
        ...
        );
    ...
}
因此我们只需要查找/proc/pid/stat的第四个字段即可,也就有了上面的脚本。接下来看一下pstree的原理,既然能找到任意进程父进程并且linux下的所有进程都是同根的,那么只需要将所有进程连接起来即可,我们有等价的两种方式,这些方式中都毫不吝啬的使用了大数组,丝毫不在乎空间复杂度,旨在揭示原理而不考虑别的:
方式1:int proc[32768][32768]; //横向为进程pid,纵向为进程的父进程的pid
方式2:int proc[32768]; //数组元素的索引是进程的pid,其值是父进程的pid
int main(int argc, char **argv)
{
        FILE *fp, *fpp;
        FILE *fp = popen ("ls /proc/ |egrep '^[0-9]+$'", "r");
        fread (buf, 1024, 1, fp);
        foreach (i, buf) {
                fpp = popen("cat /proc/i/stat|awk '{print $4}'", "r");
                read (ppid);
                方式1:proc[i][ppid] = 1;
                方式2:proc[i] = ppid;
        }
        return 0;
}
如此,所有的进程就联系了起来。最后看一下导出进程状态的位图也是不错的:
static const char *task_state_array[] = {  
    "R (running)",        /*  0 */
    "S (sleeping)",        /*  1 */
    "D (disk sleep)",    /*  2 */
    "T (stopped)",        /*  4 */
    "T (tracing stop)",    /*  8 */
    "Z (zombie)",        /* 16 */
    "X (dead)"        /* 32 */
};
//将进程状态设计成简单的向左移位拥有好多好处,最重要的一点是,进程状态的转换过程就是状态机的转换过程,简单的移位可以使得进程状态排他,转换简便,向左移位移位着同样可以不影响其它的向右移位
static inline const char * get_task_state(struct task_struct *tsk)
{
    unsigned int state = (tsk->state & (TASK_RUNNING |   //每个进程每一时刻仅可处于一个状态,这就是排他性
                        TASK_INTERRUPTIBLE |
                        TASK_UNINTERRUPTIBLE |
                        TASK_STOPPED |
                        TASK_TRACED)) |
            (tsk->exit_state & (EXIT_ZOMBIE |
                        EXIT_DEAD));
    const char **p = &task_state_array[0];
    while (state) {
        p++;
        state >>= 1;   //state中的1相对最右边的位置的差决定了进程状态时第几个元素
    }
    return *p;

}



 本文转自 dog250 51CTO博客,原文链接:http://blog.51cto.com/dog250/1271779

相关文章
|
存储 Linux API
【Linux进程概念】—— 操作系统中的“生命体”,计算机里的“多线程”
在计算机系统的底层架构中,操作系统肩负着资源管理与任务调度的重任。当我们启动各类应用程序时,其背后复杂的运作机制便悄然展开。程序,作为静态的指令集合,如何在系统中实现动态执行?本文带你一探究竟!
【Linux进程概念】—— 操作系统中的“生命体”,计算机里的“多线程”
|
算法 Linux 调度
深入理解Linux操作系统的进程管理
本文旨在探讨Linux操作系统中的进程管理机制,包括进程的创建、执行、调度和终止等环节。通过对Linux内核中相关模块的分析,揭示其高效的进程管理策略,为开发者提供优化程序性能和资源利用率的参考。
445 32
|
11月前
|
并行计算 Linux
Linux内核中的线程和进程实现详解
了解进程和线程如何工作,可以帮助我们更好地编写程序,充分利用多核CPU,实现并行计算,提高系统的响应速度和计算效能。记住,适当平衡进程和线程的使用,既要拥有独立空间的'兄弟',也需要在'家庭'中分享和并行的成员。对于这个世界,现在,你应该有一个全新的认识。
378 67
|
10月前
|
Web App开发 Linux 程序员
获取和理解Linux进程以及其PID的基础知识。
总的来说,理解Linux进程及其PID需要我们明白,进程就如同汽车,负责执行任务,而PID则是独特的车牌号,为我们提供了管理的便利。知道这个,我们就可以更好地理解和操作Linux系统,甚至通过对进程的有效管理,让系统运行得更加顺畅。
284 16
|
10月前
|
Unix Linux
对于Linux的进程概念以及进程状态的理解和解析
现在,我们已经了解了Linux进程的基础知识和进程状态的理解了。这就像我们理解了城市中行人的行走和行为模式!希望这个形象的例子能帮助我们更好地理解这个重要的概念,并在实际应用中发挥作用。
203 20
|
9月前
|
监控 Shell Linux
Linux进程控制(详细讲解)
进程等待是系统通过调用特定的接口(如waitwaitpid)来实现的。来进行对子进程状态检测与回收的功能。
215 0
|
9月前
|
存储 负载均衡 算法
Linux2.6内核进程调度队列
本篇文章是Linux进程系列中的最后一篇文章,本来是想放在上一篇文章的结尾的,但是想了想还是单独写一篇文章吧,虽然说这部分内容是比较难的,所有一般来说是简单的提及带过的,但是为了让大家对进程有更深的理解与认识,还是看了一些别人的文章,然后学习了学习,然后对此做了总结,尽可能详细的介绍明白。最后推荐一篇文章Linux的进程优先级 NI 和 PR - 简书。
286 0
|
9月前
|
存储 Linux Shell
Linux进程概念-详细版(二)
在Linux进程概念-详细版(一)中我们解释了什么是进程,以及进程的各种状态,已经对进程有了一定的认识,那么这篇文章将会继续补全上篇文章剩余没有说到的,进程优先级,环境变量,程序地址空间,进程地址空间,以及调度队列。
170 0
|
9月前
|
Linux 调度 C语言
Linux进程概念-详细版(一)
子进程与父进程代码共享,其子进程直接用父进程的代码,其自己本身无代码,所以子进程无法改动代码,平时所说的修改是修改的数据。为什么要创建子进程:为了让其父子进程执行不同的代码块。子进程的数据相对于父进程是会进行写时拷贝(COW)。
231 0
|
存储 网络协议 Linux
【Linux】进程IO|系统调用|open|write|文件描述符fd|封装|理解一切皆文件
本文详细介绍了Linux中的进程IO与系统调用,包括 `open`、`write`、`read`和 `close`函数及其用法,解释了文件描述符(fd)的概念,并深入探讨了Linux中的“一切皆文件”思想。这种设计极大地简化了系统编程,使得处理不同类型的IO设备变得更加一致和简单。通过本文的学习,您应该能够更好地理解和应用Linux中的进程IO操作,提高系统编程的效率和能力。
580 34