1.守护进程、线程
1.1 进程组和会话
1.1.1 概念和特性
进程组,也称之为作业。BSD于1980年前后向Unix中增加的一个新特性。代表一个或多个进程的集合。每个进程都属于一个进程组。在waitpid函数和kill函数的参数中都曾使用到。操作系统设计的进程组的概念,是为了简化对多个进程的管理。
当父进程,创建子进程的时候,默认子进程与父进程属于同一进程组。进程组ID等价于第一个进程ID(组长进程)。所以,组长进程标识:其进程组ID==其进程ID
可以使用kill -SIGKILL -进程组ID(负的)来将整个进程组内的进程全部杀死。
组长进程可以创建一个进程组,创建该进程组中的进程,然后终止。只要进程组中有一个进程存在,进程组就存在,与组长进程是否终止无关。
进程组生存期:进程组创建到最后一个进程离开(终止或转移到另一个进程组)。 一个进程可以为自己或子进程设置进程组ID
1.1.2 创建会话
创建一个会话需要注意以下6点注意事项:
1.进程组组长不能创建会话,非组长进程创建会话后变成新会话首进程(session header)
2.该进程成为一个新进程组的组长进程。
3.需有root权限 (ubuntu不需要)
4.新会话丢弃原有的控制终端,该会话没有控制终端
5.该调用进程是组长进程,则出错返回
6.建立新会话时,先调用fork, 父进程终止,子进程调用setsid
使用下面两个函数,建立新会话时,先调用fork, 父进程终止,子进程调用setsid #include <stdio.h> #include <stdlib.h> #include <unistd.h> int main(void){ pid_t pid; if((pid = fork())<0){ perror("fork"); exit(1); }else if(pid == 0){ printf("child process PID is %d\n",getpid()); printf("Group ID of child is %d\n",getpgid(0)); printf("Session ID of child is %d\n",getsid(0)); sleep(10); setsid(); printf("Changed:\n"); printf("child process PID is %d\n",getpid()); printf("Group ID of child is %d\n",getpgid(0)); printf("Session ID of child is %d\n",getsid(0)); sleep(20); exit(0); } return 0; }
1.1.3 getsid函数
获取进程所属的会话ID
pid_t getsid(pid_t pid); 成功:返回调用进程的会话ID; 失败:-1,设置errno pid为0表示察看当前进程session ID
命令查看系统中的进程
ps ajx 参数a表示不仅列当前用户的进程,也列出所有其他用户的进程 参数x表示不仅列有控制终端的进程,也列出所有无控制终端的进程 参数j表示列出与作业控制相关的信息。
组长进程不能成为新会话首进程,新会话首进程必定会成为组长进程。
1.1.4 setsid函数
创建一个会话,并以自己的ID设置进程组ID,同时也是新会话的ID。
pid_t setsid(void); 成功:返回调用进程的会话ID; 失败:-1,设置errno
调用了setsid函数的进程,既是新的会长,也是新的组长。
1.2 守护进程
Daemon(精灵)进程,是Linux中的后台服务进程,通常独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。一般采用以d结尾的名字。
Linux后台的一些系统服务进程,没有控制终端,不能直接和用户交互。不受用户登录、注销的影响,一直在运行着,他们都是守护进程。如:预读入缓输出机制的实现;ftp服务器;nfs服务器等。
创建守护进程,最关键的一步是调用setsid函数创建一个新的Session,并成为Session Leader。
1.2.1 创建守护进程模型
1.创建子进程,父进程退出 所有工作在子进程中进行形式上脱离了控制终端 2.在子进程中创建新会话 setsid()函数 使子进程完全独立出来,脱离控制 3.改变当前目录为根目录 chdir()函数 防止占用可卸载的文件系统 也可以换成其它路径 4.重设文件权限掩码 umask()函数 防止继承的文件创建屏蔽字拒绝某些权限 增加守护进程灵活性 5.关闭文件描述符 继承的打开文件不会用到,浪费系统资源,无法卸载 6.开始执行守护进程核心工作守护进程退出处理程序模型 【mydaemond.c】 #include <stdio.h> #include <stdlib.h> #include <string.h> #include <unistd.h> #include <errno.h> #include <pthread.h> #include <fcntl.h> #include <sys/stat.h> void sys_err(const char *str) { perror(str); exit(1); } int main(int argc,char *argv[]) { pid_t pid; int ret; pid = fork(); if(pid>0) exit(0); pid = setsid(); if(pid == -1) sys_err("setsid error"); ret = chdir("/home/book/test/06_session"); if(ret == -1){ sys_err("chdir error"); } umask(0022); close(STDIN_FILENO); int fd = open("/dev/null",O_RDWR); if(fd == -1) sys_err("open error"); dup2(fd,STDOUT_FILENO); dup2(fd,STDERR_FILENO); while(1); return 0; }
1.3 线程概念
1.3.1 什么是线程
LWP:light weight process 轻量级的进程,本质仍是进程(在Linux环境下)
进程:独立地址空间,拥有PCB
线程:有独立的PCB,但没有独立的地址空间(共享)
区别:在于是否共享地址空间。 独居(进程);合租(线程)。
Linux下:
-------------线程:最小的执行单位
-------------进程:最小分配资源单位,可看成是只有一个线程的进程。
1.3.2 linux内核线程实现原理
类Unix系统中,早期是没有“线程”概念的,80年代才引入,借助进程机制实现出了线程的概念。因此在这类系统中,进程和线程关系密切。
轻量级进程(light-weight process),也有PCB,创建线程使用的底层函数和进程一样,都是clone
从内核里看进程和线程是一样的,都有各自不同的PCB,但是PCB中指向内存资源的三级页表是相同的
进程可以蜕变成线程
线程可看做寄存器和栈的集合
在linux下,线程最是小的执行单位;进程是最小的分配资源单位
察看LWP号:
ps –Lf pid
查看指定线程的lwp号。
三级映射:进程PCB --> 页目录(可看成数组,首地址位于PCB中) --> 页表 --> 物理页面 --> 内存单元
参考:《Linux内核源代码情景分析》 ----毛德操
对于进程来说,相同的地址(同一个虚拟地址)在不同的进程中,反复使用而不冲突。原因是他们虽虚拟址一样,但,页目录、页表、物理页面各不相同。相同的虚拟址,映射到不同的物理页面内存单元,最终访问不同的物理页面。
但!线程不同!两个线程具有各自独立的PCB,但共享同一个页目录,也就共享同一个页表和物理页面。所以两个PCB共享一个地址空间。
实际上,无论是创建进程的fork,还是创建线程的pthread_create,底层实现都是调用同一个内核函数clone。
如果复制对方的地址空间,那么就产出一个“进程”;如果共享对方的地址空间,就产生一个“线程”。
因此:Linux内核是不区分进程和线程的。只在用户层面上进行区分。所以,线程所有操作函数 pthread_* 是库函数,而非系统调用。
1.3.3 线程共享资源
1.文件描述符表
2.每种信号的处理方式
3.当前工作目录
4.用户ID和组ID
5.内存地址空间 (.text/.data/.bss/heap/共享库)
1.3.4 线程非共享资源
1.线程id
2.处理器现场和栈指针(内核栈)
3.独立的栈空间(用户空间栈)
4.errno变量
5.信号屏蔽字
6.调度优先级
1.3.5 线程优缺点
优点:
提高程序并发性
开销小
数据通信、共享数据方便
缺点:
库函数,不稳定
调试、编写困难、gdb不支持
对信号支持不好 优点相对突出,缺点均不是硬伤。 Linux下由于实现方法导致进程、线程差别不是很大。
1.4 线程控制原语
1.4.1 pthread_self函数
获取线程ID。其作用对应进程中 getpid() 函数。
pthread_t pthread_self(void); 返回值: 成功:0; 失败:无! 线程ID:pthread_t类型,本质:在Linux下为无符号整数(%lu),其他系统中可能是结构体实现 线程ID是进程内部,识别标志。(两个进程间,线程ID允许相同)
注意:可以通过pthread_create传出参数来获取线程ID。
1.4.2 pthread_create 函数
创建一个新线程。 其作用,对应进程中fork() 函数。
int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *(*start_routine) (void *), void *arg); 返回值: 成功:0; 失败:错误号 -----Linux环境下,所有线程特点,失败均直接返回错误号。 参数: pthread_t:当前Linux中可理解为:typedef unsigned long int pthread_t; 参数1:传出参数,保存系统为我们分配好的线程ID 参数2:通常传NULL,表示使用线程默认属性。若想使用具体属性也可以修改该参数。 参数3:函数指针,指向线程主函数(线程体),该函数运行结束,则线程结束。 参数4:线程主函数执行期间所使用的参数。
在一个线程中调用pthread_create()创建新的线程后,当前线程从pthread_create()返回继续往下执行,而新的线程所执行的代码由我们传给pthread_create的函数指针start_routine决定。start_routine函数接收一个参数,是通过pthread_create的arg参数传递给它的,该参数的类型为void *,这个指针按什么类型解释由调用者自己定义。start_routine的返回值类型也是void *,这个指针的含义同样由调用者自己定义。start_routine返回时,这个线程就退出了,其它线程可以调用pthread_join得到start_routine的返回值,类似于父进程调用wait(2)得到子进程的退出状态,稍后详细介绍pthread_join。 pthread_create成功返回后,新创建的线程的id被填写到thread参数所指向的内存单元。我们知道进程id的类型是pid_t,每个进程的id在整个系统中是唯一的,调用getpid(2)可以获得当前进程的id,是一个正整数值。线程id的类型是thread_t,它只在当前进程中保证是唯一的,在不同的系统中thread_t这个类型有不同的实现,它可能是一个整数值,也可能是一个结构体,也可能是一个地址,所以不能简单地当成整数用printf打印,调用pthread_self(3)可以获得当前线程的id。
attr参数表示线程属性,本节不深入讨论线程属性,所有代码例子都传NULL给attr参数,表示线程属性取缺省值,感兴趣的读者可以参考APUE。