linux系统编程(十)守护进程、线程(上)

简介: linux系统编程(十)守护进程、线程

1.守护进程、线程


1.1 进程组和会话

1670992549696.jpg


1.1.1 概念和特性


进程组,也称之为作业。BSD于1980年前后向Unix中增加的一个新特性。代表一个或多个进程的集合。每个进程都属于一个进程组。在waitpid函数和kill函数的参数中都曾使用到。操作系统设计的进程组的概念,是为了简化对多个进程的管理。


当父进程,创建子进程的时候,默认子进程与父进程属于同一进程组。进程组ID等价于第一个进程ID(组长进程)。所以,组长进程标识:其进程组ID==其进程ID

可以使用kill -SIGKILL -进程组ID(负的)来将整个进程组内的进程全部杀死。


组长进程可以创建一个进程组,创建该进程组中的进程,然后终止。只要进程组中有一个进程存在,进程组就存在,与组长进程是否终止无关。


进程组生存期:进程组创建到最后一个进程离开(终止或转移到另一个进程组)。 一个进程可以为自己或子进程设置进程组ID


1.1.2 创建会话


创建一个会话需要注意以下6点注意事项:


1.进程组组长不能创建会话,非组长进程创建会话后变成新会话首进程(session header)

2.该进程成为一个新进程组的组长进程。

3.需有root权限 (ubuntu不需要)

4.新会话丢弃原有的控制终端,该会话没有控制终端

5.该调用进程是组长进程,则出错返回

6.建立新会话时,先调用fork, 父进程终止,子进程调用setsid


使用下面两个函数,建立新会话时,先调用fork, 父进程终止,子进程调用setsid
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
int main(void){
  pid_t pid;
  if((pid = fork())<0){
  perror("fork");
  exit(1);
  }else if(pid == 0){
  printf("child process PID is %d\n",getpid());
  printf("Group ID of child is %d\n",getpgid(0));
  printf("Session ID of child is %d\n",getsid(0));
  sleep(10);
  setsid();
  printf("Changed:\n");
  printf("child process PID is %d\n",getpid());
  printf("Group ID of child is %d\n",getpgid(0));
  printf("Session ID of child is %d\n",getsid(0));    
  sleep(20);
  exit(0);
  }
  return 0;
}


1.1.3 getsid函数


获取进程所属的会话ID

pid_t getsid(pid_t pid); 
成功:返回调用进程的会话ID;
失败:-1,设置errno
pid为0表示察看当前进程session ID

命令查看系统中的进程

ps ajx
参数a表示不仅列当前用户的进程,也列出所有其他用户的进程
参数x表示不仅列有控制终端的进程,也列出所有无控制终端的进程
参数j表示列出与作业控制相关的信息。


组长进程不能成为新会话首进程,新会话首进程必定会成为组长进程。


1.1.4 setsid函数


创建一个会话,并以自己的ID设置进程组ID,同时也是新会话的ID。

pid_t setsid(void);  
成功:返回调用进程的会话ID;
失败:-1,设置errno


调用了setsid函数的进程,既是新的会长,也是新的组长。


1.2 守护进程


Daemon(精灵)进程,是Linux中的后台服务进程,通常独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。一般采用以d结尾的名字。


Linux后台的一些系统服务进程,没有控制终端,不能直接和用户交互。不受用户登录、注销的影响,一直在运行着,他们都是守护进程。如:预读入缓输出机制的实现;ftp服务器;nfs服务器等。

创建守护进程,最关键的一步是调用setsid函数创建一个新的Session,并成为Session Leader。


1.2.1 创建守护进程模型

1.创建子进程,父进程退出
所有工作在子进程中进行形式上脱离了控制终端
2.在子进程中创建新会话
    setsid()函数
    使子进程完全独立出来,脱离控制
3.改变当前目录为根目录
    chdir()函数
    防止占用可卸载的文件系统
    也可以换成其它路径
4.重设文件权限掩码
    umask()函数
    防止继承的文件创建屏蔽字拒绝某些权限
    增加守护进程灵活性
5.关闭文件描述符
    继承的打开文件不会用到,浪费系统资源,无法卸载
6.开始执行守护进程核心工作守护进程退出处理程序模型                                               
【mydaemond.c】
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <errno.h>
#include <pthread.h>
#include <fcntl.h>
#include <sys/stat.h>
void sys_err(const char *str)
{
    perror(str);
    exit(1);
}
int main(int argc,char *argv[])
{
    pid_t pid;
    int ret;
    pid = fork();
    if(pid>0)
  exit(0);
    pid = setsid();
    if(pid == -1)
  sys_err("setsid error");
    ret = chdir("/home/book/test/06_session");
    if(ret == -1){
  sys_err("chdir error");
    }
    umask(0022);
    close(STDIN_FILENO);
    int fd = open("/dev/null",O_RDWR);
    if(fd == -1)
  sys_err("open error");
    dup2(fd,STDOUT_FILENO);
    dup2(fd,STDERR_FILENO);
    while(1);
    return 0;
}

1.3 线程概念


1.3.1 什么是线程

1670992660625.jpg

LWP:light weight process 轻量级的进程,本质仍是进程(在Linux环境下)

进程:独立地址空间,拥有PCB

线程:有独立的PCB,但没有独立的地址空间(共享)

区别:在于是否共享地址空间。 独居(进程);合租(线程)。


Linux下:

-------------线程:最小的执行单位

-------------进程:最小分配资源单位,可看成是只有一个线程的进程。


1.3.2 linux内核线程实现原理


类Unix系统中,早期是没有“线程”概念的,80年代才引入,借助进程机制实现出了线程的概念。因此在这类系统中,进程和线程关系密切。


轻量级进程(light-weight process),也有PCB,创建线程使用的底层函数和进程一样,都是clone

从内核里看进程和线程是一样的,都有各自不同的PCB,但是PCB中指向内存资源的三级页表是相同的

进程可以蜕变成线程

线程可看做寄存器和栈的集合

在linux下,线程最是小的执行单位;进程是最小的分配资源单位

察看LWP号:

ps –Lf pid 查看指定线程的lwp号。

1670992755862.jpg

三级映射:进程PCB --> 页目录(可看成数组,首地址位于PCB中) --> 页表 --> 物理页面 --> 内存单元

参考:《Linux内核源代码情景分析》 ----毛德操

1670992773187.jpg

对于进程来说,相同的地址(同一个虚拟地址)在不同的进程中,反复使用而不冲突。原因是他们虽虚拟址一样,但,页目录、页表、物理页面各不相同。相同的虚拟址,映射到不同的物理页面内存单元,最终访问不同的物理页面。

但!线程不同!两个线程具有各自独立的PCB,但共享同一个页目录,也就共享同一个页表和物理页面。所以两个PCB共享一个地址空间。

实际上,无论是创建进程的fork,还是创建线程的pthread_create,底层实现都是调用同一个内核函数clone。

如果复制对方的地址空间,那么就产出一个“进程”;如果共享对方的地址空间,就产生一个“线程”。

因此:Linux内核是不区分进程和线程的。只在用户层面上进行区分。所以,线程所有操作函数 pthread_* 是库函数,而非系统调用。


1.3.3 线程共享资源


1.文件描述符表

2.每种信号的处理方式

3.当前工作目录

4.用户ID和组ID

5.内存地址空间 (.text/.data/.bss/heap/共享库)


1.3.4 线程非共享资源


1.线程id

2.处理器现场和栈指针(内核栈)

3.独立的栈空间(用户空间栈)

4.errno变量

5.信号屏蔽字

6.调度优先级


1.3.5 线程优缺点


优点:

提高程序并发性

开销小

数据通信、共享数据方便


缺点:

库函数,不稳定

调试、编写困难、gdb不支持

对信号支持不好 优点相对突出,缺点均不是硬伤。 Linux下由于实现方法导致进程、线程差别不是很大。


1.4 线程控制原语


1.4.1 pthread_self函数


获取线程ID。其作用对应进程中 getpid() 函数。

pthread_t pthread_self(void); 
返回值:
成功:0; 
失败:无!
  线程ID:pthread_t类型,本质:在Linux下为无符号整数(%lu),其他系统中可能是结构体实现
  线程ID是进程内部,识别标志。(两个进程间,线程ID允许相同)


注意:可以通过pthread_create传出参数来获取线程ID。


1.4.2 pthread_create 函数


创建一个新线程。 其作用,对应进程中fork() 函数。

int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *(*start_routine) (void *), void *arg);
返回值:
  成功:0; 
  失败:错误号  -----Linux环境下,所有线程特点,失败均直接返回错误号。
参数: 
  pthread_t:当前Linux中可理解为:typedef  unsigned long int  pthread_t;
  参数1:传出参数,保存系统为我们分配好的线程ID
  参数2:通常传NULL,表示使用线程默认属性。若想使用具体属性也可以修改该参数。
  参数3:函数指针,指向线程主函数(线程体),该函数运行结束,则线程结束。
  参数4:线程主函数执行期间所使用的参数。


在一个线程中调用pthread_create()创建新的线程后,当前线程从pthread_create()返回继续往下执行,而新的线程所执行的代码由我们传给pthread_create的函数指针start_routine决定。start_routine函数接收一个参数,是通过pthread_create的arg参数传递给它的,该参数的类型为void *,这个指针按什么类型解释由调用者自己定义。start_routine的返回值类型也是void *,这个指针的含义同样由调用者自己定义。start_routine返回时,这个线程就退出了,其它线程可以调用pthread_join得到start_routine的返回值,类似于父进程调用wait(2)得到子进程的退出状态,稍后详细介绍pthread_join。 pthread_create成功返回后,新创建的线程的id被填写到thread参数所指向的内存单元。我们知道进程id的类型是pid_t,每个进程的id在整个系统中是唯一的,调用getpid(2)可以获得当前进程的id,是一个正整数值。线程id的类型是thread_t,它只在当前进程中保证是唯一的,在不同的系统中thread_t这个类型有不同的实现,它可能是一个整数值,也可能是一个结构体,也可能是一个地址,所以不能简单地当成整数用printf打印,调用pthread_self(3)可以获得当前线程的id。

attr参数表示线程属性,本节不深入讨论线程属性,所有代码例子都传NULL给attr参数,表示线程属性取缺省值,感兴趣的读者可以参考APUE。

相关文章
|
6天前
|
Linux
Linux系统之whereis命令的基本使用
Linux系统之whereis命令的基本使用
50 23
Linux系统之whereis命令的基本使用
|
3天前
|
存储 网络协议 Linux
【Linux】进程IO|系统调用|open|write|文件描述符fd|封装|理解一切皆文件
本文详细介绍了Linux中的进程IO与系统调用,包括 `open`、`write`、`read`和 `close`函数及其用法,解释了文件描述符(fd)的概念,并深入探讨了Linux中的“一切皆文件”思想。这种设计极大地简化了系统编程,使得处理不同类型的IO设备变得更加一致和简单。通过本文的学习,您应该能够更好地理解和应用Linux中的进程IO操作,提高系统编程的效率和能力。
50 34
|
6天前
|
Linux
Linux编程: 在业务线程中注册和处理Linux信号
本文详细介绍了如何在Linux中通过在业务线程中注册和处理信号。我们讨论了信号的基本概念,并通过完整的代码示例展示了在业务线程中注册和处理信号的方法。通过正确地使用信号处理机制,可以提高程序的健壮性和响应能力。希望本文能帮助您更好地理解和应用Linux信号处理,提高开发效率和代码质量。
38 17
|
15天前
|
Linux
Linux编程: 在业务线程中注册和处理Linux信号
通过本文,您可以了解如何在业务线程中注册和处理Linux信号。正确处理信号可以提高程序的健壮性和稳定性。希望这些内容能帮助您更好地理解和应用Linux信号处理机制。
50 26
|
7天前
|
消息中间件 Linux C++
c++ linux通过实现独立进程之间的通信和传递字符串 demo
的进程间通信机制,适用于父子进程之间的数据传输。希望本文能帮助您更好地理解和应用Linux管道,提升开发效率。 在实际开发中,除了管道,还可以根据具体需求选择消息队列、共享内存、套接字等其他进程间通信方
39 16
|
1月前
|
缓存 安全 Linux
Linux系统查看操作系统版本信息、CPU信息、模块信息
在Linux系统中,常用命令可帮助用户查看操作系统版本、CPU信息和模块信息
109 23
|
1月前
|
消息中间件 Linux
Linux:进程间通信(共享内存详细讲解以及小项目使用和相关指令、消息队列、信号量)
通过上述讲解和代码示例,您可以理解和实现Linux系统中的进程间通信机制,包括共享内存、消息队列和信号量。这些机制在实际开发中非常重要,能够提高系统的并发处理能力和数据通信效率。希望本文能为您的学习和开发提供实用的指导和帮助。
117 20
|
2月前
|
存储 监控 Linux
嵌入式Linux系统编程 — 5.3 times、clock函数获取进程时间
在嵌入式Linux系统编程中,`times`和 `clock`函数是获取进程时间的两个重要工具。`times`函数提供了更详细的进程和子进程时间信息,而 `clock`函数则提供了更简单的处理器时间获取方法。根据具体需求选择合适的函数,可以更有效地进行性能分析和资源管理。通过本文的介绍,希望能帮助您更好地理解和使用这两个函数,提高嵌入式系统编程的效率和效果。
121 13
|
3天前
|
Python
python3多线程中使用线程睡眠
本文详细介绍了Python3多线程编程中使用线程睡眠的基本方法和应用场景。通过 `time.sleep()`函数,可以使线程暂停执行一段指定的时间,从而控制线程的执行节奏。通过实际示例演示了如何在多线程中使用线程睡眠来实现计数器和下载器功能。希望本文能帮助您更好地理解和应用Python多线程编程,提高程序的并发能力和执行效率。
32 20
|
9天前
|
安全 Java C#
Unity多线程使用(线程池)
在C#中使用线程池需引用`System.Threading`。创建单个线程时,务必在Unity程序停止前关闭线程(如使用`Thread.Abort()`),否则可能导致崩溃。示例代码展示了如何创建和管理线程,确保在线程中执行任务并在主线程中处理结果。完整代码包括线程池队列、主线程检查及线程安全的操作队列管理,确保多线程操作的稳定性和安全性。

热门文章

最新文章