linux系统编程(十)守护进程、线程(上)

简介: linux系统编程(十)守护进程、线程

1.守护进程、线程


1.1 进程组和会话

1670992549696.jpg


1.1.1 概念和特性


进程组,也称之为作业。BSD于1980年前后向Unix中增加的一个新特性。代表一个或多个进程的集合。每个进程都属于一个进程组。在waitpid函数和kill函数的参数中都曾使用到。操作系统设计的进程组的概念,是为了简化对多个进程的管理。


当父进程,创建子进程的时候,默认子进程与父进程属于同一进程组。进程组ID等价于第一个进程ID(组长进程)。所以,组长进程标识:其进程组ID==其进程ID

可以使用kill -SIGKILL -进程组ID(负的)来将整个进程组内的进程全部杀死。


组长进程可以创建一个进程组,创建该进程组中的进程,然后终止。只要进程组中有一个进程存在,进程组就存在,与组长进程是否终止无关。


进程组生存期:进程组创建到最后一个进程离开(终止或转移到另一个进程组)。 一个进程可以为自己或子进程设置进程组ID


1.1.2 创建会话


创建一个会话需要注意以下6点注意事项:


1.进程组组长不能创建会话,非组长进程创建会话后变成新会话首进程(session header)

2.该进程成为一个新进程组的组长进程。

3.需有root权限 (ubuntu不需要)

4.新会话丢弃原有的控制终端,该会话没有控制终端

5.该调用进程是组长进程,则出错返回

6.建立新会话时,先调用fork, 父进程终止,子进程调用setsid


使用下面两个函数,建立新会话时,先调用fork, 父进程终止,子进程调用setsid
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
int main(void){
  pid_t pid;
  if((pid = fork())<0){
  perror("fork");
  exit(1);
  }else if(pid == 0){
  printf("child process PID is %d\n",getpid());
  printf("Group ID of child is %d\n",getpgid(0));
  printf("Session ID of child is %d\n",getsid(0));
  sleep(10);
  setsid();
  printf("Changed:\n");
  printf("child process PID is %d\n",getpid());
  printf("Group ID of child is %d\n",getpgid(0));
  printf("Session ID of child is %d\n",getsid(0));    
  sleep(20);
  exit(0);
  }
  return 0;
}


1.1.3 getsid函数


获取进程所属的会话ID

pid_t getsid(pid_t pid); 
成功:返回调用进程的会话ID;
失败:-1,设置errno
pid为0表示察看当前进程session ID

命令查看系统中的进程

ps ajx
参数a表示不仅列当前用户的进程,也列出所有其他用户的进程
参数x表示不仅列有控制终端的进程,也列出所有无控制终端的进程
参数j表示列出与作业控制相关的信息。


组长进程不能成为新会话首进程,新会话首进程必定会成为组长进程。


1.1.4 setsid函数


创建一个会话,并以自己的ID设置进程组ID,同时也是新会话的ID。

pid_t setsid(void);  
成功:返回调用进程的会话ID;
失败:-1,设置errno


调用了setsid函数的进程,既是新的会长,也是新的组长。


1.2 守护进程


Daemon(精灵)进程,是Linux中的后台服务进程,通常独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。一般采用以d结尾的名字。


Linux后台的一些系统服务进程,没有控制终端,不能直接和用户交互。不受用户登录、注销的影响,一直在运行着,他们都是守护进程。如:预读入缓输出机制的实现;ftp服务器;nfs服务器等。

创建守护进程,最关键的一步是调用setsid函数创建一个新的Session,并成为Session Leader。


1.2.1 创建守护进程模型

1.创建子进程,父进程退出
所有工作在子进程中进行形式上脱离了控制终端
2.在子进程中创建新会话
    setsid()函数
    使子进程完全独立出来,脱离控制
3.改变当前目录为根目录
    chdir()函数
    防止占用可卸载的文件系统
    也可以换成其它路径
4.重设文件权限掩码
    umask()函数
    防止继承的文件创建屏蔽字拒绝某些权限
    增加守护进程灵活性
5.关闭文件描述符
    继承的打开文件不会用到,浪费系统资源,无法卸载
6.开始执行守护进程核心工作守护进程退出处理程序模型                                               
【mydaemond.c】
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <errno.h>
#include <pthread.h>
#include <fcntl.h>
#include <sys/stat.h>
void sys_err(const char *str)
{
    perror(str);
    exit(1);
}
int main(int argc,char *argv[])
{
    pid_t pid;
    int ret;
    pid = fork();
    if(pid>0)
  exit(0);
    pid = setsid();
    if(pid == -1)
  sys_err("setsid error");
    ret = chdir("/home/book/test/06_session");
    if(ret == -1){
  sys_err("chdir error");
    }
    umask(0022);
    close(STDIN_FILENO);
    int fd = open("/dev/null",O_RDWR);
    if(fd == -1)
  sys_err("open error");
    dup2(fd,STDOUT_FILENO);
    dup2(fd,STDERR_FILENO);
    while(1);
    return 0;
}

1.3 线程概念


1.3.1 什么是线程

1670992660625.jpg

LWP:light weight process 轻量级的进程,本质仍是进程(在Linux环境下)

进程:独立地址空间,拥有PCB

线程:有独立的PCB,但没有独立的地址空间(共享)

区别:在于是否共享地址空间。 独居(进程);合租(线程)。


Linux下:

-------------线程:最小的执行单位

-------------进程:最小分配资源单位,可看成是只有一个线程的进程。


1.3.2 linux内核线程实现原理


类Unix系统中,早期是没有“线程”概念的,80年代才引入,借助进程机制实现出了线程的概念。因此在这类系统中,进程和线程关系密切。


轻量级进程(light-weight process),也有PCB,创建线程使用的底层函数和进程一样,都是clone

从内核里看进程和线程是一样的,都有各自不同的PCB,但是PCB中指向内存资源的三级页表是相同的

进程可以蜕变成线程

线程可看做寄存器和栈的集合

在linux下,线程最是小的执行单位;进程是最小的分配资源单位

察看LWP号:

ps –Lf pid 查看指定线程的lwp号。

1670992755862.jpg

三级映射:进程PCB --> 页目录(可看成数组,首地址位于PCB中) --> 页表 --> 物理页面 --> 内存单元

参考:《Linux内核源代码情景分析》 ----毛德操

1670992773187.jpg

对于进程来说,相同的地址(同一个虚拟地址)在不同的进程中,反复使用而不冲突。原因是他们虽虚拟址一样,但,页目录、页表、物理页面各不相同。相同的虚拟址,映射到不同的物理页面内存单元,最终访问不同的物理页面。

但!线程不同!两个线程具有各自独立的PCB,但共享同一个页目录,也就共享同一个页表和物理页面。所以两个PCB共享一个地址空间。

实际上,无论是创建进程的fork,还是创建线程的pthread_create,底层实现都是调用同一个内核函数clone。

如果复制对方的地址空间,那么就产出一个“进程”;如果共享对方的地址空间,就产生一个“线程”。

因此:Linux内核是不区分进程和线程的。只在用户层面上进行区分。所以,线程所有操作函数 pthread_* 是库函数,而非系统调用。


1.3.3 线程共享资源


1.文件描述符表

2.每种信号的处理方式

3.当前工作目录

4.用户ID和组ID

5.内存地址空间 (.text/.data/.bss/heap/共享库)


1.3.4 线程非共享资源


1.线程id

2.处理器现场和栈指针(内核栈)

3.独立的栈空间(用户空间栈)

4.errno变量

5.信号屏蔽字

6.调度优先级


1.3.5 线程优缺点


优点:

提高程序并发性

开销小

数据通信、共享数据方便


缺点:

库函数,不稳定

调试、编写困难、gdb不支持

对信号支持不好 优点相对突出,缺点均不是硬伤。 Linux下由于实现方法导致进程、线程差别不是很大。


1.4 线程控制原语


1.4.1 pthread_self函数


获取线程ID。其作用对应进程中 getpid() 函数。

pthread_t pthread_self(void); 
返回值:
成功:0; 
失败:无!
  线程ID:pthread_t类型,本质:在Linux下为无符号整数(%lu),其他系统中可能是结构体实现
  线程ID是进程内部,识别标志。(两个进程间,线程ID允许相同)


注意:可以通过pthread_create传出参数来获取线程ID。


1.4.2 pthread_create 函数


创建一个新线程。 其作用,对应进程中fork() 函数。

int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *(*start_routine) (void *), void *arg);
返回值:
  成功:0; 
  失败:错误号  -----Linux环境下,所有线程特点,失败均直接返回错误号。
参数: 
  pthread_t:当前Linux中可理解为:typedef  unsigned long int  pthread_t;
  参数1:传出参数,保存系统为我们分配好的线程ID
  参数2:通常传NULL,表示使用线程默认属性。若想使用具体属性也可以修改该参数。
  参数3:函数指针,指向线程主函数(线程体),该函数运行结束,则线程结束。
  参数4:线程主函数执行期间所使用的参数。


在一个线程中调用pthread_create()创建新的线程后,当前线程从pthread_create()返回继续往下执行,而新的线程所执行的代码由我们传给pthread_create的函数指针start_routine决定。start_routine函数接收一个参数,是通过pthread_create的arg参数传递给它的,该参数的类型为void *,这个指针按什么类型解释由调用者自己定义。start_routine的返回值类型也是void *,这个指针的含义同样由调用者自己定义。start_routine返回时,这个线程就退出了,其它线程可以调用pthread_join得到start_routine的返回值,类似于父进程调用wait(2)得到子进程的退出状态,稍后详细介绍pthread_join。 pthread_create成功返回后,新创建的线程的id被填写到thread参数所指向的内存单元。我们知道进程id的类型是pid_t,每个进程的id在整个系统中是唯一的,调用getpid(2)可以获得当前进程的id,是一个正整数值。线程id的类型是thread_t,它只在当前进程中保证是唯一的,在不同的系统中thread_t这个类型有不同的实现,它可能是一个整数值,也可能是一个结构体,也可能是一个地址,所以不能简单地当成整数用printf打印,调用pthread_self(3)可以获得当前线程的id。

attr参数表示线程属性,本节不深入讨论线程属性,所有代码例子都传NULL给attr参数,表示线程属性取缺省值,感兴趣的读者可以参考APUE。

相关文章
|
19天前
|
调度 开发者 Python
深入浅出操作系统:进程与线程的奥秘
在数字世界的底层,操作系统扮演着不可或缺的角色。它如同一位高效的管家,协调和控制着计算机硬件与软件资源。本文将拨开迷雾,深入探索操作系统中两个核心概念——进程与线程。我们将从它们的诞生谈起,逐步剖析它们的本质、区别以及如何影响我们日常使用的应用程序性能。通过简单的比喻,我们将理解这些看似抽象的概念,并学会如何在编程实践中高效利用进程与线程。准备好跟随我一起,揭开操作系统的神秘面纱,让我们的代码运行得更加流畅吧!
|
4天前
|
存储 缓存 监控
Linux缓存管理:如何安全地清理系统缓存
在Linux系统中,内存管理至关重要。本文详细介绍了如何安全地清理系统缓存,特别是通过使用`/proc/sys/vm/drop_caches`接口。内容包括清理缓存的原因、步骤、注意事项和最佳实践,帮助你在必要时优化系统性能。
112 78
|
8天前
|
Linux Shell 网络安全
Kali Linux系统Metasploit框架利用 HTA 文件进行渗透测试实验
本指南介绍如何利用 HTA 文件和 Metasploit 框架进行渗透测试。通过创建反向 shell、生成 HTA 文件、设置 HTTP 服务器和发送文件,最终实现对目标系统的控制。适用于教育目的,需合法授权。
39 9
Kali Linux系统Metasploit框架利用 HTA 文件进行渗透测试实验
|
4天前
|
存储 监控 Linux
嵌入式Linux系统编程 — 5.3 times、clock函数获取进程时间
在嵌入式Linux系统编程中,`times`和 `clock`函数是获取进程时间的两个重要工具。`times`函数提供了更详细的进程和子进程时间信息,而 `clock`函数则提供了更简单的处理器时间获取方法。根据具体需求选择合适的函数,可以更有效地进行性能分析和资源管理。通过本文的介绍,希望能帮助您更好地理解和使用这两个函数,提高嵌入式系统编程的效率和效果。
43 13
|
19天前
|
消息中间件 Unix Linux
【C语言】进程和线程详解
在现代操作系统中,进程和线程是实现并发执行的两种主要方式。理解它们的区别和各自的应用场景对于编写高效的并发程序至关重要。
46 6
|
20天前
|
调度 开发者
深入理解:进程与线程的本质差异
在操作系统和计算机编程领域,进程和线程是两个核心概念。它们在程序执行和资源管理中扮演着至关重要的角色。本文将深入探讨进程与线程的区别,并分析它们在现代软件开发中的应用和重要性。
42 5
|
18天前
|
算法 调度 开发者
深入理解操作系统:进程与线程的管理
在数字世界的复杂编织中,操作系统如同一位精明的指挥家,协调着每一个音符的奏响。本篇文章将带领读者穿越操作系统的幕后,探索进程与线程管理的奥秘。从进程的诞生到线程的舞蹈,我们将一起见证这场微观世界的华丽变奏。通过深入浅出的解释和生动的比喻,本文旨在揭示操作系统如何高效地处理多任务,确保系统的稳定性和效率。让我们一起跟随代码的步伐,走进操作系统的内心世界。
|
20天前
|
调度 开发者
核心概念解析:进程与线程的对比分析
在操作系统和计算机编程领域,进程和线程是两个基本而核心的概念。它们是程序执行和资源管理的基础,但它们之间存在显著的差异。本文将深入探讨进程与线程的区别,并分析它们在现代软件开发中的应用和重要性。
38 4
|
28天前
|
Ubuntu Linux 网络安全
linux系统ubuntu中在命令行中打开图形界面的文件夹
在Ubuntu系统中,通过命令行打开图形界面的文件夹是一个高效且实用的操作。无论是使用Nautilus、Dolphin还是Thunar,都可以根据具体桌面环境选择合适的文件管理器。通过上述命令和方法,可以简化日常工作,提高效率。同时,解决权限问题和图形界面问题也能确保操作的顺利进行。掌握这些技巧,可以使Linux操作更加便捷和灵活。
20 3
|
5天前
|
Ubuntu Linux C++
Win10系统上直接使用linux子系统教程(仅需五步!超简单,快速上手)
本文介绍了如何在Windows 10上安装并使用Linux子系统。首先,通过应用商店安装Windows Terminal和Linux系统(如Ubuntu)。接着,在控制面板中启用“适用于Linux的Windows子系统”并重启电脑。最后,在Windows Terminal中选择安装的Linux系统即可开始使用。文中还提供了注意事项和进一步配置的链接。
17 0
下一篇
DataWorks