linux中在进程之间传递文件描述符的实现方式

简介: linux中在进程之间传递文件描述符的实现方式

参考

刚才在学习vhost-user时,发现qemu进程跟dpdk进程之间会通过unix套接字来发送文件描述符,进而实现内存共享的功能。那么linux是如何实现这一技术的呢?

上面的参考文章中利用UNIX本地套接字实现了在不同的进程之间传递文件描述符,下面大致分析一下linux内核是如何实现的。

正文

用户态主要接口

首先看一下用户态用到的主要代码(代码做了简化):

发送端

// 创建UNIX套接字
  cli_fd = socket(AF_UNIX, SOCK_STREAM, 0);
// 连接接收端
  connect(cli_fd, (struct sockaddr *)&server_addr, sizeof(server_addr));
// 打开一个要发送的文件,获取文件描述符
  fd = open(OPEN_FILE, O_CREAT | O_RDWR, 0777);
// 设置socket_msg
  ctrl_msg = CMSG_FIRSTHDR(&socket_msg);
  ctrl_msg->cmsg_len = CMSG_LEN(sizeof(cli_fd));
  ctrl_msg->cmsg_level = SOL_SOCKET;
  ctrl_msg->cmsg_type = SCM_RIGHTS;
  *((int *)CMSG_DATA(ctrl_msg)) = fd;
// 发送
  sendmsg(cli_fd, &socket_msg, 0);

接收端

// 创建UNIX套接字
  listen_fd = socket(AF_UNIX, SOCK_STREAM, 0);
// 等待连接
  cli_fd= accept(listen_fd, (struct sockaddr *)&client_addr, &cli_len);
// 接受数据
  recvmsg(cli_fd, &socket_msg, 0);
// 解析fd
  ctrl_msg = CMSG_FIRSTHDR(&socket_msg);
  rev_fd = *((int *)CMSG_DATA(ctrl_msg));

内核实现

发送端

这里主要分析sendmsg的实现:

文件:net\socket.c

SYSCALL_DEFINE3(sendmsg, int, fd, struct user_msghdr __user *, msg, unsigned int, flags)
{
  return __sys_sendmsg(fd, msg, flags, true);
}

然后从__sys_sendmsg一路往下调用:

__sys_sendmsg
  -> sockfd_lookup_light
  -> ___sys_sendmsg(sock, msg, &msg_sys, flags, NULL, 0)
    -> ____sys_sendmsg
      -> sock_sendmsg
        -> sock_sendmsg_nosec
          -> unix_stream_sendmsg
            -> scm_send(sock, msg, &scm, false);
              -> __scm_send
                -> scm_fp_copy(cmsg, &p->fp)
                  -> fpl = kmalloc(sizeof(struct scm_fp_list), GFP_KERNEL)
                  -> fpp = &fpl->fp[fpl->count]
                  -> file = fget_raw(CMSG_DATA(cmsg))
                  -> *fpp++ = file
            -> unix_scm_to_skb(&scm, skb, !fds_sent)
              -> unix_attach_fds
                -> scm_fp_dup
                  -> new_fpl = kmemdup(fpl, offsetof(struct scm_fp_list, fp[fpl->count])
                  -> get_file(fpl->fp[i]);
                  -> return new_fpl

scm_fp_copy中会分配一块内存fpl,用户要发送的文件描述符fd存放在CMSG_DATA(cmsg)中,调用fget_raw获取fd对应的struct file指针,最后将file指针存放到fpl指向的内存中。

scm_fp_dup中将fpl拷贝一份返回,并且增加file结构体的引用计数。

接收端

这里主要分析recvmsg的实现:

文件:net\socket.c

SYSCALL_DEFINE3(recvmsg, int, fd, struct user_msghdr __user *, msg,
    unsigned int, flags)
{
  return __sys_recvmsg(fd, msg, flags, true);
}

然后从__sys_recvmsg一路往下调用:

__sys_recvmsg
  -> sockfd_lookup_light
  -> ___sys_recvmsg
    -> ____sys_recvmsg
      -> sock_recvmsg
        -> unix_stream_recvmsg
          -> unix_stream_read_generic
            -> unix_detach_fds(&scm, skb);
            -> scm_recv
              -> scm_detach_fds
                -> struct file **fp = scm->fp->fp
                -> new_fd = get_unused_fd_flags
                -> put_user(new_fd, CMSG_DATA(cm))
                -> fd_install(new_fd, get_file(fp[i]))
                -> __scm_destroy(scm)
                  -> fput(fpl->fp[i])

从skb中构造scm,其中包含发送过来的fp,然后从中将file指针提取出来,接着调用get_unused_fd_flags从当前进程中分配一个空闲的new_fd,最后调用fd_install装载到当前进程的files_struct中。此外,还需要将new_fd设置到CMSG_DATA(cm)中,这样上层应用就可以获得属于自己的文件描述符。

小结

对于引用计数的管理,在发送的时候会调用get_file增加引用计数,防止发送过程中发送端关闭这个文件时file结构体被销毁,在接收端接收的时候也会调用get_file增加引用计数,最后在__scm_destroy中会将file结构体的引用计数减1,这样在整个发送和接收过程中file结构体的引用计数实际增加了1,增加的1是给接收端用的,这样只有当发送端和接收端都关闭这个文件时,对应的file结构体才会被销毁。

通过上面的分析可以知道,发送端和接收端实际是通过增加引用计数的方式共享了同一个file结构体,但是这个file结构体在发送端和接收端对应的fd文件描述符不一定相同,盗用一幅《UNIX环境高级编程》中的图片来描述场景:

同时也正因为是共享了同一个数据结构,所以只能在同一台机器上通过UNIX域套接字实现发送文件描述符的功能。

相关文章
|
17天前
|
监控 关系型数据库 MySQL
在CentOS系统中,如何统计哪个进程打开了文件描述符?
利用上述方法,你可以有效地监控和统计CentOS系统中的进程打开的文件描述符数量,以帮助排查错误或优化系统配置。通过组合使用各种工具和命令,可以获得对系统状态和行为的深入了解,进而做出相应的调整和
91 5
|
7月前
|
并行计算 Linux
Linux内核中的线程和进程实现详解
了解进程和线程如何工作,可以帮助我们更好地编写程序,充分利用多核CPU,实现并行计算,提高系统的响应速度和计算效能。记住,适当平衡进程和线程的使用,既要拥有独立空间的'兄弟',也需要在'家庭'中分享和并行的成员。对于这个世界,现在,你应该有一个全新的认识。
276 67
|
6月前
|
Web App开发 Linux 程序员
获取和理解Linux进程以及其PID的基础知识。
总的来说,理解Linux进程及其PID需要我们明白,进程就如同汽车,负责执行任务,而PID则是独特的车牌号,为我们提供了管理的便利。知道这个,我们就可以更好地理解和操作Linux系统,甚至通过对进程的有效管理,让系统运行得更加顺畅。
170 16
|
6月前
|
Unix Linux
对于Linux的进程概念以及进程状态的理解和解析
现在,我们已经了解了Linux进程的基础知识和进程状态的理解了。这就像我们理解了城市中行人的行走和行为模式!希望这个形象的例子能帮助我们更好地理解这个重要的概念,并在实际应用中发挥作用。
132 20
|
5月前
|
监控 Shell Linux
Linux进程控制(详细讲解)
进程等待是系统通过调用特定的接口(如waitwaitpid)来实现的。来进行对子进程状态检测与回收的功能。
116 0
|
5月前
|
存储 负载均衡 算法
Linux2.6内核进程调度队列
本篇文章是Linux进程系列中的最后一篇文章,本来是想放在上一篇文章的结尾的,但是想了想还是单独写一篇文章吧,虽然说这部分内容是比较难的,所有一般来说是简单的提及带过的,但是为了让大家对进程有更深的理解与认识,还是看了一些别人的文章,然后学习了学习,然后对此做了总结,尽可能详细的介绍明白。最后推荐一篇文章Linux的进程优先级 NI 和 PR - 简书。
156 0
|
5月前
|
存储 Linux Shell
Linux进程概念-详细版(二)
在Linux进程概念-详细版(一)中我们解释了什么是进程,以及进程的各种状态,已经对进程有了一定的认识,那么这篇文章将会继续补全上篇文章剩余没有说到的,进程优先级,环境变量,程序地址空间,进程地址空间,以及调度队列。
113 0
|
5月前
|
Linux 调度 C语言
Linux进程概念-详细版(一)
子进程与父进程代码共享,其子进程直接用父进程的代码,其自己本身无代码,所以子进程无法改动代码,平时所说的修改是修改的数据。为什么要创建子进程:为了让其父子进程执行不同的代码块。子进程的数据相对于父进程是会进行写时拷贝(COW)。
118 0
|
8月前
|
存储 Linux 调度
【Linux】进程概念和进程状态
本文详细介绍了Linux系统中进程的核心概念与管理机制。从进程的定义出发,阐述了其作为操作系统资源管理的基本单位的重要性,并深入解析了task_struct结构体的内容及其在进程管理中的作用。同时,文章讲解了进程的基本操作(如获取PID、查看进程信息等)、父进程与子进程的关系(重点分析fork函数)、以及进程的三种主要状态(运行、阻塞、挂起)。此外,还探讨了Linux特有的进程状态表示和孤儿进程的处理方式。通过学习这些内容,读者可以更好地理解Linux进程的运行原理并优化系统性能。
283 4
|
8月前
|
Linux Shell
Linux 进程前台后台切换与作业控制
进程前台/后台切换及作业控制简介: 在 Shell 中,启动的程序默认为前台进程,会占用终端直到执行完毕。例如,执行 `./shella.sh` 时,终端会被占用。为避免不便,可将命令放到后台运行,如 `./shella.sh &`,此时终端命令行立即返回,可继续输入其他命令。 常用作业控制命令: - `fg %1`:将后台作业切换到前台。 - `Ctrl + Z`:暂停前台作业并放到后台。 - `bg %1`:让暂停的后台作业继续执行。 - `kill %1`:终止后台作业。 优先级调整:
497 5