linux中在进程之间传递文件描述符的实现方式

简介: linux中在进程之间传递文件描述符的实现方式

参考

刚才在学习vhost-user时,发现qemu进程跟dpdk进程之间会通过unix套接字来发送文件描述符,进而实现内存共享的功能。那么linux是如何实现这一技术的呢?

上面的参考文章中利用UNIX本地套接字实现了在不同的进程之间传递文件描述符,下面大致分析一下linux内核是如何实现的。

正文

用户态主要接口

首先看一下用户态用到的主要代码(代码做了简化):

发送端

// 创建UNIX套接字
  cli_fd = socket(AF_UNIX, SOCK_STREAM, 0);
// 连接接收端
  connect(cli_fd, (struct sockaddr *)&server_addr, sizeof(server_addr));
// 打开一个要发送的文件,获取文件描述符
  fd = open(OPEN_FILE, O_CREAT | O_RDWR, 0777);
// 设置socket_msg
  ctrl_msg = CMSG_FIRSTHDR(&socket_msg);
  ctrl_msg->cmsg_len = CMSG_LEN(sizeof(cli_fd));
  ctrl_msg->cmsg_level = SOL_SOCKET;
  ctrl_msg->cmsg_type = SCM_RIGHTS;
  *((int *)CMSG_DATA(ctrl_msg)) = fd;
// 发送
  sendmsg(cli_fd, &socket_msg, 0);

接收端

// 创建UNIX套接字
  listen_fd = socket(AF_UNIX, SOCK_STREAM, 0);
// 等待连接
  cli_fd= accept(listen_fd, (struct sockaddr *)&client_addr, &cli_len);
// 接受数据
  recvmsg(cli_fd, &socket_msg, 0);
// 解析fd
  ctrl_msg = CMSG_FIRSTHDR(&socket_msg);
  rev_fd = *((int *)CMSG_DATA(ctrl_msg));

内核实现

发送端

这里主要分析sendmsg的实现:

文件:net\socket.c

SYSCALL_DEFINE3(sendmsg, int, fd, struct user_msghdr __user *, msg, unsigned int, flags)
{
  return __sys_sendmsg(fd, msg, flags, true);
}

然后从__sys_sendmsg一路往下调用:

__sys_sendmsg
  -> sockfd_lookup_light
  -> ___sys_sendmsg(sock, msg, &msg_sys, flags, NULL, 0)
    -> ____sys_sendmsg
      -> sock_sendmsg
        -> sock_sendmsg_nosec
          -> unix_stream_sendmsg
            -> scm_send(sock, msg, &scm, false);
              -> __scm_send
                -> scm_fp_copy(cmsg, &p->fp)
                  -> fpl = kmalloc(sizeof(struct scm_fp_list), GFP_KERNEL)
                  -> fpp = &fpl->fp[fpl->count]
                  -> file = fget_raw(CMSG_DATA(cmsg))
                  -> *fpp++ = file
            -> unix_scm_to_skb(&scm, skb, !fds_sent)
              -> unix_attach_fds
                -> scm_fp_dup
                  -> new_fpl = kmemdup(fpl, offsetof(struct scm_fp_list, fp[fpl->count])
                  -> get_file(fpl->fp[i]);
                  -> return new_fpl

scm_fp_copy中会分配一块内存fpl,用户要发送的文件描述符fd存放在CMSG_DATA(cmsg)中,调用fget_raw获取fd对应的struct file指针,最后将file指针存放到fpl指向的内存中。

scm_fp_dup中将fpl拷贝一份返回,并且增加file结构体的引用计数。

接收端

这里主要分析recvmsg的实现:

文件:net\socket.c

SYSCALL_DEFINE3(recvmsg, int, fd, struct user_msghdr __user *, msg,
    unsigned int, flags)
{
  return __sys_recvmsg(fd, msg, flags, true);
}

然后从__sys_recvmsg一路往下调用:

__sys_recvmsg
  -> sockfd_lookup_light
  -> ___sys_recvmsg
    -> ____sys_recvmsg
      -> sock_recvmsg
        -> unix_stream_recvmsg
          -> unix_stream_read_generic
            -> unix_detach_fds(&scm, skb);
            -> scm_recv
              -> scm_detach_fds
                -> struct file **fp = scm->fp->fp
                -> new_fd = get_unused_fd_flags
                -> put_user(new_fd, CMSG_DATA(cm))
                -> fd_install(new_fd, get_file(fp[i]))
                -> __scm_destroy(scm)
                  -> fput(fpl->fp[i])

从skb中构造scm,其中包含发送过来的fp,然后从中将file指针提取出来,接着调用get_unused_fd_flags从当前进程中分配一个空闲的new_fd,最后调用fd_install装载到当前进程的files_struct中。此外,还需要将new_fd设置到CMSG_DATA(cm)中,这样上层应用就可以获得属于自己的文件描述符。

小结

对于引用计数的管理,在发送的时候会调用get_file增加引用计数,防止发送过程中发送端关闭这个文件时file结构体被销毁,在接收端接收的时候也会调用get_file增加引用计数,最后在__scm_destroy中会将file结构体的引用计数减1,这样在整个发送和接收过程中file结构体的引用计数实际增加了1,增加的1是给接收端用的,这样只有当发送端和接收端都关闭这个文件时,对应的file结构体才会被销毁。

通过上面的分析可以知道,发送端和接收端实际是通过增加引用计数的方式共享了同一个file结构体,但是这个file结构体在发送端和接收端对应的fd文件描述符不一定相同,盗用一幅《UNIX环境高级编程》中的图片来描述场景:

同时也正因为是共享了同一个数据结构,所以只能在同一台机器上通过UNIX域套接字实现发送文件描述符的功能。

相关文章
|
11天前
|
缓存 监控 Linux
linux进程管理万字详解!!!
本文档介绍了Linux系统中进程管理、系统负载监控、内存监控和磁盘监控的基本概念和常用命令。主要内容包括: 1. **进程管理**: - **进程介绍**:程序与进程的关系、进程的生命周期、查看进程号和父进程号的方法。 - **进程监控命令**:`ps`、`pstree`、`pidof`、`top`、`htop`、`lsof`等命令的使用方法和案例。 - **进程管理命令**:控制信号、`kill`、`pkill`、`killall`、前台和后台运行、`screen`、`nohup`等命令的使用方法和案例。
39 4
linux进程管理万字详解!!!
|
2天前
|
存储 运维 监控
深入Linux基础:文件系统与进程管理详解
深入Linux基础:文件系统与进程管理详解
33 8
|
10天前
|
算法 Linux 定位技术
Linux内核中的进程调度算法解析####
【10月更文挑战第29天】 本文深入剖析了Linux操作系统的心脏——内核中至关重要的组成部分之一,即进程调度机制。不同于传统的摘要概述,我们将通过一段引人入胜的故事线来揭开进程调度算法的神秘面纱,展现其背后的精妙设计与复杂逻辑,让读者仿佛跟随一位虚拟的“进程侦探”,一步步探索Linux如何高效、公平地管理众多进程,确保系统资源的最优分配与利用。 ####
38 4
|
11天前
|
缓存 负载均衡 算法
Linux内核中的进程调度算法解析####
本文深入探讨了Linux操作系统核心组件之一——进程调度器,着重分析了其采用的CFS(完全公平调度器)算法。不同于传统摘要对研究背景、方法、结果和结论的概述,本文摘要将直接揭示CFS算法的核心优势及其在现代多核处理器环境下如何实现高效、公平的资源分配,同时简要提及该算法如何优化系统响应时间和吞吐量,为读者快速构建对Linux进程调度机制的认知框架。 ####
|
13天前
|
消息中间件 存储 Linux
|
19天前
|
运维 Linux
Linux查找占用的端口,并杀死进程的简单方法
通过上述步骤和命令,您能够迅速识别并根据实际情况管理Linux系统中占用特定端口的进程。为了获得更全面的服务器管理技巧和解决方案,提供了丰富的资源和专业服务,是您提升运维技能的理想选择。
19 1
|
1月前
|
算法 Linux 调度
深入理解Linux操作系统的进程管理
【10月更文挑战第9天】本文将深入浅出地介绍Linux系统中的进程管理机制,包括进程的概念、状态、调度以及如何在Linux环境下进行进程控制。我们将通过直观的语言和生动的比喻,让读者轻松掌握这一核心概念。文章不仅适合初学者构建基础,也能帮助有经验的用户加深对进程管理的理解。
20 1
|
1月前
|
消息中间件 Linux API
Linux c/c++之IPC进程间通信
这篇文章详细介绍了Linux下C/C++进程间通信(IPC)的三种主要技术:共享内存、消息队列和信号量,包括它们的编程模型、API函数原型、优势与缺点,并通过示例代码展示了它们的创建、使用和管理方法。
29 0
Linux c/c++之IPC进程间通信
|
1月前
|
Linux C++
Linux c/c++进程间通信(1)
这篇文章介绍了Linux下C/C++进程间通信的几种方式,包括普通文件、文件映射虚拟内存、管道通信(FIFO),并提供了示例代码和标准输入输出设备的应用。
23 0
Linux c/c++进程间通信(1)
|
1月前
|
Linux C++
Linux c/c++进程之僵尸进程和守护进程
这篇文章介绍了Linux系统中僵尸进程和守护进程的概念、产生原因、解决方法以及如何创建守护进程。
18 0