【Linux进程间通信】二、pipe管道-阿里云开发者社区

1. 什么是管道

管道是一种最基本的IPC机制，作用于有血缘关系的进程之间，完成数据传递。调用pipe()系统函数就可以创建一个管道。管道具有下面的特点：

管道的本质是一个伪文件，实际上就是内核缓冲区。
由两个文件描述符引用，一个表示读端，一个表示写端。
规定数据从管道的写端流入管道，从读端流出。

管道的实现原理是这样的，实际上管道是内核使用环形队列机制，借助内核缓冲区（4K）来实现的。管道在使用时也具有一定的局限性：

一是数据一旦被读走，便不在管道中存在，不可反复读取；
二是由于管道采用半双工通信方式（通信方式有单工通信、半双工通信、全双工通信），因此，数据只能在一个方向上流动，有的地方也说是单工；
三是只能在有公共祖先的进程间使用管道。

2. pipe()函数创建管道

2.1 函数原型

包含头文件

#include <unistd.h>

函数原型

int pipe(int pipefd[2]);
#define _GNU_SOURCE
#include <unistd.h>
int pipe2(int pipefd[2], int flags);

函数功能
pipe() creates a pipe, a unidirectional data channel that can be used for interprocess communication.
函数参数

pipefd[2]：读端和写端的文件描述符

函数返回值

On success, zero is returned.
On error, -1 is returned, and errno is set appropriately.

2.2 工作原理

一般来说，要在子进程创建之前使用pipe()来创建管道，这样子进程才能共享这两个文件描述符fd[1]和fd[2]。pipe()函数创建一个管道就相当于打开了一个伪文件（这个伪文件实际上是内核缓冲区，像管道文件读写数据其实是在读写内核缓冲区，因为这个缓冲区只能单向流通数据，所以形象的称为管道），所以调用成功会返回两个文件描述符给参数pipefd[2]，其中fd[0]代表读端，fd[1]代表写端，就像0代表标准输入1代表标准输出一样作为一种规定。并且这两个文件描述符在使用的时候不需要open()打开，但是需要我们手动的close()关闭。

管道创建成功后，父进程同时拥有读写两端，因为子进程是对父进程的复制，所以子进程也会拥有读写两端。下面通过图示来说明进程间是如何通过管道通信的。

① 父进程调用pipe()函数创建管道，并得到指向管道读端和写端的文件描述符fd[0]和fd[1]。创建出来的管道实际上是内核的一块缓冲区，我们可以像读写文件一样来操作这个缓冲区，所以也可以把他理解为一个伪文件。
② 父进程调用fork()创建子进程，子进程将共享这两个指向管道读写端的文件描述符。

③ 如果父进程关闭管道读端，子进程关闭管道写端，此时父进程可以向管道中写入数据，子进程将管道中的数据读出，反之同理。由于管道是利用环形队列实现的，数据从写端流入管道，从读端流出，这样就实现了进程间通信。

2.3 通过实战分析管道的特性

**示例1：**父子进程读写管道

/************************************************************
  >File Name  : pipe_test.c
  >Author     : Mindtechnist
  >Company    : Mindtechnist
  >Create Time: 2022年05月21日 星期六 17时53分56秒
************************************************************/
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
int main(int argc, char* argv[])
{
    int fd[2];
    pipe(fd);
    pid_t pid = fork();
    if(pid == 0)
    {
        /*子进程向管道写*/
        /*sleep(3); read读设备的时候，默认是会阻塞等待的，写进程睡眠的时候，读进程会阻塞等待，直到读取到数据*/
        char str[] = "hello pipe...\n";
        write(fd[1], str, sizeof(str));
    }
    if(pid > 0)
    {
        char buf[15] = {0}; /*创建一个缓冲区来缓存读出的数据*/
        /*read读设备的时候，默认是会阻塞等待的*/
        int ret = read(fd[0], buf, sizeof(buf));
        if(ret > 0)
        {
            write(STDOUT_FILENO, buf, ret);
        }
    }
    return 0;
}

由于resd()函数读设备时默认阻塞等待的特性，即使写进程没有立即写，读进程也能读到数据，因为它会阻塞等待。

**❀示例2：**使用管道实现 ps | grep 命令

/************************************************************
  >File Name  : mpsgrep.c
  >Author     : Mindtechnist
  >Company    : Mindtechnist
  >Create Time: 2022年05月21日 星期六 18时08分56秒
************************************************************/
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
int main(int argc, char* argv[])
{
  int fd[2];
    pipe(fd);
    pid_t pid = fork(); /*一个进程执行ps一个进程执行grep来实现 ps | grep*/
    if(pid == 0) /*子进程执行ps*/
    {/*把ps的执行结果传给grep，所以子进程写，父进程读*/
        /*首先把ps命令的执行结果重定向到管道的写端（默认将执行结果输出到stdout）*/
        dup2(fd[1], STDOUT_FILENO);
        /*拉起ps进程*/
        execlp("ps", "ps", "aux", NULL);
    }
    if(pid > 0) /*父进程执行grep*/
    {
        /*把grep读取重定向到fd[0]，因为默认grep是在stdin获取输入的*/
        /*如果在shell命令行使用grep，模式是在标准输入中匹配*/
        dup2(fd[0], STDIN_FILENO);
        /*拉起grep进程*/
        execlp("grep", "grep", argv[1], NULL);
    }
  return 0;
}

上面的程序执行后，可以看到输出结果，确实显示了bash相关的进程信息

我们再起一个终端，使用 ps aux 命令查看进程会发现，子进程中拉起的ps进程变成了僵尸进程，并且父进程没有退出。（实际上，如果父进程退出了，子进程就会被init进程收养并回收）

ps进程变成僵尸进程是因为，我们在父进程中并没有回收子进程，因为execlp()函数拉起一个进程后，如果执行成功，就不会再返回了，那么我们也没办法去回收这个子进程ps。但是我们知道，如果父进程终止了，子进程就会被init进程收养并回收，所以我们只要让父进程（也就是程序中的grep进程）退出，就可以解决子进程回收问题了。

下面，我们分析下父进程为什么没有退出，正常情况下，父进程执行完grep命令就应该正常退出的。实际上，这是管道的特性引起的，我们知道，pipe()创建管道后会在内核分配一个缓冲区，并返回两个文件描述符，父进程和子进程都持有读写这两个文件描述符。我们在进程间通信的时候，因为管道是单向数据流通，所以只有一个进程写一个进程读，比如上面的程序，我们让子进程写，让父进程读，但这并不代表父进程不持有写端文件描述符。问题就在这里，虽然子进程已经变成了僵尸进程，但是父进程依然持有写端文件描述符，所以父进程就会认为还存在其他进程来写入管道，于是父进程就会等待写入，而不退出。

解决方法就是，我们在进程间通信时，要保证数据单向流通，在读进程中关闭管道的写端文件描述符，在写进程中关闭管道的读端文件描述符。我们依据这个原则来改造一下上面的程序即可。

/************************************************************
  >File Name  : mpsgrep_02.c
  >Author     : Mindtechnist
  >Company    : Mindtechnist
  >Create Time: 2022年05月21日 星期六 18时08分56秒
************************************************************/
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
int main(int argc, char* argv[])
{
  int fd[2];
    pipe(fd);
    pid_t pid = fork(); /*一个进程执行ps一个进程执行grep来实现 ps | grep*/
    if(pid == 0) /*子进程执行ps*/
    {/*把ps的执行结果传给grep，所以子进程写，父进程读*/
        /*关闭读端文件描述符，保证数据单向流通*/
        close(fd[0]);
        /*首先把ps命令的执行结果重定向到管道的写端（默认将执行结果输出到stdout）*/
        dup2(fd[1], STDOUT_FILENO);
        /*拉起ps进程*/
        execlp("ps", "ps", "aux", NULL);
    }
    if(pid > 0) /*父进程执行grep*/
    {
        /*关闭写端文件描述符，保证数据单向流通，防止读进程阻塞*/
        close(fd[1]);
        /*把grep读取重定向到fd[0]，因为默认grep是在stdin获取输入的*/
        /*如果在shell命令行使用grep，模式是在标准输入中匹配*/
        dup2(fd[0], STDIN_FILENO);
        /*拉起grep进程*/
        execlp("grep", "grep", argv[1], NULL);
    }
  return 0;
}

这样，父进程就不会阻塞等待，而是直接退出，而子进程也不会产生僵尸进程。

3. 管道的读写行为

使用管道进行进程间通信的时候，假设没有设置O_NONBLOCK标志（也就是说都是阻塞I/O操作），有以下几种特殊情况

如果所有指向管道写端的文件描述符都关闭了（管道写端引用计数为0），而仍然有进程从管道的读端读数据，那么管道中剩余的数据都被读取后，再次read会返回0，就像读到文件末尾一样。
如果有指向管道写端的文件描述符没关闭（管道写端引用计数大于0），而持有管道写端的进程也没有向管道中写数据，这时有进程从管道读端读数据，那么管道中剩余的数据都被读取后，再次read会阻塞，直到管道中有数据可读了才读取数据并返回。
如果所有指向管道读端的文件描述符都关闭了（管道读端引用计数为0），这时有进程向管道的写端write，那么该进程会收到信号SIGPIPE，通常会导致进程异常终止。当然也可以对SIGPIPE信号实施捕捉，不终止进程。（在讲信号的时候会细说）
如果有指向管道读端的文件描述符没关闭（管道读端引用计数大于0），而持有管道读端的进程也没有从管道中读数据，这时有进程向管道写端写数据，那么在管道被写满时再次write会阻塞，直到管道中有空位置了才写入数据并返回。

其实，总的来说可以分为读管道和写管道两种的情况

读管道

如果管道中有数据，read返回实际读到的字节数。
如果管道中无数据：

如果管道写端被全部关闭，read返回0，相当于读到文件结尾。
如果写端没有全部被关闭，read阻塞等待（不久的将来可能有数据递达，此时会让出cpu），如果不想让read阻塞，可以使用fcntl设置非阻塞。

写管道

如果管道读端全部被关闭，会产生一个信号SIGPIPE，进程异常终止（也可使用捕捉SIGPIPE信号，使进程不终止）。
如果管道读端没有全部关闭

如果管道已满，write阻塞，（管道实际上是内核中的一个缓冲区，它是有大小的）。
如果管道未满，write将数据写入，并返回实际写入的字节数。

/************************************************************
  >File Name  : pipe_test2.c
  >Author     : Mindtechnist
  >Company    : Mindtechnist
  >Create Time: 2022年05月21日 星期六 17时53分56秒
************************************************************/
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>
int main(int argc, char* argv[])
{
    int fd[2];
    pipe(fd);
    pid_t pid = fork();
    if(pid == 0)
    {
        sleep(3); 
        close(fd[0]); /*关闭读端*/
        char str[] = "hello pipe...\n";
        write(fd[1], str, sizeof(str));
        close(fd[1]); /*关闭写端*/
        while(1)
        {
            sleep(1);
        }
    }
    if(pid > 0)
    {
        close(fd[1]); /*关闭写端*/
        close(fd[0]); /*关闭读端*/
        char buf[15] = {0}; 
        int status;
        wait(&status);
        if(WIFSIGNALED(status))
        {
            printf("kill: %d\n", WTERMSIG(status));
        }
        while(1)
        {
            int ret = read(fd[0], buf, sizeof(buf));
          if(ret > 0)
          {
              write(STDOUT_FILENO, buf, ret);
          }
        }
    }
    return 0;
}

4. 管道（缓冲区）大小

使用命令查看

ulimit -a

管道大小是8个512byte的大小。

也可以使用函数fpathconf()查看

#include <unistd.h>
long fpathconf(int fd, int name); 
/*fd可以是fd[0]或fd[1]，name是一个选项*/

实际上使用 ulimit -a 看到的是内核给管道的大小，但是管道的容量实际上可能要比这个值大。

5. 管道的优缺点

优点：简单，相比信号，套接字实现进程间通信，简单很多。（其实要想实现父进程和子进程双向通信，可以创建两个管道）
缺点：

只能单向通信，双向通信需建立两个管道。
只能用于有血缘关系的进程间通信（父子、兄弟等有共同祖先的进程），有名管道可解决该问题。

【Linux进程间通信】二、pipe管道

1. 什么是管道

2. pipe()函数创建管道

2.1 函数原型

2.2 工作原理

2.3 通过实战分析管道的特性

3. 管道的读写行为

4. 管道（缓冲区）大小

5. 管道的优缺点

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

【Linux进程间通信】二、pipe管道

1. 什么是管道

2. pipe()函数创建管道

2.1 函数原型

2.2 工作原理

2.3 通过实战分析管道的特性

3. 管道的读写行为

4. 管道（缓冲区）大小

5. 管道的优缺点

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像