linux管道是什么及怎么使用

69次阅读
没有评论

共计 7459 个字符,预计需要花费 19 分钟才能阅读完成。

本文丸趣 TV 小编为大家详细介绍“linux 管道是什么及怎么使用”,内容详细,步骤清晰,细节处理妥当,希望这篇“linux 管道是什么及怎么使用”文章能帮助大家解决疑惑,下面跟着丸趣 TV 小编的思路慢慢深入,一起来学习新知识吧。

管道是 Linux 进程间的一种通信方式,两个进程可以通过一个共享内存区域来传递信息,并且管道中的数据只能是单向流动的,也就是说只能有固定的写进程和读进程。目前在任何一个 shell 中,都可以使用“|”连接两个命令,shell 会将前后两个进程的输入输出用一个管道相连,以便达到进程间通信的目的。

什么是管道?

管道,英文为 pipe。管道是 Linux 进程间的一种通信方式,两个进程可以通过一个共享内存区域来传递信息,并且管道中的数据只能是单向流动的,也就是说只能有固定的写进程和读进程。

管道的发明人是道格拉斯. 麦克罗伊,这位也是 UNIX 上早期 shell 的发明人。他在发明了 shell 之后,发现系统操作执行命令的时候,经常有需求要将一个程序的输出交给另一个程序进行处理,这种操作可以使用输入输出重定向加文件搞定,比如:

[zorro@zorro-pc pipe]$ ls -l /etc/   etc.txt
[zorro@zorro-pc pipe]$ wc -l etc.txt 
183 etc.txt

但是这样未免显得太麻烦了。所以,管道的概念应运而生。目前在任何一个 shell 中,都可以使用“|”连接两个命令,shell 会将前后两个进程的输入输出用一个管道相连,以便达到进程间通信的目的:

[zorro@zorro-pc pipe]$ ls -l /etc/ | wc -l
183

对比以上两种方法,我们也可以理解为,管道本质上就是一个文件,前面的进程以写方式打开文件,后面的进程以读方式打开。这样前面写完后面读,于是就实现了通信。实际上管道的设计也是遵循 UNIX 的“一切皆文件”设计原则的,它本质上就是一个文件。Linux 系统直接把管道实现成了一种文件系统,借助 VFS 给应用程序提供操作接口。

虽然实现形态上是文件,但是管道本身并不占用磁盘或者其他外部存储的空间。在 Linux 的实现上,它占用的是内存空间。所以,Linux 上的管道就是一个操作方式为文件的内存缓冲区。

管道的分类和使用

Linux 上的管道分两种类型:

匿名管道

命名管道

这两种管道也叫做有名或无名管道。匿名管道最常见的形态就是我们在 shell 操作中最常用的”|”。它的特点是只能在父子进程中使用,父进程在产生子进程前必须打开一个管道文件,然后 fork 产生子进程,这样子进程通过拷贝父进程的进程地址空间获得同一个管道文件的描述符,以达到使用同一个管道通信的目的。此时除了父子进程外,没人知道这个管道文件的描述符,所以通过这个管道中的信息无法传递给其他进程。这保证了传输数据的安全性,当然也降低了管道了通用性,于是系统还提供了命名管道。

我们可以使用 mkfifo 或 mknod 命令来创建一个命名管道,这跟创建一个文件没有什么区别:

[zorro@zorro-pc pipe]$ mkfifo pipe
[zorro@zorro-pc pipe]$ ls -l pipe 
prw-r--r-- 1 zorro zorro 0 Jul 14 10:44 pipe

可以看到创建出来的文件类型比较特殊,是 p 类型。表示这是一个管道文件。有了这个管道文件,系统中就有了对一个管道的全局名称,于是任何两个不相关的进程都可以通过这个管道文件进行通信了。比如我们现在让一个进程写这个管道文件:

[zorro@zorro-pc pipe]$ echo xxxxxxxxxxxxxx   pipe

此时这个写操作会阻塞,因为管道另一端没有人读。这是内核对管道文件定义的默认行为。此时如果有进程读这个管道,那么这个写操作的阻塞才会解除:

[zorro@zorro-pc pipe]$ cat pipe 
xxxxxxxxxxxxxx

大家可以观察到,当我们 cat 完这个文件之后,另一端的 echo 命令也返回了。这就是命名管道。

Linux 系统无论对于命名管道和匿名管道,底层都用的是同一种文件系统的操作行为,这种文件系统叫 pipefs。大家可以在 /etc/proc/filesystems 文件中找到你的系统是不是支持这种文件系统:

[zorro@zorro-pc pipe]$ cat /proc/filesystems |grep pipefs
nodev pipefs

观察完了如何在命令行中使用管道之后,我们再来看看如何在系统编程中使用管道。

PIPE

我们可以把匿名管道和命名管道分别叫做 PIPE 和 FIFO。这主要因为在系统编程中,创建匿名管道的系统调用是 pipe(),而创建命名管道的函数是 mkfifo()。使用 mknod()系统调用并指定文件类型为为 S_IFIFO 也可以创建一个 FIFO。

使用 pipe()系统调用可以创建一个匿名管道,这个系统调用的原型为:

#include  unistd.h 
int pipe(int pipefd[2]);

这个方法将会创建出两个文件描述符,可以使用 pipefd 这个数组来引用这两个描述符进行文件操作。pipefd[0]是读方式打开,作为管道的读描述符。pipefd[1]是写方式打开,作为管道的写描述符。从管道写端写入的数据会被内核缓存直到有人从另一端读取为止。我们来看一下如何在一个进程中使用管道,虽然这个例子并没有什么意义:

[zorro@zorro-pc pipe]$ cat pipe.c
#include  stdlib.h 
#include  stdio.h 
#include  unistd.h 
#include  string.h 
#define STRING  hello world! 
int main()
 int pipefd[2];
 char buf[BUFSIZ];
 if (pipe(pipefd) == -1) { perror( pipe() 
 exit(1);
 }
 if (write(pipefd[1], STRING, strlen(STRING))   0) { perror( write() 
 exit(1);
 }
 if (read(pipefd[0], buf, BUFSIZ)   0) { perror( write() 
 exit(1);
 }
 printf(%s\n , buf);
 exit(0);
}

这个程序创建了一个管道,并且对管道写了一个字符串之后从管道读取,并打印在标准输出上。用一个图来说明这个程序的状态就是这样的:

一个进程自己给自己发送消息这当然不叫进程间通信,所以实际情况中我们不会在单个进程中使用管道。进程在 pipe 创建完管道之后,往往都要 fork 产生子进程,成为如下图表示的样子:

如图中描述,fork 产生的子进程会继承父进程对应的文件描述符。利用这个特性,父进程先 pipe 创建管道之后,子进程也会得到同一个管道的读写文件描述符。从而实现了父子两个进程使用一个管道可以完成半双工通信。此时,父进程可以通过 fd[1]给子进程发消息,子进程通过 fd[0]读。子进程也可以通过 fd[1]给父进程发消息,父进程用 fd[0]读。程序实例如下:

[zorro@zorro-pc pipe]$ cat pipe_parent_child.c
#include  stdlib.h 
#include  stdio.h 
#include  unistd.h 
#include  string.h 
#include  sys/types.h 
#include  sys/wait.h 
#define STRING  hello world! 
int main()
 int pipefd[2];
 pid_t pid;
 char buf[BUFSIZ];
 if (pipe(pipefd) == -1) { perror( pipe() 
 exit(1);
 }
 pid = fork();
 if (pid == -1) { perror( fork() 
 exit(1);
 }
 if (pid == 0) {
 /* this is child. */
 printf(Child pid is: %d\n , getpid());
 if (read(pipefd[0], buf, BUFSIZ)   0) { perror( write() 
 exit(1);
 }
 printf(%s\n , buf);
 bzero(buf, BUFSIZ);
 snprintf(buf, BUFSIZ,  Message from child: My pid is: %d , getpid());
 if (write(pipefd[1], buf, strlen(buf))   0) { perror( write() 
 exit(1);
 }
 } else {
 /* this is parent */
 printf(Parent pid is: %d\n , getpid());
 snprintf(buf, BUFSIZ,  Message from parent: My pid is: %d , getpid());
 if (write(pipefd[1], buf, strlen(buf))   0) { perror( write() 
 exit(1);
 }
 sleep(1);
 bzero(buf, BUFSIZ);
 if (read(pipefd[0], buf, BUFSIZ)   0) { perror( write() 
 exit(1);
 }
 printf(%s\n , buf);
 wait(NULL);
 }

 exit(0); }

父进程先给子进程发一个消息,子进程接收到之后打印消息,之后再给父进程发消息,父进程再打印从子进程接收到的消息。程序执行效果:

[zorro@zorro-pc pipe]$ ./pipe_parent_child 
Parent pid is: 8309
Child pid is: 8310
Message from parent: My pid is: 8309
Message from child: My pid is: 8310

从这个程序中我们可以看到,管道实际上可以实现一个半双工通信的机制。使用同一个管道的父子进程可以分时给对方发送消息。我们也可以看到对管道读写的一些特点,即:

在管道中没有数据的情况下,对管道的读操作会阻塞,直到管道内有数据为止。当一次写的数据量不超过管道容量的时候,对管道的写操作一般不会阻塞,直接将要写的数据写入管道缓冲区即可。

当然写操作也不会再所有情况下都不阻塞。这里我们要先来了解一下管道的内核实现。上文说过,管道实际上就是内核控制的一个内存缓冲区,既然是缓冲区,就有容量上限。我们把管道一次最多可以缓存的数据量大小叫做 PIPESIZE。内核在处理管道数据的时候,底层也要调用类似 read 和 write 这样的方法进行数据拷贝,这种内核操作每次可以操作的数据量也是有限的,一般的操作长度为一个 page,即默认为 4k 字节。我们把每次可以操作的数据量长度叫做 PIPEBUF。POSIX 标准中,对 PIPEBUF 有长度限制,要求其最小长度不得低于 512 字节。PIPEBUF 的作用是,内核在处理管道的时候,如果每次读写操作的数据长度不大于 PIPEBUF 时,保证其操作是原子的。而 PIPESIZE 的影响是,大于其长度的写操作会被阻塞,直到当前管道中的数据被读取为止。

在 Linux 2.6.11 之前,PIPESIZE 和 PIPEBUF 实际上是一样的。在这之后,Linux 重新实现了一个管道缓存,并将它与写操作的 PIPEBUF 实现成了不同的概念,形成了一个默认长度为 65536 字节的 PIPESIZE,而 PIPEBUF 只影响相关读写操作的原子性。从 Linux 2.6.35 之后,在 fcntl 系统调用方法中实现了 F_GETPIPE_SZ 和 F_SETPIPE_SZ 操作,来分别查看当前管道容量和设置管道容量。管道容量容量上限可以在 /proc/sys/fs/pipe-max-size 进行设置。

#define BUFSIZE 65536
......
ret = fcntl(pipefd[1], F_GETPIPE_SZ);
if (ret   0) { perror( fcntl() 
 exit(1);
printf(PIPESIZE: %d\n , ret);
ret = fcntl(pipefd[1], F_SETPIPE_SZ, BUFSIZE);
if (ret   0) { perror( fcntl() 
 exit(1);
......

PIPEBUF 和 PIPESIZE 对管道操作的影响会因为管道描述符是否被设置为非阻塞方式而有行为变化,n 为要写入的数据量时具体为:

O_NONBLOCK 关闭,n = PIPE_BUF:

n 个字节的写入操作是原子操作,write 系统调用可能会因为管道容量 (PIPESIZE) 没有足够的空间存放 n 字节长度而阻塞。

O_NONBLOCK 打开,n = PIPE_BUF:

如果有足够的空间存放 n 字节长度,write 调用会立即返回成功,并且对数据进行写操作。空间不够则立即报错返回,并且 errno 被设置为 EAGAIN。

O_NONBLOCK 关闭,n PIPE_BUF:

对 n 字节的写入操作不保证是原子的,就是说这次写入操作的数据可能会跟其他进程写这个管道的数据进行交叉。当管道容量长度低于要写的数据长度的时候 write 操作会被阻塞。

O_NONBLOCK 打开,n PIPE_BUF:

如果管道空间已满。write 调用报错返回并且 errno 被设置为 EAGAIN。如果没满,则可能会写入从 1 到 n 个字节长度,这取决于当前管道的剩余空间长度,并且这些数据可能跟别的进程的数据有交叉。

以上是在使用半双工管道的时候要注意的事情,因为在这种情况下,管道的两端都可能有多个进程进行读写处理。如果再加上线程,则事情可能变得更复杂。实际上,我们在使用管道的时候,并不推荐这样来用。管道推荐的使用方法是其单工模式:即只有两个进程通信,一个进程只写管道,另一个进程只读管道。实现为:

[zorro@zorro-pc pipe]$ cat pipe_parent_child2.c
#include  stdlib.h 
#include  stdio.h 
#include  unistd.h 
#include  string.h 
#include  sys/types.h 
#include  sys/wait.h 
#define STRING  hello world! 
int main()
 int pipefd[2];
 pid_t pid;
 char buf[BUFSIZ];
 if (pipe(pipefd) == -1) { perror( pipe() 
 exit(1);
 }
 pid = fork();
 if (pid == -1) { perror( fork() 
 exit(1);
 }
 if (pid == 0) {
 /* this is child. */
 close(pipefd[1]);
 printf(Child pid is: %d\n , getpid());
 if (read(pipefd[0], buf, BUFSIZ)   0) { perror( write() 
 exit(1);
 }
 printf(%s\n , buf);
 } else {
 /* this is parent */
 close(pipefd[0]);
 printf(Parent pid is: %d\n , getpid());
 snprintf(buf, BUFSIZ,  Message from parent: My pid is: %d , getpid());
 if (write(pipefd[1], buf, strlen(buf))   0) { perror( write() 
 exit(1);
 }
 wait(NULL);
 }

 exit(0); }

这个程序实际上比上一个要简单,父进程关闭管道的读端,只写管道。子进程关闭管道的写端,只读管道。整个管道的打开效果最后成为下图所示:

此时两个进程就只用管道实现了一个单工通信,并且这种状态下不用考虑多个进程同时对管道写产生的数据交叉的问题,这是最经典的管道打开方式,也是我们推荐的管道使用方式。另外,作为一个程序员,即使我们了解了 Linux 管道的实现,我们的代码也不能依赖其特性,所以处理管道时该越界判断还是要判断,该错误检查还是要检查,这样代码才能更健壮。

FIFO

命名管道在底层的实现跟匿名管道完全一致,区别只是命名管道会有一个全局可见的文件名以供别人 open 打开使用。再程序中创建一个命名管道文件的方法有两种,一种是使用 mkfifo 函数。另一种是使用 mknod 系统调用,例子如下:

[zorro@zorro-pc pipe]$ cat mymkfifo.c
#include  stdio.h 
#include  sys/types.h 
#include  sys/stat.h 
#include  stdlib.h 
int main(int argc, char *argv[])
 if (argc != 2) {
 fprintf(stderr,  Argument error!\n 
 exit(1);
 }
 if (mkfifo(argv[1], 0600)   0) { perror( mkfifo() 
 exit(1);
 }
 if (mknod(argv[1], 0600|S_IFIFO, 0)   0) { perror( mknod() 
 exit(1);
 }
 exit(0);
}

我们使用第一个参数作为创建的文件路径。创建完之后,其他进程就可以使用 open()、read()、write()标准文件操作等方法进行使用了。其余所有的操作跟匿名管道使用类似。需要注意的是,无论命名还是匿名管道,它的文件描述都没有偏移量的概念,所以不能用 lseek 进行偏移量调整。

读到这里,这篇“linux 管道是什么及怎么使用”文章已经介绍完毕,想要掌握这篇文章的知识点还需要大家自己动手实践使用过才能领会,如果想了解更多相关内容的文章,欢迎关注丸趣 TV 行业资讯频道。

正文完
 
丸趣
版权声明:本站原创文章,由 丸趣 2023-07-12发表,共计7459字。
转载说明:除特殊说明外本站除技术相关以外文章皆由网络搜集发布,转载请注明出处。
评论(没有评论)