前言
作者:小蜗牛向前冲
名言:我可以接受失败,但我不能接受放弃
如果觉的博主的文章还不错的话,还请点赞,收藏,关注支持博主。如果发现有问题的地方欢迎❀大家在评论区指正。
本期学习目标:知道什么是文件描述符, 了解文件描述符的分配规则,认识重定向。
一、文件描述符
1、初识文件描述符
我们在学习打开文件的接口open函数时,他的返回值就文件描述符,当时我们认为他是一个小的整数。
眼见为实,耳听为虚,验证一下:
#define _CRT_SECURE_NO_WARNINGS #include<stdio.h> #include<sys/types.h> #include<sys/stat.h> #include<fcntl.h> int main() { int fd = open("add.txt", O_WRONLY | O_CREAT | O_TRUNC, 0666); if (fd < 0) { perror("open"); return 1; } //在显示器中打印fd的值 fprintf(stdout, "open fd: %d\n", fd); close(fd); return 0; }
这样我们就验证了fd是一个小的整数,但是这个文件描述符有什么用呢?对应open函数来说,成功打开文件就返回fd,失败就返回-1。
对于文件描述符的用处,这里我们就不得不提操作系统是如何管理文件的,要管理文件也就是要管理进程,而要管理一个进程一般都是先描述,在组织;当我们打开一个文件,操作系统就要创建相应的数据结构来管理文件,在task_struct结构体中就有一个file*的指针指向,一张表files_struct这张表有一个核心的部分指针数组fd_array[],里面的每个元素都是一个指向打开文件的指针,通过文件指针来管理内存中的文件。这个数组的下标就称为文件描述符。
也就是文件描述符fd的本质:是数组下标,通过文件描述符fd就能找到要管理的文件。
虽然我们知道了文件描述是什么?但是当我们通过open打开文件,他的文件描述符fd,为什么是3呢?
这要就了解文件描述符是如何分配的。
2、文件描述符的分配规则
Linux进程默认情况下会有3个缺省打开的文件描述符,分别是标准输入0, 标准输出1, 标准错误2,也就是说fd_array[]数组下标从0到2下标都被占用了。那给我新打开的文件操作符分配了fd = 3,会不会被的文件操作符的分配就是从3开始的呢?
下面我们关闭fd = 0这个下标看看会发生什么?
close(0);//关闭fd = 0,进行观察
这时发现打印fd = 0。
继续关闭fd = 1,会发现什么?
close(1);//关闭fd = 1,进行观察
这里发现当我们执行程序后,屏幕中并没有打印出fd的值。
难道程序出现了bug?下面我们继续关闭fd = 2的接口,其他都不变。
close(2);//关闭fd = 2,进行观察
这时发现,fd = 2被打印出来了,也就是说没有出现bug,那么为什么三次会出现不同的现象呢?
现象汇总
关闭fd = 0
屏幕上打印出fd = 0
关闭fd = 1
屏幕上并没有打印出fd
关闭fd = 2
屏幕中打印出fd = 2
为什么会这样呢?
其实文件描述符fd的分配规则:是从小到大 ,遵循寻找最小而且没有被占用的的fd分配。
这也就是为什么我们关闭了fd = 0和fd =2,会打印出fd = 0,fd = 2;因为关闭后就没有被占用了自然就可以被操作系统分配。
至于为什么关闭fd = 1会出现,显示器不打印的情况,因为fd = 1最初的指向是指向控制显示器输出的文件,我们关闭了fd =1,操作系统就不能找到显示器输出文件,所以就无法正常打印,但是实际上fd 就是被分配到了fd = 1这个数组下标里。
二、重定向
1、认识重定向
我们还是要聊一聊上面的代码,当我们关闭了1,是指的是将fd = 1里面的指针不在指向显示器了,而指向了我们的文件,也就是向我们的文件打印的。
但是我们又观察到,这里的add.txt中什么也没有啊,不是说向文件中打印内容吗?其实这是和缓存区有关(这个问题,下次在聊),这里只要我们重新刷新缓存区就可以了。
这里通过C语言的接口函数fflush强制进行刷新。
这时候add.txt文件中果然被写入fd。
对应上面这种现象我们就称为重定向,我们将本来fd = 1处的指针本应该指向显示器的重定向的指向了我们自己的文件。
重定向的本质是指向:上层的使用的fd不变,在内核中更改fd对应的struct file*的地址。
但是这样重定向会不会太麻烦,每次都要进行关闭fd,其实操作系统为我们提供了专门的重定向的接口。
2、重定向的接口函数dup2
通过重定向的接口dup2,我们就可以很方便进行重定向的工作。
函数原型:
int dup2(int oldfd, int newfd);
虽然dup接口有三种类型,但是我们最为常用的还是dup2。
函数的参数
上面红框中的部分大意说的是 :newfd是oldfd的应该副本,如果有必要请关闭newfd,也就是最初我们关闭fd =1,这样在去调用重定向。下面是他的注意事项:
- 如果 oldfd 不是有效的文件描述符,则调用将失败,并且 newfd 不会关闭。
- 如果 oldfd 是一个有效的文件描述符,并且 newfd 的值与 oldfd 相同,那么 dup2()可以 什么都没有,并返回 newFD。
oldfd: 指的是我们文件的fd
newfd: 指的是要重定向到那个fd中的fd
这个参数的命名,可能会引起大家的误会,下面我们在代码中去理解。
#define _CRT_SECURE_NO_WARNINGS #include<stdio.h> #include<sys/types.h> #include<sys/stat.h> #include<fcntl.h> int main() { int fd = open("add.txt", O_WRONLY | O_CREAT | O_TRUNC, 0666); if (fd < 0) { perror("open"); return 1; } dup2(fd,1);//重定向 fprintf(stdout, "open fd: %d\n", fd); close(fd); return 0; }
当我们运行程序,就向add.txt中写入了内容。
3、二种重定向
下面为大家介绍二种常见的重定向:输入重定向(<)和输出重定向(>)。
输入重定向(<)
对于他的理解我们完全可以从字面意思上理解,指的是重新指定设备来代替键盘作为新的输入设备。
命令符格式:命令 < 文件
下面我们在代码中进一步理解:
int main() { int fd = open("add.txt", O_RDONLY); if (fd < 0) { perror("open"); return 1; } dup2(fd, 0);//重定向 char line[64]; while (1) { printf("<"); if (fgets(line, sizeof(line), stdin) == NULL)break; printf("%s", line); } return 0; }
这是我们提前向add.txt中写的内容 ,下面运行程序
这里我们就将add.txt中的内容,从文件中直接按行读取了,不在需要在键盘中读取了,也就是输入重定向。
这里也就是类似于:
cat < add.txt
输出重定向(>)
字面意思理解:指的是重新指定设备来代替显示器作为新的输出设备。
命令符格式:命令 >文件
这里我们用输出重定向 ,其实就是将命令执行的标准输出结果重定向输出到指定的文件中,如果该文件已包含数据,会清空原有数据,再写入新数据