1. 前言
“在Linux系统下,一切皆文件”,相信你也
听过这句话, 那么怎样理解这句话呢?
学会这篇文字,你就能理解了
本章重点:
本篇文章着重讲解I/O的四个系统调用
接口, 以及文件描述符fd的认识与fd的
本质, 最后讲解应该怎样理解Linux下
一切皆文件这一说法.在此之前,会先复习
一下C语言的文件相关的库函数
2. 理解C语言的文件接口
首先C\C++程序会默认打开stdin,
stdout和stderr三个标准文件方便
程序员直接进行读写.
但是显然有点不对劲, 我们平时使用
printf和scanf时是从显示器中显示和
从键盘输入, 是不是代表显示器和键盘
在OS内部其实也可以看作文件?是的,
向显示器打印和向磁盘写入无本质区别!
C语言打开文件的方式: fopen
C语言的读取: fread, fscanf, fgets
C语言的写入: fwrite, fprintf, fputs
fopen的返回值和三个标准文件类型都是FILE*
2. 操作文件的系统调用接口
每个语言都有一套自己的文件操作函数
但不管上层语言怎样变化,它都是封装了
系统调用,所以文件的系统调用很重要!
一共四个函数:
open:
打开文件close:
关闭文件write:
向文件写入read:
从文件中读取
2.1 open函数详解
open函数的解释如下:
这个flag比较特殊,虽然它是整型,但是
内部却当作了位图在使用,即传递过来
的选项会被当作位图中的不同位,通过
判断某位是否为1来查看是否有这个选项
open的选项(实际上是宏定义的整数)
open的用法: 多个选项用或|分割
int fd = open("/home/kwy/test.txt",O_WRONLY | O_CREAT);
2.2 close函数详解
close函数很简单,意思就是关闭文件
描述符fd对应的文件, 调用成功返回0
2.3 write函数详解
write是向文件描述符fd对应的文件中
写入数据, 数据的来源是buf, 要写入的
字节数是count, 调用成功返回写入到
文件中的字节数
write的一般用法:
char* buffer = "abcdef"; int fd = open("/home/kwy/text.txt",O_WRONLY); write(fd,buffer,sizeof(buffer));
2.4 read函数详解
read是从文件描述符fd对应的文件
中读取数据, 将数据读取到buf中,要
读取的长度是count, 调用成功返回
读取到的字节数
read的一般用法:
char buffer[1024]; int fd = open("/home/kwy/text.txt",O_WRONLY); ssize_t n = read(fd,buffer,sizeof(buffer)); if(n > 0) buffer[n] = '\0';//将字符串变成C语言风格,以\0结尾
3. 文件描述符详解
我们知道文件描述符是一个整数,那么
它是否有什么规律呢?请看下面的代码:
int fd1 = open("/home/kwy/text1.txt",O_WRONLY | O_CREAT); int fd2 = open("/home/kwy/text2.txt",O_WRONLY | O_CREAT); int fd3 = open("/home/kwy/text3.txt",O_WRONLY | O_CREAT); int fd4 = open("/home/kwy/text4.txt",O_WRONLY | O_CREAT); printf("%d, %d, %d, %d",fd1,fd2,fd3,fd4);
会发现fa1,2,3,4的整数值分别是:
3,4,5,6,这是为什么?需要回答两个问题:
0号1号和2号描述符去哪儿了?
文件描述符的增长规律是什么?
首先, 在最开始说过C/C++程序会默认
打开stdin, stdout, stderr三个标准文件
所以其实0,1,2号文件描述符就是这三个
标准文件.其次, 0,1,2被使用后, 后面的文件描述符
会从3开始, 依次+1, 一共创建到6号描述符,
若此时将3号文件描述符关闭,下次打开文件
对应的描述符就是3,而不是7!
可以使用下面的代码来验证第一个猜想:
//向屏幕打印信息 const char* str = "abcdef"; write(1, str, strlen(str)); //从屏幕读取信息 char buffer[1024]; int n = read(0, buffer, sizeof(buffer)); if(n > 0) buffer[n] = '\0';
4. 文件描述符的内核本质
进程想要访问某个文件的前提是打开文件
在操作系统内可能会有很多个打开的文件
OS为了维护这些资源,需要对它进行管理
OS会为每个打开的文件创建struct file
结构体, 再用链表将这些结构体连接起来.
这是文件在OS内部的管理体系,
而每个进程都要知道自己打开了
哪些文件, 所以进程PCB中会保存
一张文件描述符表(本质是结构体指针)
这个表中存放了这个进程打开的所有文件
从这个图中可以看见, 文件描述符的本质
其实就是数组的下标,每次打开文件会去数
组中扫描,找到最近的没有被使用的下标
5. 怎样理解Linux下一切皆文件?
首先,底层不同的硬件如磁盘,显卡,键盘等
一定对应了不同的操作方法,但这些设备的
核心功能就是读写,也就是I/O
操作系统会为每一个底层硬件创建
struct file结构体,此结构体中一定包含
了两个函数指针,分别指向这个硬件
对应的读方法和写方法,于是和硬件
的交互实际上就变成了访问struct file
结构体中的指针,达到所以硬件一视同仁
6. 理解输出输入重定向
根据上面的推论,如果我先把1号描述符
关闭了,再打开一个文件,它的描述符就
应该是1,此时再进行输出会发现什么?
int main() { close(1); int fd = open("log.txt",O_WRONLY | O_CREAT | O_TRUNC, 0666); printf("fd: %d\n",fd); fprintf(stdout,"hello fprintf,我是一号文件描述符\n"); return 0; }
两个现象,第一个确实如刚刚所说的
新打开的文件的描述符就是1,并且
此时使用printf输出也不会输出到屏幕
使用fprintf向stdout也不会输出到屏幕
而是输出到文件log.txt中.说明stdout
只认文件描述符1,不管1此时还是不是
标准输出,printf函数也是如此
结论:重定向本质就是在OS内部修改fd对应的内容指向
7. 重定向的系统调用
如果每次写重定向都要先关闭一个文件
再来操作未免有些麻烦了,可以直接使
用系统调用dup或dup2函数
我们一般都使用dup2,它的意思是将
oldfd拷贝给newfd,最终和oldfd描述符
是一样的,比如现在想把本来应该打印
在显示器(1号描述符)的信息打印在
log.txt中(3号描述符),应该这样使用:
open("log.txt",O_WRONLY | O_CREAT); dup2(3,1);
1本来指向显示器的,现在将它指向
log.txt,所以要将3号描述符的内容
拷贝到1号描述符,最后1号描述符和3号一样
8. 总结
文件描述符是学习Linux下I/O的关键
而基础IO的知识将会一直陪伴我们到
学习Linux网络和高级IO,掌握文件描述
符fd的本质对后续的学习至关重要!
🔎 下期预告:缓冲区与文件系统 🔍