预备知识
在C语言阶段,我们学习过相关文件操作,但是,我们真的了解文件操作吗?
答案是并不了解,因为我们之前所学习的C语言文件操作,都是属于语言层面的操作,我们只是知道了fopen,fclose这些函数是怎么用,但是具体的底层原理并没有涉及接触。实际上,当涉及到文件操作的原理时,就不再是简单的语言问题,而是属于系统问题。
是否只有我们的C/C++才可以对文件进行操作呢?
答案也是否定的,其它比如JAVA、Python等语言也支持相关文件操作,只是不同语言的实现方法(语言级别)不同罢了,但是底层(系统级别)都会涉及到系统层面的相关操作。
如何看待文件?
文件=内容+属性,对文件的相关操作--->对内容/属性的相关操作
文件存放在磁盘中,只有当我们打开文件进行相关操作时,文件的属性会被加载到内存(冯诺伊曼体系结构决定,CPU只与内存交互)
对于大量被打开的文件,OS会进行管理,OS会创建struct file结构体,该结构体内包含对应文件的属性(先描述),然后通过某种数据结构,将各个文件对应的结构体连接起来(再组织)。对被打开文件的管理--->对该数据结构的增删查改。
文件是怎么打开的?由谁打开?
由用户通过创建进程(写代码,编译运行),底层会通过系统调用,从而让OS打开文件。
本章所讨论的文件操作都是针对被打开的文件。
文件操作
语言级别的文件操作(C)
文件的打开
FILE *fopen(const char *path, const char *mode);
对于该函数path表示打开或创建的目标文件(默认会在当前路径下创建/打开),mode表示文件的打开方式。对于mode来说,这里就简单介绍以下几种(更多的在前文:点击跳转):
FILE* fp1=fopen("./TEST/log.txt", "w");//只写,文件不存在在,在./TEST/下创建该文件 FILE* fp2=fopen("log.txt","a");//追加,文件不存在,在当前路径下创建该文件 FILE* fp3=fopen("log.txt","r");//只读,同一个文件可以被打开多次
文件的关闭
int fclose(FILE *fp);//对已打开的文件进行关闭。
对于一个被打开的文件,最后一定要关闭该文件。这就好比我们malloc出来的空间一定要free一样。fclose与fopen配套使用。
fclose(fp1); fclose(fp2); fclose(fp3);
文件的写入
C语言提供的写函数一共有以下几种:
对于上面的大多数函数,这里就不做过多讲解,可以自行前去观看,这里讲一下snprintf。snprintf是fprintf的优化版本,相较于fprintf,可以对写入数据进行长度控制,会更加安全。
int snprintf(char *str, size_t size, const char *format, ...);
str:表示要写入的缓冲区的地址
size:表示该缓冲区的大小
format:格式化可变参数(比如:"%d:%s\n",x,y )演示代码如下:
#include<stdio.h> #include<stdlib.h> #define SIZE 128 int main() { FILE* fp=fopen("log.txt","w");//写 //打开失败返回空 if(fp==NULL) { perror("fopen fail\n"); exit(-1); } char buffer[SIZE]; int cnt=10; const char* st="hello world!"; while(cnt) { //格式化写入到buffer数组 snprintf(buffer,sizeof(buffer),"%d:%s\n",cnt,st); //再将数组内容写到文件 fputs(buffer,fp); --cnt; } //关闭文件 fclose(fp); return 0; }
文件的读取
对于文件的读取,C提供的函数与上面一一对应,用法也是如此
文件读取演示:
#include<stdio.h> #include<stdlib.h> #include<string.h> #define SIZE 128
//文件的读取 int main() { FILE* fp=fopen("log.txt","r");//读方式打开 if(fp == NULL) { perror("fopen fail\n"); exit(-1); } //按行来读取文件 while(1) { //从文件流中按行读取内容,读到tmp中 char tmp[SIZE]; if(fgets(tmp,sizeof(tmp),fp)==NULL) { break; } //打印tmp printf("%s",tmp); } //关闭文件 fclose(fp); return 0; }
系统级别的文件操作
以上都是语言级别的文件相关操作。至此往下将讲解系统级别的相关文件操作。
文件的打开
对于文件的打开,我们采用open系统调用函数。如下:
//头文件
#include <sys/types.h> #include <sys/stat.h> #include <fcntl.h>
//系统调用函数open
int open(const char *pathname, int flags); int open(const char *pathname, int flags, mode_t mode);
对于该函数,有如下理解:
返回值:打开成功,返回一个int类型的整数->文件描述符(下一章将重点讲解),失败返回-1。
参数pathname:打开或创建的目标文件(默认在当前路径打开/创建)。
参数flags:多参数选项,用一个整形来实现多个选项的传递。以下为flags对应的参数选项,通常用或位运算来表示一个或多个参数。
对于多参数选项flags:
多参数传递实际上采用的就是位图的方式来实现,一个整形一共32个比特位,每一个比特位都可以用来表示一个参数,用|运算符则可以实现一个整形传递多个参数选项。
我们可以利用此特点来自己实现一个小demo,如下图所示:
参数flags便是利用此特点来实现一个整形多个参数选项。与我们的C语言对应关系如下;
参数mode:创建文件时给文件一个权限
文件的关闭
通过系统调用函数close来关闭一个文件,该函数如下:
#include <unistd.h> int close(int fd);
其中这里的fd就是文件描述符,也就是open函数返回的那个整形。具体含义将在下一篇详细讲解。
文件写入
通过函数write来实现文件的写入操作
#include <unistd.h> ssize_t write(int fd, const void *buf, size_t count);
对于该函数:
返回值:写入成功,会返回写入的内容的大小(单位:字节)失败返回-1
参数fd:文件描述符即open函数的返回值
参数buf:缓冲区的地址
参数count:表示写入的文件的大小
具体案例操作:
#include<stdio.h> #include<stdlib.h> #include<string.h> #include<unistd.h> #include<sys/types.h> #include<sys/stat.h> #include<fcntl.h> #define SIZE 128 int main() { umask(0);//设置umask为0 int fd=open("log.txt",O_CREAT|O_WRONLY|O_TRUNC,0666);//以写的方式打开文件,文件不存在则创建,打开之前会清空原文件,创建时文件权限为0666
//打开失败 if(fd == -1) { perror("open fail\n"); exit(-1); } char buffer[SIZE];//充当缓冲区的buffer数组 const char* str="hello world"; int cnt=10; //利用snprintf进行格式化写入到缓冲区,再写入到文件 while(cnt) { snprintf(buffer,sizeof(buffer),"%d:%s\n",cnt,str); --cnt; ssize_t n=write(fd,buffer,strlen(buffer));//这里我们不需要将/0计算在内,因为/0是C语言规定的字符串结尾,此时我们处于系统级别 printf("成功写入%lu个字节内容\n",n);//%lu:无符号整型 //间隔1秒写入一次 sleep(1); } //关闭文件 close(fd); return 0; }
运行结果如下:
文件的读取
对于文件的读取,提供了函数read
#include <unistd.h> ssize_t read(int fd, void *buf, size_t count);
对于该函数:
返回值:读取成功,返回读取的内容的大小,失败返回-1
参数fd:文件描述符
参数buf:缓冲区地址,用来存放读到的数据
count:一次读取字符的大小到缓冲区buf
具体操作如下:
#include<stdio.h> #include<stdlib.h> #include<string.h> #include<unistd.h> #include<sys/types.h> #include<sys/stat.h> #include<fcntl.h> #define SIZE 128
//文件读取
int main() { int fd=open("log.txt",O_RDONLY);//读方式打开文件 if(fd== -1) { perror("open fail\n"); exit(-1); } char buffer[SIZE];//读到的内容放进buffer数组 //注意处理\0 ssize_t n=read(fd,buffer,sizeof(buffer)-1); //读取成功 if(n>0) { buffer[n]='\0'; printf("%s共读取%lu字节的内容\n",buffer,n);//字符串结尾的标志\0(这里我们用printf打印,属于C语言级别,所以得考虑\0的存在) } //关闭文件 close(fd); return 0; }
运行结果如下:
语言操作与系统级别的文件操作区别
实际上,我们所有的语言级别的文件操作都是对系统调用的封装,比如我们使用的fclose,fopen等函数,他们的底层实际上都会调用对应的系统级别的函数,比如close、open等。也就是说,语言级别的文件操作的底层,并不会直接跳过OS,而是一层一层往下进行。