该文章将详细的介绍文件操作这方面的知识,文件的打开,关闭,读取,写入,以及相关的函数都会在本文一一介绍,干货满满喔!
1.为什么使用文件
在写代码的时候,数据都是放在内存中的,而程序一关闭,数据就没有了,这就让人很难受,我们想把数据存下来,这就涉及到要将数据持久化,而一般让数据持久化的方法有,把数据存放在磁盘文件,存放到数据库等方式。
使用文件我们可以将数据直接存放在电脑的硬盘上,做到了数据的持久化。
(又比如我们在做一个通讯录时需要将通讯录的信息全部存着,在下次程序运行的时候,通讯录的信息仍然还在,只有我们自己选择删除才能将数据删除掉,这就需要用到文件操作了。)
2.什么是文件
磁盘上的文件是文件。
但是在程序设计中,我们一般谈的文件有两种:程序文件,数据文件(从文件功能角度分类)
2.1程序文件
包括源文件(后缀为.c),目标文件(后缀为.obj),可执行文件(后缀为.exe)。
2.2数据文件
文件的内容不一定是程序,而是程序运行时读写的数据,比如程序运行需要从中读取数据的文件,或者读写数据的文件,叫做数据文件。
该篇讲的主要是数据文件
我们平时处理数据的输入输出都是以终端为对象的,即从终端的键盘输入数据,运行结果显示到屏幕上去。
其实我们有时候会把数据输出到磁盘上,当需要的时候再从磁盘上把数据读取到内存中使用。这里处理的就是磁盘上的文件。
2.3文件名
一个文件要有一个唯一的文件标识,以便用户识别和使用。
文件名包含3部分:文件路径+文件
比如:
c:\vs\test.txt
为了方便起见文件标识常被称为文件名
3.文件的打开与关闭
3.1文件指针
···缓冲文件系统中,关键的概念是“文件类型指针”,简称“文件指针”。
每个文件在打开的时候都会在内存开辟一个对应的文件信息区,用来存放文件的相关信息(如文件的名字,文件状态及文件当前的位置等)。这些信息是保存在一个结构体变量中的。该结构体类型是由系统声明的取名为FILE
···每当打开一个文件的时候,系统会根据文件的情况自动创建一个FILE结构的变量,并填充其中的信息,我们不用关系这个结构体是什么,长什么样子。
而一般是通过一个FILE类型的指针来维护这个结构体的变量
比如:
FILE*pf;//文件指针变量
···简单的讲,就是当打开一个文件时,系统会将文件的信息整合到一个结构体中,然后我们可以通过FILE定义的指针来寻找这个文件的信息。这个pf文件指针就是指向文件的文件信息区。
···定义pf是一个指向FILE类型数据的指针变量。可以使pf指向某个文件的文件信息区(是一个结构体变量)。通过该文件信息区中的信息就能够访问该文件。也就是说,通过文件指针变量能够找到与它关联的文件。
例如:
3.2文件的打开与关闭
文件在读写之前要先打开文件,在使用结束后应该关闭文件。
在编写程序的时候,在打开文件的同时,都会返回一个FILE*的指针变量来指向该文件,就相当于建立起指针与文件之间的关系了。
ANSIC 规定使用fopen函数来打开文件,fclose来关闭文件。
//打开文件 FILE*fopen(const char*filename,const char *mode) //关闭文件 int flcose(FILE*stream)
fopen的使用:
打开方式如下:
实现代码:
#include <stdio.h> int main() { //打开文件 FILE* pf = fopen("test.txt", "w");//"w"打开一个叫test.txt文件 //如果会硬盘上有该文件,会把的文件内容销毁掉 //如果没有文件,则创建一个test.txt文件 if (pf == NULL) { perror("fopen");//报错 return 1; } else { printf("打开成功"); //使用 //………… fclose(pf);//关闭文件 pf = NULL; } return 0; }
4.文件的顺序读写
我们来分析一下这些函数与文件之间的关系:
所以输入函数就是读数据的
输出函数就是用来写取数据
写数据的:
1.
2.
3.
4.
读数据
1.
2.
3.
4.
代码1:读/写字符
int main() { //打开文件 FILE* pf = fopen("test.txt", "w");//打开文件会把上次的文件内容销毁掉 if (pf == NULL) { perror("fopen"); return 1; } printf("打开成功"); //写文件 fputc('a', pf); fputc('b', pf); fputc('c', pf); fputc('d', pf); fputc('e', pf); fclose(pf);//关闭文件 pf = NULL; return 0; }
将数据写入文件中了
int main() { FILE* pf = fopen("test.txt", "r");//以r的模式打开文件,进行读数据 if (pf == NULL) { perror("fopen"); return 1; } printf("打开成功\n"); // 读文件中的数据,因为上次将abcde写到文件中了,再读出来 char ch; ch = fgetc(pf); printf("%c\n", ch); ch = fgetc(pf); printf("%c\n", ch); ch = fgetc(pf); printf("%c\n", ch); fclose(pf); pf = NULL; return 0; }
又将文件中的数据读出来了。
代码2:读/写字符串
int main() { //打开文件 FILE* pf = fopen("test.txt", "w");//打开文件会把上次的文件内容销毁掉 if (pf == NULL) { perror("fopen"); return 1; } //写文件 printf("打开成功"); fputs("xiao tao\n", pf); fputs("lai lo\n", pf); fclose(pf);//关闭文件 pf = NULL; return 0; }
将数据写到文件中
int main() { FILE* pf = fopen("test.txt", "r");//以r的形式打开文件 if (pf == NULL) { perror("fopen"); return 1; } //读文件 char arr[20]; fgets(arr, 20, pf); printf("%s", arr); fgets(arr, 20, pf); printf("%s", arr); fclose(pf);//关闭文件 pf = NULL; return 0; }
将文件中的数据读取出来了
代码3:格式化写入数据–将数据写入文件
struct S { char arr[20]; int age; double sex; }; int main() {//打开文件 struct S s = {"xiao tao",20,3.14}; FILE* pf = fopen("test.txt", "w");//打开文件会把上次的文件内容销毁掉 if (pf == NULL) { perror("fopen"); return 1; } //格式化写数据到文件里 fprintf(pf,"%s %d %f", s.arr, s.age, s.sex); fclose(pf);//关闭文件 pf = NULL; return 0; }
代码4:格式化读取文件中的信息到内存
int main() {//打开文件 struct S s = {0};//首先要把这个结构体变量置0,让它来接收从文件中读取的数据 FILE* pf = fopen("test.txt", "r"); if (pf == NULL) { perror("fopen"); return 1; } //格式化读取文件中的信息 fscanf(pf,"%s %d %lf", s.arr, &(s.age), &(s.sex)); printf("%s %d %lf", s.arr, s.age, s.sex); fclose(pf);//关闭文件 pf = NULL; return 0; }
代码5:二进制形式将数据写到文件中
struct S { char name[20]; int age; float n; }; int main() {//打开文件 struct S s = { "xiao tao",20,100.0 }; FILE* pf = fopen("test.txt", "wb");//二进制形式写需要用"wb"形式 if (pf == NULL) { perror("fopen"); return 1; } //二进制写文件 fwrite(&s, sizeof(struct S), 1, pf); fclose(pf);//关闭文件 pf = NULL; return 0; }
可以明显的看出后面的形式看不懂,因为是以二进制形式写入的
代码6:二进制形式从文件中读取数据到内存
nt main() {//打开文件 struct S s = { 0 };//用来存放读取到文件中的信息 FILE* pf = fopen("test.txt", "rb"); if (pf == NULL) { perror("fopen"); return 1; } //二进制读文件 fread(&s, sizeof(struct S), 1, pf); printf("%s %d %f", s.name, s.age, s.n); fclose(pf);//关闭文件 pf = NULL; return 0; }
5.文件的随机读写
5.1 fseek
根据文件指针的位置和偏移量来定位文件指针
例子:
int main() { FILE* pFile; pFile = fopen("example.txt", "wb"); fputs("Xiao Tao Lai Lo", pFile); fseek(pFile, 9, SEEK_SET);//SEEK_SET文件开头位置 朝后9个偏移量 fputs(" sam", pFile); fclose(pFile); pFile = NULL; return 0; }
5.2 ftell
返回文件指针相对于起始位置的偏移量
例子:
int main() { long size; FILE* pf = fopen("myfile.txt", "rb"); if (pf == NULL) { perror("Error opening file"); } else { fseek(pf, 0, SEEK_END); //让当前指针不在最开始的位置 size = ftell(pf);//如果size大小是0,则表示指针变成最开始的位置了 fclose(pf); printf("Size of myfile.txt: %ld bytes.\n", size); } return 0;
5.3 rewind
让文件指针的位置回到文件的起始位置
int main() { long size; FILE* pf = fopen("myfile.txt", "rb"); if (pf == NULL) { perror("Error opening file"); } else { fseek(pf, 0, SEEK_END); //让当前指针不在最开始的位置 rewind(pf);//让当前指针返回到最开始的位置上去 size = ftell(pf);//如果size大小是0,则表示指针变成最开始的位置了 fclose(pf); printf("Size of myfile.txt: %ld bytes.\n", size); } return 0;
6.文本文件和二进制文件
根据数据的组织形式,数据文件被称为文本文件或者二进制文件。
数据在内存中以二进制的形式存储,如果不加转换的输出到外存,就是二进制文件。
如果要求在外存上以ASCII码的形式存储,则需要在存储前转换。以ASCII字符的形式存储的文件就是文本文件。
一个数据在内存中是怎么存储的呢?
字符一律以ASCII形式存储,数值型数据既可以用ASCII形式存储,也可以使用二进制形式存储。
如有整数10000,如果以ASCII码的形式输出到磁盘,则磁盘中占用5个字节(每个字符一个字节),而二进制形式输出,则在磁盘上只占4个字节
int main() { int a = 10000; FILE* pf = fopen("test.txt", "wb"); if (pf == NULL) { perror("fopen"); } else { //二进制读数据 fwrite(&a, 4, 1, pf); fclose(pf); pf = NULL; } return 0; }
10000以二进制形式写入到文件中我们无法解析什么意思
但编译器可以通过以二进制形式显示
但在编译器上是以16进制显示出来的
所有该文件就是二进制文件
7.文件读取结束的判断
错误使用feof
feof不是用于判断是否文件读取结束的
牢记:在文件读取过程中,不能用feof函数的返回值直接用来判断文件的是否结束
而是用于知道文件结束后,判断结束是因为什么原因结束的,判断是读取失败结束,还是遇到文件尾结束
1.判断文本文件读取是否结束,是判断返回值是否为EOF,或者NULL
例如:
- fgetc 判断是否为EOF
- fgets判断返回值是否为NULL
2.判断二进制文件读取是否结束,是判断返回值是否小于实际要读取的个数。
例如:
- fread判断返回值是否小于实际要读的个数
代码实现:
int main(void) { int c; // 注意:int,非char,要求处理EOF FILE* fp = fopen("test.txt", "r"); if (fp==NULL) { perror("File opening failed"); return 1; } //fgetc 当读取失败的时候或者遇到文件结束的时候,都会返回EOF while ((c = fgetc(fp)) != EOF) // 标准C I/O读取文件循环 { putchar(c); } //判断是什么原因结束的 if (ferror(fp))//如果ferror(fp)是真则说明出现错误导致结束 puts("I/O error when reading"); else if (feof(fp))//如果feof(fp)是真,则说明是遇到结尾导致结束 puts("End of file reached successfully"); fclose(fp); return 0; }
8.文件缓存区
ANSIC 标准采用“缓冲文件系统”处理的数据文件的,所谓缓冲文件系统是指系统自动地在内存中为程序中每一个正在使用的文件开辟一块“文件缓冲区”。从内存向磁盘输出数据会先送到内存中的缓冲区,装满缓冲区后才一起送到磁盘上。如果从磁盘向计算机读入数据,则从磁盘文件中读取数据输入到内存缓冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(程序变量等)。缓冲区的大小根据C编译系统决定的。
所以因为有缓冲区的存在,C语言在操作文件的时候,需要做刷新缓冲区或者在文件操作结束的时候关闭文件。
如果不做,可能导致读写文件的问题。