前言:本章重点
- 为什么使用文件
- 什么是文件
- 文件的打开和关闭
- 文件的顺序读写
- 文件的随机读写
- 文本文件和二进制文件
- 文件读取结束的判定
- 文件缓冲区
一. 为什么使用文件
数据是存放在内存中,当程序退出的时候之前的数据就会消失,很不方便。而使用文件我们可以将数据直接存放在电脑的硬盘上,做到了数据的持久化。
二. 什么是文件
文件一般分为两中:程序文件、数据文件
而我们讨论的重点则是数据文件
2.1 程序文件
包括源程序文件(后缀为.c),目标文件(windows环境后缀为.obj),可执行程序(windows环境后缀为.exe)。
2.2 数据文件
文件的内容不一定是程序,而是程序运行时读写的数据,比如程序运行需要从中读取数据的文件,或者输出内容的文件。
2.3 文件名
一个文件要有一个唯一的文件标识,以便用户识别和引用。
文件名包含3部分:文件路径+文件名主干+文件后缀
例如: c:\code\test.txt
为了方便起见,文件标识常被称为文件名。
文件名一定不能搞错 ,一旦文件名出错可能找不到文件,一定要注重每个部分
三. 文件的打开和关闭
3.1 文件指针
每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息.这些信息是保存在一个结构体变量中的。该结构体类型是由系统
声明的,取名FILE.
3.2 文件的打开和关闭
文件应该在使用前应先打开文件,使用后关闭文件,这些操作有专门的函数来操作
打开文件
关闭文件
几中常见的文件打开方式如下:
四. 文件的顺序读写
4.1 对比一组函数
scanf / fscanf / sscanf
printf / fprintf / sprintf
首先介绍一下:
这样屏幕上就会出想光标等待着你输入
直接在屏幕上打印字符
以上就是这些函数用法
再而我们介绍一下sscanf – sprintf
sscanf -> 把字符串数据转化为格式化数据
sprintf -> 把格式化数据转化为字符串数据
再而我们介绍一下fscanf – fprintf
fscanf -> 针对所有输入流(文件流/stdin)格式化的输入函数;
fprintf -> 针对所有输出流(文件流/stdout)格式化的输出函数;
所以这三组函数的区别
五. 文件的随机读写
5.1 fseek
根据文件指针的位置和偏移量来定位文件指针。
5.2 ftell
返回文件指针相对于起始位置的偏移量
int main() { FILE* pf = fopen("text.txt", "r"); if (pf == NULL) { perror("fopen"); return 1; } int i = 0; for (i = 0; i < 10; i++) { printf("%c ",fgetc(pf)); } int ret = ftell(pf); printf("\n%d\n", ret); fclose(pf); pf = NULL; return 0; }
5.3 rewind
让文件指针的位置回到文件的起始位置
int main() { FILE* pf = fopen("text.txt", "r"); if (pf == NULL) { perror("fopen"); return 1; } int i = 0; for (i = 0; i < 10; i++) { printf("%c ",fgetc(pf)); } rewind(pf); printf("%c ", fgetc(pf)); printf("%c \n", fgetc(pf)); fclose(pf); pf = NULL; return 0; }
六. 文本文件和二进制文件
文本文件和二进制文件
数据在内存中以二进制的形式存储,如果不加转换的输出到外存,就是二进制文件。
外存上以ASCII码的形式存储,则需要在存储前转换。以ASCII字符的形式存储的文件就是文本文件。
测试代码:
int main() { int a = 10000; FILE* pf = fopen("test.txt", "wb"); fwrite(&a, 4, 1, pf);//二进制的形式写到文件中 //10000 //00000000 00000000 00100111 00010000 // 00 00 27 10 fclose(pf); pf = NULL; return 0; }
而这正是10000的二进制表示
七. 文件读取结束的判定
牢记:在文件读取过程中,不能用feof函数的返回值直接用来判断文件的是否结束。而是应用于当文件读取结束的时候,判断是读取失败结束,还是遇到文件尾结束
在文本文件和二进制文件的判定方式是不同的
- 文本文件读取是否结束,判断返回值是否为 EOF ( fgetc ),或者 NULL ( fgets )
例如:
fgetc 判断是否为 EOF .
fgets 判断返回值是否为 NULL .
- 二进制文件的读取结束判断,判断返回值是否小于实际要读的个数。
例如:
fread判断返回值是否小于实际要读的个数。
这里给大家举个文本文件的例子:
int main() { int c; // 注意:int,非char,要求处理EOF FILE* fp = fopen("test.txt", "r"); if (!fp) { perror("File opening failed"); return EXIT_FAILURE; } //fgetc 当读取失败的时候或者遇到文件结束的时候,都会返回EOF while ((c = fgetc(fp)) != EOF) // 标准C I/O读取文件循环 { printf("%c ", c); } //判断是什么原因结束的 if (ferror(fp)) puts("I/O error when reading"); else if (feof(fp)) puts("End of file reached successfully"); return 0; }
八. 文件缓冲区
ANSIC 标准采用“缓冲文件系统”处理的数据文件的,所谓缓冲文件系统是指系统自动地在内存中为程序中每一个正在使用的文件开辟一块“文件缓冲区”。从内存向磁盘输出数据会先送到内存中的缓冲区,装满缓冲区后才一起送到磁盘上。如果从磁盘向计算机读入数据,则从磁盘文件中读取数据输入到内存缓冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(程序变量等)。缓冲区的大小根据C编译系统决定的
8.1 验证缓冲区
文件缓冲区
#include <windows.h> int main() { FILE* pf = fopen("test.txt", "w"); fputs("abcdef", pf);//先将代码放在输出缓冲区 printf("睡眠10秒-已经写数据了,打开test.txt文件,发现文件没有内容\n"); Sleep(10000); printf("刷新缓冲区\n"); fflush(pf);//刷新缓冲区时,才将输出缓冲区的数据写到文件(磁盘) //注:fflush 在高版本的VS上不能使用了 printf("再睡眠10秒-此时,再次打开test.txt文件,文件有内容了\n"); Sleep(10000); fclose(pf); //注:fclose在关闭文件的时候,也会刷新缓冲区 pf = NULL; return 0; }
因此因为有缓冲区的存在,C语言在操作文件的时候,需要做刷新缓冲区或者在文件操作结束的时候关闭文件。
如果不做,可能导致读写文件的问题。
九. 感谢大家阅读