1、文件的随机读写
(1)fseek
创建一个文件test.txt,里面放了abcdef这样的字符串,我们先前在读文件时,最开始的文件指针是指向a的,读一个字符指向b,再读一个指向c……此时是按照顺序读取的,此时是文件的顺序读写。先来回顾下:
#include<stdio.h> int main() { //打开文件 FILE* pf = fopen("test.txt", "r"); if (pf == NULL) { perror("fopen"); return 1; } //读取文件 int ch = fgetc(pf); printf("%c\n", ch); //a ch = fgetc(pf); printf("%c\n", ch); //b ch = fgetc(pf); printf("%c\n", ch); //c //关闭文件 fclose(pf); pf = NULL; return 0; }
那可不可以按照我们想要的读取方式呢,例如直接读取到d,此时就涉及到了文件指针定位的一个函数:fseek
fseek:移动一个文件指针到一个特定位置
根据文件指针的位置和偏移量来定位文件指针。
int fseek ( FILE * stream, long int offset, int origin );
- 理解三个参数:
- stream:针对哪个流
- offset:偏移量
- origin:起始位置
- 而起始位置的选项有三种SEEK_CUR:
1、让文件从当前位置向前偏移1个字节:
//读取文件 int ch = fgetc(pf); printf("%c\n", ch); //a //调整文件指针 fseek(pf, -1, SEEK_CUR); ch = fgetc(pf); printf("%c\n", ch); //a ch = fgetc(pf); printf("%c\n", ch); //b
2、 让文件从当前位置向后偏移2个字节:
//读取文件 int ch = fgetc(pf); printf("%c\n", ch); //a //调整文件指针 fseek(pf, 2, SEEK_CUR); ch = fgetc(pf); printf("%c\n", ch); //d ch = fgetc(pf); printf("%c\n", ch); //e
- SEEK_END:从文件末尾开始向前偏移2字节
//读取文件 int ch = fgetc(pf); printf("%c\n", ch); //a //调整文件指针 fseek(pf, -2, SEEK_END); ch = fgetc(pf); printf("%c\n", ch); //e ch = fgetc(pf); printf("%c\n", ch); //f
- SEEK_SET:
从文件起始位置开始向后偏移3字节
//读取文件 int ch = fgetc(pf); printf("%c\n", ch); //a //调整文件指针 fseek(pf, 3, SEEK_SET); ch = fgetc(pf); printf("%c\n", ch); //d ch = fgetc(pf); printf("%c\n", ch); //e
(2)ftell
返回文件指针相对于起始位置的偏移量
long int ftell ( FILE * stream );
- 例如:
//读取文件 int ch = fgetc(pf); printf("%c\n", ch); //a //调整文件指针 fseek(pf, 3, SEEK_SET); ch = fgetc(pf); printf("%c\n", ch); //d int ret = ftell(pf); printf("%d\n", ret);//4
(3)rewind
让文件指针的位置回到文件的起始位置
void rewind ( FILE * stream );
- 例如:
//读取文件 int ch = fgetc(pf); printf("%c\n", ch); //a //调整文件指针 fseek(pf, -1, SEEK_END); ch = fgetc(pf); printf("%c\n", ch); //f //让文件回到起始位置 rewind(pf); ch = getc(pf); printf("%c\n", ch); //a
2、文本文件和二进制文件
根据数据的组织形式,数据文件被称为文本文件或者二进制文件。
数据在内存中以二进制的形式存储,如果不加转换的输出到外存,就是二进制文件。
如果要求在外存上以ASCII码的形式存储,则需要在存储前转换。以ASCII字符的形式存储的文件就是文本文件。
一个数据在内存中是怎么存储的呢?
字符一律以ASCII形式存储,数值型数据既可以用ASCII形式存储,也可以使用二进制形式存储。
如有整数10000,如果以ASCII码的形式输出到磁盘,则磁盘中占用5个字节(每个字符一个字节),而二进制形式输出,则在磁盘上只占4个字节(VS2013测试)。
- 测试:(以二进制形式存储)
#include <stdio.h> int main() { int a = 10000; FILE* pf = fopen("test.txt", "wb"); if (pf == NULL) { perror("fopen"); return 1; } fwrite(&a, sizeof(int), 1, pf);//二进制的形式写到文件中 fclose(pf); pf = NULL; return 0; }
我们把test.txt文件里的内容放到VS2022编译器里头看看:10000的二进制:0000 0000 0000 0000 0010 0111 0001 0000
将其转化成十六进制:00 00 27 10
3、文件读取结束的判定
(1)被错误使用的feof
牢记:在文件读取过程中,不能用feof函数的返回值直接用来判断文件的是否结束。
feof是应用于当文件读取结束的时候,判断是读取失败结束,还是遇到文件尾结束。
1. 文本文件读取是否结束,判断返回值是否为 EOF ( fgetc ),或者 NULL ( fgets )
例如:
fgetc 判断是否为 EOF .
fgets 判断返回值是否为 NULL .
2. 二进制文件的读取结束判断,判断返回值是否小于实际要读的个数。
例如:
fread判断返回值是否小于实际要读的个数。
例子:
假设我们把一段代码放在test.txt文件中
现在写代码把test.txt文件拷贝一份,生成test2.txt文件
#include<stdio.h> int main() { FILE* pfread = fopen("test.txt", "r"); if (pfread == NULL) { return 1; } FILE* pfwrite = fopen("test2.txt", "w"); if (pfwrite == NULL) { fclose(pfread); return 1; } //文件打开成功 //读写文件 int ch = 0; while ((ch = fgetc(pfread)) != EOF) { //写文件 fputc(ch, pfwrite); } //判断是什么原因结束的 if (feof(pfread)) { printf("遇到文件结束标志,文件正常结束\n"); } else if (ferror(pfread)) { printf("文件读取失败结束\n"); } //关闭文件 fclose(pfread); pfread = NULL; fclose(pfwrite); pfwrite = NULL; return 0; }
与test.txt文件的内容一模一样
4、文件缓冲区
是指系统自动地在内存中为程序中每一个正在使用的文件开辟一块“文件缓冲区”。从内存向磁盘输出数据会先送到内存中的缓冲区,装满缓冲区后才一起送到磁盘上。如果从磁盘向计算机读入数据,则从磁盘文件中读取数据输入到内存缓冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(程序变量等)。缓冲区的大小根据C编译系统决定的。
- 目的:提高操作系统的效率。
- 示例:
#include <stdio.h> #include <windows.h> int main() { FILE* pf = fopen("test.txt", "w"); fputs("abcdef", pf);//先将代码放在输出缓冲区 printf("睡眠10秒-已经写数据了,打开test.txt文件,发现文件没有内容\n"); Sleep(10000); printf("刷新缓冲区\n"); fflush(pf);//刷新缓冲区时,才将输出缓冲区的数据写到文件(磁盘) //注:fflush 在高版本的VS上不能使用了 printf("再睡眠10秒-此时,再次打开test.txt文件,文件有内容了\n"); Sleep(10000); fclose(pf); //注:fclose在关闭文件的时候,也会刷新缓冲区 pf = NULL; return 0; }
- 结论:
因为有缓冲区的存在,C语言在操作文件的时候,需要做刷新缓冲区或者在文件操作结束的时候关闭文件。如果不做,可能导致读写文件的问题。