C语言进阶⑲(文件下篇)(文件读写+文本文件和二进制文件+EOF+文件缓冲区)(上):https://developer.aliyun.com/article/1513246
7. 文件读取结束的判定
读文件读到什么时候才算结束,是个非常值得我们探讨的问题。
7.1 被错误使用的feof
介绍:在文件结束时,判断文件因为何种原因导致文件结束的函数,判断是因为读取失败而结束,
还是因为遇到文件尾而结束。如果文件结束,则返回非0值,否则返回0。
错误用途:feof 函数是个经常被错误使用的一个函数。在文件读取过程中,不能用 feof 函数的返回值直接判断文件是否结束。
feof 不是用来判定文件是否结束了的,还是在文件已经结束时,判断是什么原因导致文件结束的。
正确用途:当文件读取结束时,判断是因为读取失败而结束,还是因为遇到文件尾而结束。
代码演示:feof 的用法:
#include <stdio.h> #include <stdlib.h> int main() { //注:先创建一个test7.txt写入一些单词 int ch = 0; // 注意:为int型而非char,要求处理EOF FILE* pf = fopen("test7.txt", "r"); if (!pf)// pf == NULL { perror("fopen"); return EXIT_FAILURE; // 符号常量EXIT_FAILURE,表示没有成功地执行一个程序 就是return 1; } // fgetc - 当读取失败的时候或者遇到文件结束的时候,都会返回EOF while ((ch = fgetc(pf)) != EOF) { putchar(ch); } printf("\n"); // 判断文件结束的原因 if (ferror(pf)) // ferror - 检查是否出现错误。 { puts("读取失败错误(I/O error when reading)"); } else if (feof(pf)) { puts("遇到文件尾而结束(End of file reached successfully) "); } // 文件关闭 fclose(pf); pf = NULL; return 0; }
7.2正确判定文件是否读取结束的方法
文本文件读取是否结束,判断返回值是否为 EOF(fgetc),或者 NULL(fgets),例如:
① fgetc 函数在读取结束时会返回 EOF,正常读取时,返回读取到的字符的 ASCII 码值。
② fgets 函数在读取结束时会返回 NULL,正常读取时,返回存放字符串的空间的起始地址。
③ fread 函数在读取结束时会返回 实际读取到的完整元素的个数,如果发现读取到的完整的元素个数小于指定的元素个数,那么就是最后一次读取了。
代码演示:在工程路径下手动创建一个叫 file.txt 的文件,在里面随便写几行文字。然后通过代码将 file.txt 文件拷贝一份,生成 file2.txt :
#include <stdio.h> int main() { FILE* pfread = fopen("file.txt", "r"); if (pfread == NULL) { return 1; } FILE* pfwrite = fopen("file2.txt", "w"); if (pfwrite == NULL) { fclose(pfread); pfread = NULL; return 1; } // 文件打开成功,读写文件 int ch = 0; // 读文件 ch = fgetc(pfread); while ((ch = fgetc(pfread)) != EOF) { // 写文件 fputc(ch, pfwrite); } // 关闭文件 fclose(pfread); pfread = NULL; fclose(pfwrite); pfwrite = NULL; return 0; }
代码演示:二进制读取的例子
#include <stdio.h> enum { SIZE = 5 }; int main() { double a[SIZE] = { 1.,2.,3.,4.,5. }; FILE* fp = fopen("test.bin", "wb"); // 必须用二进制模式 fwrite(a, sizeof * a, SIZE, fp); // 写double的数组 fclose(fp); double b[SIZE]; fp = fopen("test.bin", "rb"); size_t ret_code = fread(b, sizeof * b, SIZE, fp); // 读double的数组 if (ret_code == SIZE) { puts("数组读取成功,数组内容如下:"); for (int n = 0; n < SIZE; ++n) printf("%f ", b[n]); putchar('\n'); } else { // 异常处理 if (feof(fp)) { printf("test.bin 读取错误!unexpected end of file\n"); } else if (ferror(fp)) { perror("test.bin 读取错误!"); } } fclose(fp); return 0; }
8. 文件缓冲区
8.1什么是文件缓冲区
【百度百科】文件是指存储在外部存储介质上的、由文件名标识的一组相关信息的集合。 由于CPU 与 I/O 设备间速度不匹配。为了缓和 CPU 与 I/O 设备之间速度不匹配矛盾。 文件缓冲区是用以暂时存放读写期间的文件数据而在内存区预留的一定空间。 使用文件缓冲区可减少读取硬盘的次数。
介绍:ANSIC 标准采用缓冲文件系统来处理数据文件,
所谓的缓冲文件系统是指系统自动地在内存中为程序中每一个正在使用的文件开辟一块文件缓冲区。
规则如下:
① 如果从内存向磁盘输出数据,会先送到内存中的缓冲区,缓冲区装满后再一起输送到磁盘上。
② 如果从磁盘向计算机读入数据,则从磁盘文件中读取数据输入到内存缓冲区(充满缓冲区),
然后再从缓冲区逐个地将数据送到程序数据区(程序变量等)。
注意事项:缓冲区的大小根据C编译系统决定的。
8.2冲刷缓冲区函数 fflush
介绍:强迫将缓冲区内的数据写回参数 stream 指定的文件中。刷新成功返回 0 ,
如果发生错误则返回 EOF ,且设置错误标识符,即 feof 。
注意事项:fflush 不适用于高版本VS
8.3感受文件缓冲区的存在
观察代码:验证缓冲区概念的存在(VS2013 - Win10)
#include <stdio.h> #include <windows.h> int main() { FILE* pf = fopen("test.txt", "w"); fputs("abcdef", pf);//先将代码放在输出缓冲区 printf("睡眠10秒-已经写数据了,打开test.txt文件,发现文件没有内容\n"); Sleep(10000); printf("刷新缓冲区\n"); fflush(pf);//刷新缓冲区时,才将输出缓冲区的数据写到文件(磁盘) //注:fflush 在高版本的VS上不能使用了 printf("再睡眠10秒-此时,再次打开test.txt文件,文件有内容了\n"); Sleep(10000); fclose(pf); //注:fclose在关闭文件的时候,也会刷新缓冲区 pf = NULL; return 0; }
结论: 因为有缓冲区的存在,C语言在操作文件时,需要做刷新缓冲区或者在文件操作结束的时候
关闭文件。如果不做,可能导致读写文件的问题。
9.笔试选择题
9.1二进制打开文件
C语言以二进制方式打开一个文件的方法是?( )
A.FILE *f = fwrite( "test.bin", "b" );
B.FILE *f = fopenb( "test.bin", "w" );
C.FILE *f = fopen( "test.bin", "wb" );
D.FILE *f = fwriteb( "test.bin" );
解析:
首先,因为要打开文件,AD直接排除,由于不存在一个“fopenb”函数,
所以直接选C。二进制描述中的b要放在权限后,也就是“wb”才是合法的。
9.2fopen函数
关于fopen函数说法不正确的是:( )
A.fopen打开文件的方式是"r",如果文件不存在,则打开文件失败
B.fopen打开文件的方式是"w",如果文件不存在,则创建该文件,打开成功
C.fopen函数的返回值无需判断
D.fopen打开的文件需要fclose来关闭
解析:
C选项中fopen的返回值可以检验文件是否打开成功,打开方式为"r"时尤其重要。
ABD为文件操作的基本概念和原则。
9.3文件名及路径
下列关于文件名及路径的说法中错误的是:( )
A.文件名中有一些禁止使用的字符
B.文件名中一定包含后缀名
C.文件的后缀名决定了一个文件的默认打开方式
D.文件路径指的是从盘符到该文件所经历的路径中各符号名的集合
解析:
B选项中,文件名可以不包含后缀名。A的话,文件中不能包含这些字符:\/:*?"<>|,
C表述了后缀名的作用,D是路径的基本概念。
9.4文件读写函数
C语言中关于文件读写函数说法不正确的是:( )
A.fgetc是适用于所有输入流字符输入函数
B.getchar也是适用于所有流的字符输入函数
C.fputs是适用于所有输出流的文本行输出函数
D.fread是适用于文件输入流的二进制输入函数
解析:B选项中,getchar只针对标准输入流stdin。即使对stdin重定向,getchar针对的也只是stdin。
f系列的输入输出函数都是作用于所有流的的,所以AC没问题,
D的表述也没问题,fread做的就是二进制的活。
9.5下面程序的功能是什么? ( )
A.拷贝文件
B.统计文件的字符数
C.统计文件的单词数
D.统计文件的行数
#include<stdio.h> int main() { long num = 0; FILE* fp = NULL; if ((fp = fopen("fname.dat", "r")) == NULL) { printf("Can’t open the file! "); exit(0); } while (fgetc(fp) != EOF) { num++; } printf("num=%d\n", num); fclose(fp); return 0; }
解析:
程序只通过只读方式打开了一个文件,所以A排除,
文中使用的fgetc,且没有' '和'\n'相关的统计,所以排除CD。
9.6下面说法不正确的是:( )
A.scanf和printf是针对标准输入、输出流的格式化输入、输出语句
B.fscanf和fprintf是针对所有输入、输出流的格式化输入、输出语句
C.sscanf是从字符串中读取格式化的数据
D.sprintf是把格式化的数据写到输出流中
解析:
sprintf是把格式化的数据写到字符串中,与输出流无关。
其他三句都准确描述了函数功能。选D
9.7关于feof函数描述不正确的是:( )
A.feof函数是用来判断文件是否读取结束的
B.feof函数是在文件读取结束的时候,检测是否是因为遇到了文件结束标志EOF,而读取结束
C.读取文本判断是否结束时,fgetc看返回值是否为EOF, fgets看返回值是否为NULL
D.二进制文件判断读取结束,看实际读取个数是否小于要求读取个数
解析:说明:feof函数是在文件读取结束后,判断文件读取结束的原因的,
是读取失败结束,还是遇到文件尾结束。所以A是错误的,其他选项均正确。
本篇完。