什么是文件:
磁盘上的文件是文件,但是在程序设计中,我们一般谈论的文件是:程序文件,数据文件。
程序文件:
包括源程序文件(后缀为.c)目标文件(Windows环境后缀为.obj),可执行程序(Windows环境后缀为exe).
数据文件:
文件的内容不一定是程序,而是程序运行时读写的数据,比如程序运行需要从中读取数据的文件,或者输出内容的文件。
在以前的学习中,处理数据的输入输出都是以终端为对象的,即从终端的键盘输入数据,运行结果显示到显示器上,其实有时候我们会把信息输出到磁盘上,当需要的时候再从磁盘上把数据读取到内存中使用,这里处理的就是磁盘上的文件。
文件名:
一个文件要有一个唯一的文件标识,以便用户识别和引用。
文件名包含3部分:文件路径+文件名主干+文件后缀
例如:c:\code\test.txt
为了方便起见,文件标识常被称为文件名。
文件类型:
根据数组的组织形式,数据文件被称为文本文件或者二进制文件,数据在内存中以二进制的形式存储,如果不加转换的输出到外存,就是二进制文件。
如果要求在外存上以ASCII码的形式存储,则需要在存储前转换,以ASCII字符的形式存储的文件就是文本文件。
那么一个数据在内存中是如何存储的呢?
字符一律以ASCII形式存储,数值型数据既可以用ASCII形式存储,也可以使用二进制形式存储。
如果有整数10000,如果以ASCII码的形式输出到磁盘,则磁盘中占用5个字节(每个字符一个字节),而二进制形式输出,则在磁盘上只占4个字节
向文件中写入数据:
#define _CRT_SECURE_NO_WARNINGS 1 #include<stdio.h> int main() { int a = 10000; FILE* pf = fopen("test1.txt", "wb");//以二进制的形式写入该文件 fwrite(&a, 4, 1, pf);//要写的数据来自于a,写一个数据其中包含四个字节,写入文件pf fclose(pf);//关闭文件 pf = NULL; return 0; }
打开该文件的步骤:
右击文件,点打开方式:
下滑找到二进制编译器打开该文件:
打开文件test1.txt,如下:
文件缓冲区:
ASCII标准采用“缓冲文件系统”处理的数据文件的,所谓缓冲文件系统是指系统自动地在内存为程序中每一个正在使用的文件开辟一块“文件缓冲区”,从内存向磁盘输出数据会先送到内存中的缓冲区,装满缓冲区后才一起送到磁盘上,如果从磁盘向计算机读入数据,则从磁盘文件中读取数据输入到内存缓冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(程序变量等),缓冲区的大小根据C编译系统决定的。
文件指针:
缓冲文件系统中,关键的概念是“文件类型指针”,简称“文件指针”。
每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息(如文件的名字,文件状态及文件当前的位置等),这些信息是保存在一个结构体变量中的,该结构体类型是有系统声明的,取名FILE。
例如:VS2008编译环境提供的stdio.h头文件中有以下的文件类型声明:
点击FILE,转到定义,我们会发现是将结构体struct _iobuf重新起名为FILE
不同的C编译器的FILE类型包含的内容不完全相同,但是基本相似。
每当打开一个文件的时候,系统会根据文件的情况自动创建一个FILE结构的变量,并填充其中的信息。
一般都是通过一个FILE的指针来维护这个FILE结构的变量。
下面我们可以创建一个FILE*的指针变量:
FILE* pf;
定义pf是一个指向FILE类型数据的指针变量,可以使pf指向某个文件的文件信息区(是一个结构体变量),通过该文件信息区中的信息就能够访问该文件,也就是说,通过文件指针变量能够找到与它相关联的文件。
举例:
当我们对文件进行操作时,文件中的信息也会发生变化。
文件的打开和关闭:
在编写程序的时,打开文件的同时都会返回一个FILE*的指针变量指向该文件,也相当于建立了指针和文件的关系。
ANSIC规定使用fopen函数来打开文件,fclose来关闭文件。
FILE* open(const char* filename, const char* mode); int fclose(FILE* stream);
文件的打开方式:
相对路径和绝对路径:
#include<stdio.h> int main() { fopen("../test1.txt", "r");//..表示为test1.txt路径的上一路径 fopen("test1.txt", "r");//相对路径,相对于当前程序的路径 fopen("C:\\source\\repos\\c语言\\8.21", "r");//绝对路径,双斜杠防止转义 return 0; }
举例:
以打开文件为例:
#include<stdio.h> #include<errno.h> #include <string.h> int main() { FILE* pf = fopen("test.txt", "r");//相对路径,相对于当前程序的路径 if (pf == NULL) { printf("%s\n", strerror(errno)); return 0; } //打开成功 //读文件 //关闭文件 fclose(pf); pf = NULL; return 0; }
当前路径下不存在test.txt,因此,strerror给我们提示不存在该文件:
当我们在该路径下建立test.txt文件,再运行程序该错误就会消失。
注:当以写的方式打开文件时,无论改文件是否存在,系统都会创建一个新的文件,因此文件中原本存在的内容会被清除。
文件的顺序读写:
举例:
#include<stdio.h> #include<errno.h> #include <string.h> int main() { FILE* pfwrite = fopen("TEST1.txt", "w");//以写的方式打开文件 if (pfwrite == NULL) { printf("%s\n", strerror(errno)); return 0; } fputc('b', pfwrite);//输出字符b fputc('i', pfwrite);//输出字符i fputc('t', pfwrite);//输出字符t fclose(pfwrite); pfwrite = NULL; return 0; }
从键盘输入 输出到屏幕
键盘&屏幕都是外部设备
键盘—标准输入设备—stdin
屏幕—标准输出设备----stdout:是一个程序默认打开的两个流设备
举例:
#include<stdio.h> #include<errno.h> #include <string.h> int main() { int ch = fgetc(stdin); fputc(ch, stdout); return 0; }
当输入h后,fgetc可以从标准输入流读取该信息,再通过fputc输出该信息。
对比一组函数:
scanf / fscanf / sscanf
printf / fprintf / sprintf
#include<stdio.h> #include<errno.h> #include <string.h> struct S { int n; float score; char arr[10]; }; int main() { struct S s = { 100,3.14,"abcdef" }; char buf[1024] = { 0 }; sprintf(buf, "%d %f %s", s.n, s.score,s.arr);//将结构体数据转换为字符串 printf("%s\n", buf); }
#include<stdio.h> #include<errno.h> #include <string.h> struct S { int n; float score; char arr[10]; }; int main() { struct S s = { 100,3.14,"abcdef" }; struct S temp = { 0 }; char buf[1024] = { 0 }; sprintf(buf, "%d %f %s", s.n, s.score,s.arr);//将格式化的数据转换为字符串存储到buff sscanf(buf, "%d %f %s", &(temp.n), &(temp.score), temp.arr);//从buf中读取格式化的数据到temp中 printf("%d %f %s\n", temp.n, temp.score, temp.arr); return 0; }
文件的随机读写:
fseek:
根据文件指针的位置和偏移量来定位文件指针
ftell:
返回文件指针相对于起始位置的偏移量
举例:
#include<stdio.h> int main() { FILE* pf = fopen("test1.txt","r"); if (pf == NULL) { return 0; } int pos = ftell(pf);//对文件指针不进行定位直接打开 printf("%d\n", pos); fclose(pf); pf = NULL; return 0; }
文本文件内容如下:
此时文件指针的位置为文本开头,因此偏移量为0
0
设置文件指针定位为-1:
fseek(pf, -1, SEEK_END);
此时文件指针指向e和f中间,因此偏移量为5.
使用fgetc读取文本第一个字符:
fgetc(pf);
此时第一个字符已经被读取,因此偏移量为1.
rewind:
让文件指针的位置回到文件的起始位置。
举例:
int main() { FILE* pf = fopen("test1.txt","r"); if (pf == NULL) { return 0; } int ch=fgetc(pf); printf("%c\n", ch); fseek(pf, -1, SEEK_END); rewind(pf); ch = fgetc(pf); printf("%c\n", ch); fclose(pf); pf = NULL; return 0; }
a a
文件结束判定:
被错误使用的feof:
在文件读取过程中,不能使用feof函数的返回值直接用来判断文件是否结束,正确的方法应该是当文件读取结束的时候,判断是读取失败结束,还是遇到文件尾部结束。
注:【feof(fp)有两个返回值:如果遇到文件结束,函数feof(fp)的值为非零值,否则为0。】
1:文本文件读取是否结束,判断返回值是否为EOF【文件结束的标志】(fgetc),或者NULL(fgets)
EOF不是特殊字符,而是定义在<stdio.h>中的一个常量,一般等于-1,#define EOF (-1),而在文本文件中都是以ASCII码字符表示的,取值范围 0-127 共128个字符,不可能出现-1,因此,可以用EOF作为文件结束标志。
fgets()遇到文件结尾,函数返回一个空指针,反之,fgets()会返回与传入的第一个参数相同的地址。
例如:
fgetc判断是否为EOF
fgets判断返回值是否为NULL
2:二进制文件的读取结束判断,判断返回值是否小于实际要读的个数
fread是一个函数,它从文件流中读数据,最多读取count个项,每个项size个字节,如果调用成功返回实际读取到的项个数(小于或等于count),如果不成功或读到文件末尾返回0,返回真实读取的项数,如果大于count则意味着产生了错误。
例如:
fread判断返回值是否小于实际要读的个数。
perror函数:
perror(s) 用来将上一个函数发生错误的原因输出,所指的字符串会先打印出,后面再加上错误原因,该错误原因根据errno的值来决定要输出的字符串。
而在库函数中有个errno变量,每个errno值对应着以字符串表示的错误类型,当你调用"某些"函数出错时,该函数已经重新设置了errno的值。
perror函数只是将你输入的一些信息和errno所对应的错误一起输出。
以printf举例:
#include<stdio.h> int main() { FILE* pf = fopen("test_x.txt", "r"); if (pf == NULL) { printf("fopen error!\n"); } return 0; }
以perror举例:
#include<stdio.h> int main() { FILE* pf = fopen("test_x.txt", "r"); if (pf == NULL) { perror("fopen error!\n"); } return 0; }
对比两种输出结果,我们不难发现,使用perror输出的错误信息更加详细,明确。