文件操作(上篇)
文件概念
磁盘(硬盘)上的⽂件是文件。
如果没有⽂件,我们写的程序的数据是存储在电脑的内存中,如果程序退出,内存回收,数据就丢失了,等再次运⾏程序,是看不到上次程序的数据的,如果要将数据进⾏持久化的保存,我们可以使⽤⽂件。
文件分类
在程序设计中,我们⼀般谈的⽂件有两种:程序⽂件、数据⽂件(从⽂件功能的⻆度来分类的)。
程序文件
程序⽂件包括源程序⽂件(后缀为.c),⽬标⽂件(windows环境后缀为.obj),可执⾏程序(windows 环境后缀为.exe)。
数据文件
⽂件的内容不⼀定是程序,⽽是程序运⾏时读写的数据,⽐如程序运⾏需要从中读取数据的⽂件,或者输出内容的⽂件。
本篇我们讨论的是数据文件
在大多数处理数据的输⼊输出都是以终端为对象的,即从终端的键盘输⼊数据,运⾏结果显⽰到显⽰器上。 其实有时候我们会把信息输出到磁盘上,当需要的时候再从磁盘上把数据读取到内存中使⽤,这⾥处理的就是磁盘上⽂件。
根据数据的组织形式,数据⽂件被称为⽂本⽂件或者⼆进制⽂件。
二进制文件
数据在内存中以⼆进制的形式存储,如果不加转换的输出到外存的⽂件中,就是⼆进制⽂件。
文本文件
如果要求在外存上以ASCII码的形式存储,则需要在存储前转换。以ASCII字符的形式存储的⽂件就是⽂本⽂件
⼀个数据在⽂件中是怎么存储的呢? 字符⼀律以ASCII形式存储,数值型数据既可以⽤ASCII形式存储,也可以使⽤⼆进制形式存储。
如有整数10000,如果以ASCII码的形式输出到磁盘,则磁盘中占⽤5个字节(每个字符⼀个字节),⽽ ⼆进制形式输出,则在磁盘上只占4个字节。
文件路径
这里介绍的都是Windows系统下的
绝对路径
绝对路径,是从盘符开始的
使用反斜杠\
例如data.txt是存放在C:\code\day1的目录下的,那这个文件的绝对路径就是C:\code\day1\data.txt
相对路径
使用正斜杠/
对于data.txt:
向上一级目录指向:
- ./表示当前路径,./相当于C:\code\day1,例如file文件和data位于同一目录下,通过data文件要引用file就可以用./file.txt(可以省略不写./)
- ../表示当前路径的上一级路径, ../相当于C:\code .
- ../ ../表示当前路径上上一级路径,相当于C:
向下一级目录指向
- ./data表示当前路径的下一级路径,相当于C:\code\day1\data,例如我们要表示data文件夹里的file文件,就可以用./data/file.txt
- ./data/xxx,表示的就是下下一级路径
文件打开和关闭
流和标准流
- 流
我们程序的数据需要输出到各种外部设备,也需要从外部设备获取数据,不同的外部设备的输⼊输出操作各不相同,为了⽅便程序员对各种设备进⾏⽅便的操作,我们抽象出了流的概念我们可以把流想象成流淌着字符的河。 C程序针对⽂件、画⾯、键盘等的数据输⼊输出操作都是通过流操作的。
⼀般情况下,我们要想向流⾥写数据,或者从流中读取数据,都是要打开流,然后操作。
其实就是不同外部设备写入和读取数据操作不一样,就创建了一个中介,这就是流,我们程序员只需要关注如何向流中读取和写入,至于流怎么通过不同方式和外部设备建立联系我们不用关心
对于之后向文件中写入或者从文件中读取数据都是指对于流的操作
- 标准流
那为什么我们从键盘输⼊数据,向屏幕上输出数据,并没有打开流呢? 那是因为C语⾔程序在启动的时候,默认打开了3个流:
- stdin-标准输⼊流,在⼤多数的环境中从键盘输⼊,scanf函数就是从标准输⼊流中读取数据。
- stdout-标准输出流,⼤多数的环境中输出⾄显⽰器界⾯,printf函数就是将信息输出到标准输出 流中。
- stderr-标准错误流,⼤多数环境中输出到显⽰器界⾯。
这是默认打开了这三个流,我们使⽤scanf、printf等函数就可以直接进⾏输⼊输出操作的。 stdin、stdout、stderr三个流的类型是: FILE*,通常称为⽂件指针。 C语⾔中,就是通过 FILE*的⽂件指针来维护流的各种操作的
文件指针
缓冲⽂件系统中,关键的概念是“⽂件类型指针”,简称“⽂件指针”。
每个被使⽤的⽂件都在内存中开辟了⼀个相应的⽂件信息区,⽤来存放⽂件的相关信息(如⽂件的名字,⽂件状态及⽂件当前的位置等)。这些信息是保存在⼀个结构体变量中的。该结构体类型是由系统声明的,取名FILE.
每当打开⼀个⽂件的时候,系统会根据⽂件的情况⾃动创建⼀个FILE结构的变量,并填充其中的信息,使⽤者不必关⼼细节。
⼀般都是通过⼀个FILE的指针来维护这个FILE结构的变量,这样使⽤起来更加⽅便。
FILE* pf;//⽂件指针变量
定义pf是⼀个指向FILE类型数据的指针变量。可以使pf指向某个⽂件的⽂件信息区(是⼀个结构体变量)。通过该⽂件信息区中的信息就能够访问该⽂件。也就是说,通过⽂件指针变量能够间接找到与它关联的⽂件。
打开文件和关闭文件
⽂件在读写之前应该先打开⽂件,在使⽤结束之后应该关闭⽂件。
在编写程序的时候,在打开⽂件的同时,都会返回⼀个FILE*的指针变量指向该⽂件,也相当于建⽴了指针和⽂件的关系。
ANSIC规定使⽤ fopen 函数来打开⽂件, fclose 来关闭⽂件。
//打开⽂件 FILE * fopen ( const char * filename, const char * mode ); //关闭⽂件 int fclose ( FILE * stream );
mode表⽰⽂件的打开模式,下⾯都是⽂件的打开模式:
都是英文单词缩写,很好记的
- 注意:如果不写路径只写名字,默认是在当前程序文件(.c文件)所在目录下打开或创建,若果需要在其他路径下,就需要使用相对路径或者绝对路径
- 在使用绝对路径时用
\\
,这是防止转义字符
FILE *fp = fopen("C:\\User\\Desktop\\data.txt","r"); // 路径名称要正确
/* fopen fclose example */ #include <stdio.h> int main () { FILE * pFile; //打开⽂件 pFile = fopen ("myfile.txt","w"); //⽂件操作 if (pFile!=NULL) { fputs ("fopen example",pFile); //关闭⽂件 fclose (pFile); } return 0; }
文件的顺序读写
fputc和fgetc
- 其实就是比putchar和getchar的对象从标准输入输出流多了个文件的输入输出流,其他例如返回值类型等都是一样的,就是参数多了个流
- 读取或写入成功返回字符ASCII码,否则返回EOF
int main() { int ch = fgetc(stdin);//从键盘(标准输入流)上读取 fputc(ch, stdout);//将字符输出(写)到屏幕(标准输出流) return 0; }
- 向文件中写字符
int main() { FILE*pf = fopen("test.txt", "w"); if (pf == NULL) { perror("fopen"); return 1; } //写文件 int i = 0; for (i = 'a'; i <= 'z'; i++) { fputc(i, pf); } //关闭文件 fclose(pf); pf = NULL; return 0; }
- 从文件中读字符
int main() { FILE* pf = fopen("test.txt", "r"); if (pf == NULL) { perror("fopen"); return 1; } //读文件 int ch = fgetc(pf); printf("%c\n", ch); ch = fgetc(pf); printf("%c\n", ch); ch = fgetc(pf); //关闭文件 fclose(pf); pf = NULL; return 0; } //循环直至遇到文件末尾 int main() { FILE* pf = fopen("test.txt", "r"); if (pf == NULL) { perror("fopen"); return 1; } //读文件 int ch = 0; while ((ch = fgetc(pf)) != EOF) { printf("%c ", ch); } //关闭文件 fclose(pf); pf = NULL; return 0; }
文件拷贝
下面用fgetc和fputc来实现文件的拷贝:
int main() { //打开文件 FILE* pfread = fopen("test1.txt", "r"); if (pfread == NULL) { perror("fopen\n"); return 1; } FILE* pfwrite = fopen("test2.txt", "w"); if (pfwrite == NULL) { perror("fopen\n"); fclose(pfread); return 1; } //读/写文件 int ch = 0; while ((ch = fgetc(pfread)) != EOF) { fputc(ch, pfwrite); } //关闭文件 fclose(pfread); pfread = NULL; fclose(pfwrite); pfwrite = NULL; return 0; }
fgets和fputs
从读取写入字符提升到字符串,是文本行读取函数,遇到换行符读取后就停止了,不会读下一行!!!
- fgets
从流中读取num长度的字符串(真实读到的只有num-1个,末尾会放一个'\0')(如果num比实际都长了,那就读完后面加一个'\0'即可)
读取成功返回指向字符串的指针,否则返回NULL
char * fgets ( char * str, int num, FILE * stream );
- 例子如下
int main() { //1. 打开文件 FILE* pf = fopen("test.txt", "r"); if (pf == NULL) { perror("fopen"); return 1; } //2. 读文件 char arr[20] = "xxxxxxxxxxxxx"; fgets(arr, 10, pf); printf("%s\n", arr); //3. 关闭文件 fclose(pf); pf = NULL; return 0; }
- fputs
- 向流中写入一整行字符串
- 写入成功:返回非负整数,否则返回EOF
int fputs ( const char * str, FILE * stream );
- 例子如下:
int main() { //1. 打开文件 FILE* pf = fopen("test.txt", "w"); if (pf == NULL) { perror("fopen"); return 1; } //2. 写文件 fputs("I am a student\n", pf); fputs("are you ok??", pf); //不换行就在一行上 //3. 关闭文件 fclose(pf); pf = NULL; return 0; }
- 同时也是针对所有输入输出流
int main() { char arr[20] = { 0 }; fgets(arr, 20, stdin); fputs(arr, stdout); return 0; }