前言
在以前我们写的代码,无论运行时在内存中存储了多少的数据,当我们将执行文件关闭,再次打开后所存的数据也都会消失不见。试想当下的软件跟应用可有不能进行存储的功能吗?所以将我们所写的代码导入文件之中,便显得相当重要。于是就有了今天所讲的文件操作。这样我们就可以将数据直接存放在电脑的硬盘上,做到数据的持久化。
什么是文件
一般说的文件包括两种:数据文件跟程序文件。
数据文件
包括源程序文件(后缀为.c),目标文件(windows环境后缀为.obj),可执行程序(windows环境
后缀为.exe)。
程序文件
文件的内容不一定是程序,而是程序运行时读写的数据,比如程序运行需要从中读取数据的文件,
或者输出内容的文件。
文件指针
每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息(如文件的名字,文件状态及文件当前的位置等)。这些信息是保存在一个结构体变量中的。该结构体类型是有系统声明的,取名 FILE 。
在VS2022中 FILE 的定义是这样的:
而在VS2013则是如此:
可见不同的编译器下 FILE 类型包含的内容虽然有些许不同但还是相同的使用方法,于操作者而言并不需要了解太多具体细节。
fopen
如果说 malloc 跟 calloc 是动态内存存在的基础,那文件操作失去了 fopen 就失去了操作的基础
在Cplusplus上进行查找。
我们知道了其包含在 stdio.h 里面返回一个 FILE* 类型的数据,需要传入的参数有两个,一个是 const char* 类型的文件名,第二个是文件的打开方式。同时两者都代表的是字符串所以在使用的时候一定要注意双引号的使用。
文件名
我们先来讲第一个参数,仔细看关于这个参数的说明,这个字符串包含了要打开字符串的名字,如果系统支持的话可以写上文件的整个路径否则默认在当下文件夹内查询。在文件名后还要加上文件格式否则会出现文件识别错误或是创建出的文件的格式并不是我们想要的。所以在编写代码是时候需要十分注意。
打开方式
文件的打开方式有多种:如只读的 r 只写的 w 用于追加数据的 a ,以及读写的 r+w+ 和 a+ 还有打开二进制文件的 rbwb 以及 ab 。甚至还有打开二进制进行读写的 rb+wb+ 和 ab+ 。
文件使用方式 | 含义 | 如果指定文件不存在 |
“r”(只读) | 为了输入数据,打开一个已经存在的文本文件 | 出错 |
“w”(只写) | 为了输出数据,打开一个文本文件 | 建立一个新的文件 |
“a”(追加) | 向文本文件尾添加数据 | 建立一个新的文件 |
“rb”(只读) | 为了输入数据,打开一个二进制文件 | 出错 |
“wb”(只写) | 为了输出数据,打开一个二进制文件 | 建立一个新的文件 |
“ab”(追加) | 向一个二进制文件尾添加数据 | 出错 |
“r+”(读写) | 为了读和写,打开一个文本文件 | 出错 |
“w+”(读写) | 为了读和写,建议一个新的文件 | 建立一个新的文件 |
“a+”(读写) | 打开一个文件,在文件尾进行读写 | 建立一个新的文件 |
“rb+”(读写) | 为了读和写打开一个二进制文件 | 出错 |
“wb+”(读写) | 为了读和写,新建一个新的二进制文件 | 建立一个新的文件 |
“ab+”(读写) | 打开一个二进制文件,在文件尾进行读和写 | 建立一个新的文件 |
具体打开方式的区别我们留着后面讲。但是值得注意的一件事是用含 r 或 ab 打开方式如果查询不到指定文件则会返回一个空指针。为了避免出现错误,我们必须对 fopen 的返回值进行检查,如果正常才能让函数继续进行。
fclose
作用相当于动态内存中的 free ,只需传入前面打开文件时接收的指针用于关闭文件。与 free 相似关闭文件后前面 FILE* 类型的指针就变成了野指针,所以我们还需要讲该指针置空才能保证在往后的程序之中不会出现错误。
文件的读写
打开文件后我们需要想要将数据从内存输出到文件或是从文件将数据输入进内存,都需要使用特定的库函数来实现。同时对于文件的读写还分作顺序读写跟随机读写。
顺序读写
fputc
作为一个用于将数据写入文件的函数,fputc需要传递的参数是要写入的字符以及目标文件的文件指针。写入成功则返回所写的字符,若发生错误则返回EOF。同时会使文件指针加一,指向下一个区域。
根据语法,我们打出了这样的程序,打开一个叫 test 格式为 txt 的文件后将一个字符 a 输出到文件上。
将程序运行之后,由于没有这个文件所以在当下文件夹自动建立了一个叫 test 的文本文件。
打开这个文件后我们可以发现里面写入的就是 a 。说明我们的代码并没有出错,这个库函数确实能够将我们想要的数据输入到文件之中。
同时根据其每次输入都会移动文件指针的特性,我们还可以这样子写,就完成了26个字符的输出。
fgetc
该函数为字符输入函数,需要传入一个 FILE* 的类型的指针之后返回一个整型,该整型为所读字符所代表的 ASCII 码值,若是读取失败则返回 EOF 。
每次读取成功后文件指针都会往后移动一位,使得下次读取的便是下一个字符。
由于该函数一次只能读取一个字符所以即便我们后面还有很多内容也只能读取第一个字符。
根据其特性,只要进行多次读取就可以将文件内的全部内容读出。
fputs
fputs为文本行输入的函数,输入一个字符串并将其写入文件中。
直到遇到 \0 才结束读取,即便遇到 \n 也会继续读取并将文本数据换行。输出成功则会返回一个非 0 值。
fgets
fgets 与 fput 就是一对,一个是输入一个是输出且目标都是字符串,不过 gets 需要传入一个参数来表示一共需要读取多少个字符。并且读到 \n 和 \0 会停止读取,同时将 \n 复制到读出的字符串中
所以若将之前输入进去的数据再打印出来,便只会截至到\n而停止。
可以看到fgets还会将 \0 一并拷贝到目标数组之中,所以实际上读取到的字符数会比我们传入的那个参数要少 1 。并且读取成功后返回指向目标字符串的指针。