【再识C进阶5(上)】详细介绍C语言文件操作——文件是用于存储数据

简介: 【再识C进阶5(上)】详细介绍C语言文件操作——文件是用于存储数据

学习目标:

      在上一篇博客中,我们学习了一些自定义类型,比如:结构体、枚举和联合。那么这一篇和之前讲的所有内容都不是和相关,因为这涉及到了数据存储的内容

      相信每一个计算机学子都会有一门课设——XX管理系统(通讯录),那么你们有没有出现这么一种情况:首先,你运行程序,在通讯录中写下一些数据,然后关闭程序,当下次打开程序时发现之前所写的数据全都不见了。那么这一节就是讲述了如何将数据存储起来在下一次运行程序时可以找到不丢失。这时就凸显出数据储存的重要性,文件是最简单的一个。


学习内容:

通过上面的学习目标,我们可以列出要学习的内容:

  1. 什么是文件以及为什么使用文件
  2. 文件是如何打开和关闭的
  3. 文件的顺序读写和随机读写
  4. 文本文件和二进制文件
  5. 文件读取结束的判定
  6. 文件的缓冲区

一、为什么使用文件

      我们前面在学习结构体时,写了通讯录的程序,当通讯录运行起来时,可以在通讯录中增加、删除数据,此时数据是存放在内存中,当程序退出时,通讯录中的数据自然就不存在了,等下次运行通讯录程序的时候,数据又要重新输入,如果这样使用通讯录就比较难受。

      我们在想既然是通讯录就应该将信息记录下来,只有我们自己在选择是否删除数据才能删除,数据才不复存在。这样就涉及到了数据持久化的问题,我们一般数据持久化的方法有:1. 利用磁盘,将数据存放在磁盘中2. 利用数据库,将数据存放在数据库中3. 利用文件,将数据存放在文件中

总结:

将数据持久化的方法有:

  1. 利用磁盘将数据存放在磁盘中
  2. 利用数据库将数据存放在数据库中
  3. 利用文件将数据存放在文件中

二、什么是文件

      磁盘中的文件就是文件。但是在程序设计中,我们一般谈到的文件有两种:程序文件数据文件

2.1 程序文件

      程序文件包括源程序文件(后缀为 .c ),目标文件(windows环境下后缀是 .obj ;linux环境下是 .o ),可执行程序(windows环境下后缀为 .exe )

2.2 数据文件(本章重点)

      文件的内容不一定是程序,而是程序运行时读写的数据,比如程序运行需要从中读取数据的文件或者输出内容的文件

      在这章之前,我们所处理数据的输入和输出都是以终端为对象的,即从终端的键盘输入数据,运行结果显示到显示器中。

      在这里有一个终端的名词,其解释为:经由通信设施向计算机输入程序和数据或接收计算机输出处理结果的设备听着可能有点懵,让我们来举一些例子吧!

      外围设备包括显示器鼠标键盘耳机麦克风、和摄像头等等。这些外围设备就被称为终端,负责向主机输入数据的就叫输入终端,比如鼠标、键盘、麦克风、摄像头,负责接收主机输出数据的设备就被称作输出终端,比如显示器、耳机。

      其实有时候我们会将信息输出到磁盘中,当需要的时候,在将其从磁盘上把数据读取到内存中使用,这里处理的是磁盘的文件。

2.3 文件名

      知道了为什么使用文件,以及文件的分类,我们如何使用文件呢?使用这个文件前,我们肯定要知道这个文件的文件名是什么?那么我们接下来来学习文件名。

      文件名就如同我们自己的姓名,只有我们有了这个名字后,我们才知道何人叫我们做何事,因此,文件也一样,一个文件要有一个唯一的文件标识,以便于用户识别和引用,否则会产生异议。文件名包含3个部分:文件路径 + 文件名主干 + 文件后缀(有时也可以不写文件后缀)

举个栗子:

c:\code\test.txt

      为了方便起见,文件标识常被称为文件名

插曲:文件路径

      在讲述完文件名后,我们给大家在写一个陌生的概念:文件路径文件路径常常被分为两种:绝对路径相对路径

  • 绝对路径就是从这个文件所在跟开始写,比如从D盘开始写;
  • 相对路径就是从这个文件所在的目录相对于工程所在目录有几个等级,. 表示当前路径, .. 表示上一级路径。

注意:

在文件夹中一定要把显示文件扩展名打开,防止文件命名错误,导致多谢一个文件后缀。

三、文件的打开和关闭

3.1 文件指针

3.1.1 文件指针的介绍

      上述学完文件名之后,我们要如何使用文件,是利用什么我们才能打开文件,并且在写完文件后关闭文件?在之前我们学习过程中,我们学习指针的相关概念,知道了如何引用指针找到我们所要使用的变量,那么文件指针也是一样,在缓冲文件系统中,关键的概念是“文件类型指针”,简称“文件指针”

      每一个被使用的文件都在内存中开辟一个相应的文件信息区,用来存放文件的相关信息(如文件的名字文件状态以及文件当前的位置等)。这些文件是保存在一个结构体变量中。该结构体类型是用系统声明的,取名为:FILE

例如,在VS2013编译环境中提供的 stdio.h 头文件有以下文件类型的声明:(看看就行)

struct _ioduf{
    char* _ptr;
    int _cnt;
    char* _base;
    int _flag;
    int _file;
    int _charbuf;
    int _bufsiz;
    char* _tmpfname;
};
//类型重定义,将其定义为FILE
typedef struct _iobuf FILE;

      不同的编译器的FILE类型包含的内容是不完全相同的,但是大同小异。每当打开一个文件的时候,系统会根据文件的情况自动建一个FILE结构的变量,并填充其中的信息使用者不必关心实现细节。一般都是通过一个FILE的指针来维护这个FILE结构的变量,这样使用起来比较方便。

3.1.2 文件指针的使用

在了解完文件指针是什么,下面我们可以创建一个FILE*的指针变量

FILE* pf ;  //文件指针变量

      定义 pf 是一个指向FILE类型的指针变量,可以使pf指向某个文件的文件信息区(是一个结构体变量)也就是可以通过指针来操纵一个文件,怎么通过指针找到文件信息区是不需要关心的。我们可以通过文件信息区的信息来访问该文件。

总结:通过文件指针变量能够找到与它相关联的文件。

3.2 文件的打开和关闭

      介绍完文件指针,就要开始使用文件指针了。举个简单的例子:如果小明想要喝饮料,首先,要先打开饮料的瓶盖;然后,进行喝饮料;最后,喝完饮料要将瓶盖拧紧。文件的使用方法和其一模一样,要先将文件打开,最后将文件进行关闭,下面我们来学习如何将文件打开和关闭。

      文件在读写之前应该先打开文件,在使用结束之后应该关闭文件。在编写程序的时候,在打开文件的同时,都会返回一个FILE*的指针变量指向该文件,也相当于建立了指针和文件的关系。ANSIC规定使用 fopen 函数来打开文件fclose 函数来关闭文件

//打开文件
FILE* fopen (const char* filename, const char* mode);
//第一个参数是要操作的文件名,第二个参数是打开文件的方式
//关闭文件
int fclose (FILE* stream);

fopen 函数

      这个函数的返回类型是 FILE*,是一个文件指针;第一个参数是要操作的文件名,第二个参数是打开文件的方式,这两个参数都是字符串,注意写法。

      函数的返回值:如果打开成功,返回打开成功的文件指针;如果打开失败,返回NULL。

fclose 函数

      这个函数的返回值是整形类型;参数只有一个,是要操作的文件名。这个函数虽然使用 fclose 函数关闭文件,但文件指针依然指向原文件地址处,防止出现野指针,需要将这个文件指针置空。为了验证,看下图:

打开方式如下:

文件使用方式
" r "
" w "
" a "
" rb "
" wb "

实例代码:

四、文件的顺序读写

4.1 什么是流?

      在介绍文件的顺序读写函数之前,我们先来介绍一下什么是,因为下面,我们在介绍函数的时候将讲述这些函数适用于什么流中,下面我们来学习什么是流?

      流是一个高度抽象的概念,我们都知道计算机是用于处理数据的,数据既可以从计算机外部获取,也可以从内部流出,我们来画图分析:

提示:

在C语言程序中,只要运行起来,默认打开3个流:

在这里,我们先简单了解一下有几个流的分类:

  1. 文件流
  2. 字符流
  3. 标准输入/输出流

4.2 一些读写函数函数

我们先来汇总一下文件中的顺序读写函数:

4.3 对比一组函数

在上方我们学习了那么多的读写函数,我们要进行对比

//三组读写函数的对比
scanf / fscanf / sscanf
printf / fprintf /sprintf

scanf     函数是针对的是标准输入流(键盘)的格式化输入函数

printf     函数是针对的是标准输出流(屏幕)的格式化输出函数

fscanf    函数是针对所有输入流(文件流、标准输入流)的格式化输入函数

fprintf    函数是针对所有输出流(文件流、标准输出流)的格式化输出函数

sscanf   函数是将字符串转化为格式化数据

sprintf   函数是将格式化数据转化为字符串

五、文件的随机读写

      这一部分用的不多,因为如果想要随机读写,是需要将整个文件的信息了解的面面俱到,这样我们才能知道你想要的东西在第几字节处,而且大多数情况下,我们的文件储存的是二进制文件,我们根本就看不懂里面的东西。

5.1 fseek函数

5.2 ftell函数

5.3 rewind函数

六、文本文件和二进制文件

      在这一小节,我们可以根据数据的组织形式,将数据文件称为文本文件或者二进制文件。为了让大家了解什么是文本文件,什么是二进制文件?看下图:

概念:

二进制文件的概念:

      数据在内存中以二进制的形式存储,如果不加转换的输出到外存,就是二进制文件。

文本文件的概念:

      如果要求在外存中以ASCII码的形式存储,则需要在存储前转换。以ASCII字符的形式存储的文件就是文本文件。

问题:

一个数据在内存中是怎么存储的?

      字符一律以ASCII码的形式进行存储,数值型数据既可以使用ASCII码的形式进行存储,也可以使用二进制形式进行存储。

举个栗子:

      假如我们有一个整数10000,如果以ASCII码值的形式输出到磁盘中,则磁盘中占用5个字节(每个字符一个字节);而以二进制的形式输出,则在磁盘中占4个字节。

      通过这个例子,我们思考一下,是否用二进制文件更省空间呢?并不是,比如数字1,在文本文件中为一个字节,而在二进制文件中为四个字节。

小编有一点想不明白为什么二进制文件中的信息在记事本中是符号,而不是0或1?

      实际上,由于二进制文件中每一个字符都有256种不同的取值,因此其中的很多值在大多数字符中都没有与之对应的可打印字符,因此,当我们将二进制文件以文本形式打开时,大部分字节都没有对应的可打印字符,就会显示乱码。

七、文件读取结束的判定

7.1 被错误使用的 feof 函数

      虽然这个函数中含有EOF,会使人联想这个函数是用于判断读取文件是否结束,一定要牢牢记住:在文件读取过程中,不能用 feof 函数的返回值直接用来判断文件是否读取结束。这个函数而是用于当文件读取结束的时候,判断是读取失败结束,还是遇到文件末尾结束

7.2 如何判断文件是否读取结束?

      我们可以根据读函数的返回值来判断文件是否读取结束,我们在上面介绍了三个读函数,分别是:fget、fgets、fread。下面我们来讨论一下:

一、文本文件读取是否结束,判断返回值是否为 EOF(fgetc)或者 NULL(fgets)

  • fgetc判断返回值是否为 EOF
  • fgets判断返回值是否为 NULL

二、二进制文件读取是否结束,判断返回值是否小于实际要读的个数

  • fread判断返回值是否小于实际要读的个数

7.3 一些例子代码

7.4 文件读取结束后的判断函数

函数:ferror

作用:在文件读取结束后用来判断文件是否因为读取过程中遇到错误而结束的

函数:feof

作用:在文件读取结束后用来判断文件是否因为读取过程中遇到文件结束标志性末尾而结束的

八、文件缓冲区

8.1 文件缓冲区的概念

       ANSIC标准采用“缓冲文件系统”处理的数据文件,所谓缓冲文件系统是指系统自动地在内存中为程序中每一个正在使用的文件开辟一块“文件缓冲区”。从内存向磁盘输出数据会先送到内存中的缓冲区,装满缓冲区后才能一起送到磁盘上。缓冲区的大小由C编译系统决定的。

8.2 为什么使用文件缓冲区

      因为如果不使用文件缓冲区,那么我们每输入一个数据,都让内存去调用一下,这样会浪费大量的时间和经历,所以我们如果将他们打包好,这样就会减少时间。

8.3 结论

      因为有缓冲区的存在,C语言在操作文件的时候,需要做刷新缓冲区或者在文件操作结束的时候关闭文件。如果不做,可能会导致读写文件的问题。

学习产出:

  1. 什么是文件以及为什么使用文件
  2. 文件是如何打开和关闭的
  3. 文件的顺序读写和随机读写
  4. 文本文件和二进制文件
  5. 文件读取结束的判定
  6. 文件的缓冲区
相关文章
|
22天前
|
存储 C语言
【c语言】玩转文件操作
本文介绍了C语言中文件操作的基础知识,包括文件的打开和关闭、文件的顺序读写、文件的随机读写以及文件读取结束的判定。详细讲解了`fopen`、`fclose`、`fseek`、`ftell`、`rewind`等函数的使用方法,并通过示例代码展示了如何进行文件的读写操作。最后,还介绍了如何判断文件读取结束的原因,帮助读者更好地理解和应用文件操作技术。
29 2
|
27天前
|
存储 编译器 C语言
如何在 C 语言中判断文件缓冲区是否需要刷新?
在C语言中,可以通过检查文件流的内部状态或使用`fflush`函数尝试刷新缓冲区来判断文件缓冲区是否需要刷新。通常,当缓冲区满、遇到换行符或显式调用`fflush`时,缓冲区会自动刷新。
|
27天前
|
存储 编译器 C语言
C语言:文件缓冲区刷新方式有几种
C语言中文件缓冲区的刷新方式主要包括三种:自动刷新(如遇到换行符或缓冲区满)、显式调用 fflush() 函数强制刷新、以及关闭文件时自动刷新。这些方法确保数据及时写入文件。
|
1月前
|
存储 C语言 C++
深入C语言,发现多样的数据之枚举和联合体
深入C语言,发现多样的数据之枚举和联合体
深入C语言,发现多样的数据之枚举和联合体
|
1月前
|
存储 C语言
简述C语言文件操作
简述C语言文件操作
11 0
|
1月前
|
存储 文件存储 C语言
深入C语言:文件操作实现局外影响程序
深入C语言:文件操作实现局外影响程序
|
1月前
|
存储 C语言
深入C语言内存:数据在内存中的存储
深入C语言内存:数据在内存中的存储
|
1月前
|
C语言 C++
C语言 之 内存函数
C语言 之 内存函数
34 3
|
8天前
|
C语言
c语言调用的函数的声明
被调用的函数的声明: 一个函数调用另一个函数需具备的条件: 首先被调用的函数必须是已经存在的函数,即头文件中存在或已经定义过; 如果使用库函数,一般应该在本文件开头用#include命令将调用有关库函数时在所需要用到的信息“包含”到本文件中。.h文件是头文件所用的后缀。 如果使用用户自己定义的函数,而且该函数与使用它的函数在同一个文件中,一般还应该在主调函数中对被调用的函数做声明。 如果被调用的函数定义出现在主调函数之前可以不必声明。 如果已在所有函数定义之前,在函数的外部已做了函数声明,则在各个主调函数中不必多所调用的函数在做声明
24 6
|
28天前
|
存储 缓存 C语言
【c语言】简单的算术操作符、输入输出函数
本文介绍了C语言中的算术操作符、赋值操作符、单目操作符以及输入输出函数 `printf` 和 `scanf` 的基本用法。算术操作符包括加、减、乘、除和求余,其中除法和求余运算有特殊规则。赋值操作符用于给变量赋值,并支持复合赋值。单目操作符包括自增自减、正负号和强制类型转换。输入输出函数 `printf` 和 `scanf` 用于格式化输入和输出,支持多种占位符和格式控制。通过示例代码详细解释了这些操作符和函数的使用方法。
35 10