文件的介绍-阿里云开发者社区

文件的介绍

2024-05-28 519

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 文件的介绍

文件介绍

文件是计算机中用于存储数据的一种载体。一般储存在磁盘上。

文件通常以一定的格式和结构存储数据，可以包含文本、图像、音频、视频等各种类型的信息。

文件可以通过文件系统进行管理和组织，用户可以对文件进行创建、打开、编辑、保存、复制、移动、删除等操作。

常见的文件格式包括txt、docx、pdf、jpg、mp3等。

文件在计算机中起着非常重要的作用，是信息传递和存储的基本单位。

在程序设计中，我们把文件一般分为两类，一类是程序文件，一类是数据文件。

程序文件

程序文件包含源代码文件，目标文件，可执行代码。

源代码文件

通常以常见的编程语言编写，如C、C++、Java、Python等，程序员可以通过编辑源代码文件来编写和修改程序。一旦源代码文件完成编写，程序员需要将其编译成可执行文件，以便计算机能够运行程序。

目标文件

是编译器生成的中间文件，其中包含了源代码文件编译后的目标代码。目标文件通常是编译过程的中间产物，它包含了程序的机器代码、符号表、重定位信息等。目标文件是编译器将源代码文件转换为可执行文件的重要步骤之一。

可执行文件

是经过编译或打包处理后的程序文件，其中包含了计算机可以直接执行的机器指令。用户可以直接运行可执行文件，而无需查看或修改其中的源代码。程序文件在计算机中扮演着至关重要的角色，是实现各种功能和任务的基础。

数据文件

我们要对一个文件执行操作的时候，一般的步骤就是：1.打开文件 2.执行操作 3.关闭文件

在这个过程中我们实际上操作对象是数据文件。

根据数据的组织形式，我们一般把文件分为文本文件和二进制文件

文本文件

就是在外显的时候通过ASCII转换成文本信息的文件。

二进制文件

就是在内存中以二进制形式存储的文件。

举例，我们通过记事本来查看一个文件，当我们打开一个文本文件的时候，它的显示是这样的：

在内存中它以二进制存储，但是在需要显示的时候，它转换成了通过ASCII表转换而成的字符串；

而当我们打开一个二进制文件的时候，它的显示是这样的：

这是乱码，也就是说二进制文件并不会通过ASCII来转换成我们能看懂的形式，那么它就会显示乱码。

由于二进制文件中的数据以二进制形式存储，因此通常无法直接通过文本编辑器等工具进行查看或编辑。需要特定的程序或工具来处理和解析二进制文件。二进制文件在计算机中广泛应用，是存储和传输各种类型数据的重要形式。

流

在我们打开和关闭文件的时候，存在一种抽象的概念——流（stream）。

针对不同的输入和输出通道，程序员不可能将每个传输设备和操作都熟记于心，于是出现了流（stream）。流可以帮助程序员用于在程序中对文件进行输入和输出的操作。

它可以看作程序与文件之间的通道，通过流可以实现数据的读取和写入。把文件看作一个生产车间，我们提供原材料和获取产物都需要通过通道来获得，这个通道就是流。

而流作为抽象的概念，我们是感受不到的，但是在我们操作的时候，它会默认打开。

流可以分为输入流和输出流两种类型：

输入流（input stream）用于从文件中读取数据到程序中。
输出流（output stream）用于将程序中的数据写入到文件中。

标准流

标准流是指在计算机程序中用于输入和输出的预定义流。在大多数操作系统和编程语言中，通常有三种标准流：

- 标准输入流（stdin）：用于接收程序的输入数据。

- 标准输出流（stdout）：用于向用户显示输出数据。

- 标准错误流（stderr）：用于向用户显示错误信息。与标准输出流不同的是，标准错误流通常用于显示程序运行时的错误信息，而不会影响程序的正常输出。

文件指针

每个被使⽤的⽂件都在内存中开辟了⼀个相应的⽂件信息区，⽤来存放⽂件的相关信息（如⽂件的名字，⽂件状态及⽂件当前的位置等）。这些信息是保存在⼀个结构体变量中的。该结构体类型是由系统声明的，取名FILE。

但我们需要调用该文件的时候，就需要用到文件指针FILE*来使用文件。

有关文件的函数

打开与关闭文件

fopen和fclose

文件在读写之前需要打开文件；读写完成后需要关闭文件。

f指的是file，后续就是指操作。

fopen

注意其中一个参数：const char* mode，表示文件的打开方式。例如

具体可以参见这篇博文：C语言文件打开模式(r/w/a/r+/w+/a+/rb/wb/ab/rb+/wb+/ab+)浅析_c语言w+-CSDN博客

fclose

代码实操：

1. /* fopen fclose example */
2. #include <stdio.h>
3. int main ()
4. {
5.  FILE * pFile;
6. //打开⽂件
7.  pFile = fopen ("myfile.txt","w");
8. //⽂件操作
9. if (pFile!=NULL)
10.  {
11.  fputs ("fopen example",pFile);
12. //关闭⽂件
13.  fclose (pFile);
14.  }
15. return 0;
16. }

文件的顺序读写

顺序读写是指按照文件中数据的顺序依次读取或写入数据，文件指针依次移动到下一个位置。

注：

1.针对fprintf如果需要打印在屏幕上，则第一个参数使用stdout，需要打印在文件中，则第一个参数使用文件名。

文件的随机读写

随机读写是指按照指定的位置读取或写入文件中的数据，文件指针可以不受数据顺序的控制，访问特定的数据。

fseek

fseek的作用是根据文件指针的位置和偏移量来定位文件指针

stream：指向文件的指针

offset：偏移量，用于指定对于origin的位置

origin：偏移起始位置

具体可以为以下三种：

在使用fseek函数时，需要注意以下几点：

fseek函数返回值为0表示操作成功，非0表示失败。
offset为正数表示向文件末尾方向偏移，负数表示向文件开头方向偏移。
使用fseek函数后，需要检查返回值以确保文件指针移动成功。
在写操作前使用fseek函数移动文件指针，可以实现随机写入数据的功能。

ftell

ftell的作用是返回文件指针相对于初始位置的偏移量

在使用ftell函数时，需要注意以下几点：

返回值为当前文件指针相对于文件开头的偏移量，如果操作成功返回非负值，如果失败返回-1。
ftell函数通常与fseek函数配合使用，可以实现定位文件指针到特定位置后获取当前位置的功能。
当进行读写操作时，可以使用ftell函数获取当前文件指针的位置，以便记录或处理文件操作的位置信息。

rewind

rewind的作用是让文件指针回到初始位置

在使用rewind函数时，需要注意以下几点：

rewind函数将文件指针设置为文件的起始位置，即相当于调用fseek(stream, 0, SEEK_SET)。
通常在重新读取文件内容之前，可以使用rewind函数将文件指针重新指向文件开头。
rewind函数不返回任何值，只是将文件指针移动到文件开头，并且不会检查是否移动成功。

文件读取结束的判定

feof

判断是否是遇到文件末尾而结束.若错误则返回非0值，否则返回0

ferror

判断是否是遇到错误而结束，若错误则返回非0值，否则返回0

文件缓冲区

在C语言中，文件缓冲区是指用于存储文件数据的内存区域。磁盘读取数据时，数据会先进入到文件缓冲区，装满缓冲区之后再一起送到磁盘上。

文件缓冲的过程可以理解为泄洪——当积蓄了一定的水量时，打开出口让水出去。

文件缓冲区主要有以下两种类型：

1. **全缓冲**：当使用标准I/O库函数（如`fread`、`fwrite`、`fscanf`、`fprintf`等）读取或写入文件时，默认情况下是全缓冲的。这意味着数据会先被读取到内存缓冲区中，当缓冲区满了或者遇到换行符时才会将数据写入文件。全缓冲可以减少I/O操作的次数，提高效率。

2. **行缓冲**：当使用标准I/O库函数操作终端设备（比如键盘输入和屏幕输出）时，默认是行缓冲的。这意味着数据会先被读取到内存缓冲区中，直到遇到换行符或缓冲区满了才会将数据写入终端设备。行缓冲可以提高交互性，因为用户可以在输入一行后按下回车键才将数据发送到程序。

设置文件的缓冲，可以根据实际需求来提高文件操作的效率和交互性。

文件的介绍

文件介绍