Linux基础IO【文件理解与操作】

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 文件操作是 基础IO 学习的第一步,我们在 C语言 进阶中,就已经学习了文件相关操作,比如 fopen 和 fclose,语言层面只要会用就行,但对于系统学习者来说,还要清楚这些函数是如何与硬件进行交互的

✨个人主页: Yohifo
🎉所属专栏: Linux学习之旅
🎊每篇一句: 图片来源
🎃操作环境: CentOS 7.6 阿里云远程服务器

  • Great minds discuss ideas. Average minds discuss events. Small minds discuss people.

    • 大智论道,中智论事,小智论人。

    image.png


@[toc]


🌇前言

文件操作是 基础IO 学习的第一步,我们在 C语言 进阶中,就已经学习了文件相关操作,比如 fopenfclose,语言层面只要会用就行,但对于系统学习者来说,还要清楚这些函数是如何与硬件进行交互的

调用库函数进行文件操作时的流程

image.png


🏙️正文

1、文件理解

先来通过几个问题来理解文件

文件操作的本质是什么?

  • 语言层面的文件操作就是直接使用库函数,而事实上,文件操作是系统层面的问题,就像进程管理一样,系统也会通过 先描述,再组织 的方式对文件进行管理、操作

只有 C/C++ 这种偏底层的语言才有文件操作吗?

  • 并不是,其他语言也支持文件操作,如 Java;在进行文件操作时,不同语言使用方法可能有所不同,但 ==本质上都是在调用系统级接口进行操作==

文件由什么构成?一般文件放在哪里?

  • 文件 = 内容 + 属性
  • 未使用的文件位于 磁盘,而使用中的文件 属性 会被加载至内存中
  • 本文讨论的是已被加载至内存文件的相关操作

系统是如何区分文件的?

  • 文件可以同时被多次使用,OS 为了管理好文件,会像使用 task_struct 管理进程一样,通过 struct file 存储文件属性进行管理
  • struct file 结构体包含了文件的各种属性和链接关系

文件是由谁打开的?

  • 由用户创建进程,调用系统级接口,再交给 OS 完成文件打开任务,文件写入与读取时也是同理

==总结:== 真正的文件操作需要结合系统底层学习,而我们之前的文件操作都是 进程OS 间的交互


2、C语言文件操作

在学习 系统级文件操作 前,需要先回顾一下 C语言 中的文件操作

2.1、文件打开

FILE * fopen ( const char * filename, const char * mode );

通过文件名以指定打开方式,打开文件

打开方式(参数2)

  • w 只写,如果文件不存在,会新建,文件写入前,会先清空内容
  • a 追加,在文件末尾,对文件进行追加写入,追加前不会清空内容
  • r 只读,打开已存在的文件进行读取,若文件不存在,会打开失败
  • w+a+r+ 读写兼具,区别在于是否会新建文件,只有 r+ 不会新建
//打开文件进行操作
//在当前目录中打开文件 log.txt
//注意:同一个文件,可以同时多次打开
FILE* fp1 = fopen("log.txt", "w");    //只读
FILE* fp2 = fopen("log.txt", "a");    //追加
FILE* fp3 = fopen("log.txt", "r");    //只写,文件不存在会打开失败

FILE* fp4 = fopen("log.txt", "w+");    //可读可写
FILE* fp5 = fopen("log.txt", "a+");    //可读可追加
FILE* fp6 = fopen("log.txt", "r+");    //可读可写,文件不存在会打开失败

若文件打开失败,会返回空 NULL,可以在打开后判断是否成功

==注意:== 若参数1直接使用文件名,则此文件需要位于当前程序目录下,如果想指定目录存放,可以使用绝对路径

2.2、文件关闭

文件打开并使用后需要关闭,就像动态内存申请后需要释放一样

int fclose ( FILE * stream );

关闭已打开文件,只需通过 FILE* 指针进行操作即可

//对上面打开的文件进行关闭
//无论以哪种方式打开,关闭方法都一样
fclose(fp1);
fclose(fp2);
fclose(fp3);

fclose(fp4);
fclose(fp5);
fclose(fp6);

==注意:== 只能对已打开的文件进行关闭,若文件不存在,会报错

2.3、文件写入

C语言 对于文件写入有这几种方式:fputcfputsfwritefprintfsnprintf

int fputc ( int character, FILE * stream );

int fputs ( const char * str, FILE * stream );

size_t fwrite ( const void * ptr, size_t size, size_t count, FILE * stream );

int snprintf ( char * s, size_t n, const char * format, ... );

前几种方式比较简单,无非就是 逐字符写入、逐行写入 与 格式化写入,这里主要来介绍一下 snprintf

snprintfsprintf 的优化版,增加了读取字符长度控制,更加安全

  • 参数1:缓冲区,常写做 buffer 数组
  • 参数2:缓冲区的大小
  • 参数3:格式化输入,比如 "%d\n", 10

使用 snprintf 函数写入数据至缓冲区后,可以再次通过 fputs 函数,将缓冲区中的数据真正写入文件中

#include <stdio.h>
#include <stdlib.h>

#define LOG "log.txt" //日志文件
#define SIZE 32

int main()
{
  FILE* fp = fopen(LOG, "w");
  if(!fp)
  {
    perror("fopen file fail!"); //报错
    exit(-1); //终止进程
  }

  char buffer[SIZE];  //缓冲区
  int cnt = 5;
  while(cnt--)
  {
    snprintf(buffer, SIZE, "%s\n", "Hello File!");  //写入数据至缓冲区
    fputs(buffer, fp);  //将缓冲区中的内容写入文件中
  }

  fclose(fp);
  fp = NULL;
  return 0;
}

image.png

得益于格式化控制,可以灵活地向日志文件中写入内容

2.4、文件读取

读取与写入配套出现

int fgetc ( FILE * stream );

char * fgets ( char * str, int num, FILE * stream );

size_t fread ( void * ptr, size_t size, size_t count, FILE * stream );

int fscanf ( FILE * stream, const char * format, ... );

int sscanf ( const char * s, const char * format, ...);

可以使用 sscanf 按照一定的规则格式化读取字符串 s

#include <stdio.h>

int main()
{
  char s[] = "2023:3:24";
  int arr[3];
  char* buffer[4];
  sscanf(s, "%d:%d:%d", arr, arr + 1, arr + 2);
  printf("%d\n%d\n%d\n", arr[0], arr[1], arr[2]);

  return 0;
}

image.png

这个函数多用于 序列化与反序列化操作

关于更多 C语言 文件操作的知识 《C语言进阶——文件操作》


3、系统级文件操作

回顾完 C语言 文件相关操作后,就可以开始系统级文件操作的学习了

3.1、打开 open

首先学习如何直接调用调用系统级函数 open 打开文件

#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>

int open(const char *pathname, int flags);
int open(const char *pathname, int flags, mode_t mode);    //可以修改权限

image.png

3.1.1、函数理解

返回值:不同于 FILE*,系统级文件打开函数返回类型为 int,即 文件描述符( file descriptor ),文件打开失败返回 -1
文件描述符很重要,将在下篇文章 《重定向本质》 中讲解

参数1:pathname 待操作文件名,和 fopen 一样
参数2:flags 打开选项,open 使用的标记位的方式传递选项信号,用一个 int 至多可以表示 32 个选项
参数3:mode 权限设置,文件起始权限为 0666

主要就是参数2有点复杂,使用了 位图 的方式进行多参数传递

image.png

可以利用这个特性,写一个关于位图的小demo

3.1.2、位图demo

#include <stdio.h>
#include <stdlib.h>

#define ONE 0x1
#define TWO 0x2
#define THREE 0x4

void Test(int flags)
{
  //模拟实现三种选项传递
  if(flags & ONE)
    printf("This is one\n");

  if(flags & TWO)
    printf("This is two\n");

  if(flags & THREE)
    printf("This is three\n");
}

int main()
{
  Test(ONE | TWO | THREE);
  printf("-----------------------------------\n");
  Test(ONE);  //位图使得选项传递更加灵活
  return 0;
}

image.png

函数 open 中的参数2正是位图,其参数有很多个,这里列举部分

 O_RDONLY    //只读
 O_WRONLY    //只写
 O_APPEND    //追加
 O_CREAT    //新建
 O_TRUNC    //清空

实际使用时,可以按照位图demo中的方式进行参数传递

#include <stdio.h>
#include <stdlib.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <string.h>
#include <unistd.h> //write 的头文件


#define LOG "log.txt" //日志文件
#define SIZE 32

int main()
{
  //三种参数组合,就构成了 fopen 中的 w
  int fd = open(LOG, O_WRONLY | O_CREAT | O_TRUNC, 0666);    //权限最好设置
  if(fd == -1)
  {
    perror("open file fail1");
    exit(-1);
  }

  const char* ps = "Hello System Call!\n";
  int cnt = 5;
  while(cnt--)
    write(fd, ps, strlen(ps));  //不能将 '\0' 写入文件中

  close(fd);
  return 0;
}

image.png

==注意:==

  • 假若文件不存在,open 中的参数3最好进行设置,否则创建出来的文件权限为随机值
  • 继承环境变量表后,umask 默认为 0002,当然也可以自定义
  • 通过系统级函数 write 写入字符串时,不要刻意加上 '\0',因为对于系统来说,这也只是一个普通的字符('\0' 作为字符串结尾只是 C语言 的规定)

C语言 中的 fopen 调用 open 函数,其中的选项对应关系如下

  • w -> O_WRONLY | O_CREAT | O_TRUNC
  • a -> O_WRONLY | O_CREAT | O_APPEND
  • r -> O_RDONLY
  • ……

所以只要我们想,使用 open 时,也能做到 只读方式 打开 不存在的文件,也不会报错,加个 O_CREAT 参数即可

3.2、关闭 close

close 函数根据文件描述符关闭文件

#include <unistd.h>

int close(int fildes);

==Linux 下一切皆文件==

包括这三个标准流: stdinstdoutstderr
它们的文件描述符依次为:123,也可以通过 close(1) 的方式,关闭标准流

3.3、写入 write

write 函数的返回值类型有点特殊,但使用方法与 fwrite 基本一致

#include <unistd.h>

ssize_t write(int fildes, const void *buf, size_t nbyte);

向文件中写入字符串,前面已经演示过了~

3.4、读取 read

read 读取很淳朴,只支持指定字符数读取

#include <unistd.h>

ssize_t read(int fildes, void *buf, size_t nbyte);

文件读取时,同样是借助缓冲区进行读取

#include <stdio.h>
#include <stdlib.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <string.h>
#include <unistd.h> //write 的头文件


#define LOG "log.txt" //日志文件
#define SIZE 1024

int main()
{
  int fd = open("test.c", O_RDONLY);
  if(fd == -1)
  {
    perror("open file fail1");
    exit(-1);
  }

  int n = 50; //读取50个字符
  char buffer[SIZE];
  int pos = 0;
  while(n--)
  {
    read(fd, (char*)buffer + pos, 1);
    pos++;
  }

  printf("%s\n", buffer);

  close(fd);
  return 0;
}

读取 test.c 源文件中的 100 个字符

image.png


这些系统级函数成功使用的前提是文件描述符合法


4、小结

最后再来简单小结一下文件的本质(结合系统级函数)

4.1、高级语言文件操作的本质

只要是在 Linux 平台中编写的程序,无论是 JavaPythonPHP 还是其他语言,在进行文件相关操作时,其文件操作函数都有对系统级函数进行封装,也就是说,要想与硬件(磁盘)打交道,必须经过 系统调用 -> OS -> 驱动 这条路线,无法直接与硬件进行交互

image.png


🌆总结

以上就是基础IO【文件理解与操作】的全部内容了,本文主要是学习系统级文件操作函数,关于文件操作底层实现及重定向原理,将会在下篇文章讲解

如果你觉得本文写的还不错的话,期待留下一个小小的赞👍,你的支持是我分享的最大动力!

如果本文有不足或错误的地方,随时欢迎指出,我会在第一时间改正


1658489422102.jpg.jpg

相关文章推荐


Linux【模拟实现简易版bash】


Linux进程控制【进程程序替换】


Linux进程控制【创建、终止、等待】


===============


Linux进程学习【进程地址】

Linux进程学习【环境变量】

Linux进程学习【进程状态】

Linux进程学习【基本认知】


承蒙厚爱,感谢支持.gif

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
目录
相关文章
|
8天前
|
Linux 开发工具 Perl
在Linux中,有一个文件,如何删除包含“www“字样的字符?
在Linux中,如果你想删除一个文件中包含特定字样(如“www”)的所有字符或行,你可以使用多种文本处理工具来实现。以下是一些常见的方法:
33 5
|
8天前
|
安全 Linux 数据安全/隐私保护
在 Linux 系统中,查找文件所有者是系统管理和安全审计的重要技能。
在 Linux 系统中,查找文件所有者是系统管理和安全审计的重要技能。本文介绍了使用 `ls -l` 和 `stat` 命令查找文件所有者的基本方法,以及通过文件路径、通配符和结合其他命令的高级技巧。还提供了实际案例分析和注意事项,帮助读者更好地掌握这一操作。
26 6
|
8天前
|
Linux
在 Linux 系统中,`find` 命令是一个强大的文件查找工具
在 Linux 系统中,`find` 命令是一个强大的文件查找工具。本文详细介绍了 `find` 命令的基本语法、常用选项和具体应用示例,帮助用户快速掌握如何根据文件名、类型、大小、修改时间等条件查找文件,并展示了如何结合逻辑运算符、正则表达式和排除特定目录等高级用法。
35 6
|
9天前
|
监控 Linux Perl
Linux 命令小技巧:显示文件指定行的内容
在 Linux 系统中,处理文本文件是一项常见任务。本文介绍了如何使用 head、tail、sed 和 awk 等命令快速显示文件中的指定行内容,帮助你高效处理文本文件。通过实际应用场景和案例分析,展示了这些命令在代码审查、日志分析和文本处理中的具体用途。同时,还提供了注意事项和技巧,帮助你更好地掌握这些命令。
23 4
|
15天前
|
网络协议 Linux
linux系统重要文件目录
本文介绍了Linux系统中的重要目录及其历史背景,包括根目录、/usr、/etc、/var/log和/proc等目录的结构和功能。其中,/etc目录下包含了许多关键配置文件,如网卡配置、DNS解析、主机名设置等。文章还详细解释了各目录和文件的作用,帮助读者更好地理解和管理Linux系统。
39 2
|
14天前
|
缓存 监控 Linux
|
17天前
|
Linux Shell 数据库
文件查找是Linux用户日常工作的重要技能介绍了几种不常见的文件查找方法
文件查找是Linux用户日常工作的重要技能。本文介绍了几种不常见的文件查找方法,包括使用`find`和`column`组合、`locate`和`mlocate`快速查找、编写Shell脚本、使用现代工具`fd`、结合`grep`搜索文件内容,以及图形界面工具如`Gnome Search Tool`和`Albert`。这些方法能显著提升文件查找的效率和准确性。
38 2
|
21天前
|
Linux 数据库
linux 全局搜索文件
在 Linux 系统中,全局搜索文件常用 `find`、`locate` 和 `grep` 命令。`find` 根据文件名、类型、大小、时间戳等条件搜索;`locate` 通过预构建的数据库快速查找文件;`grep` 在文件中搜索特定文本,常与 `find` 结合使用。选择合适的命令取决于具体需求。
|
24天前
|
Linux 开发工具 Perl
Linux命令替换目录下所有文件里有"\n"的字符为""如何操作?
【10月更文挑战第20天】Linux命令替换目录下所有文件里有"\n"的字符为""如何操作?
37 4
|
23天前
|
运维 安全 Linux
Linux文件清空的五种方法总结分享
每种方法各有优势,选择最合适的一种或几种,可以极大提高您的工作效率。更多有关Linux系统管理的技巧与资源,欢迎访问,持续提升您的运维技能。
61 1