Android C++系列:Linux文件IO操作(一)

简介: 事实上Unbuffered I/O这个名词是有些误导的,虽然write系统调用位于C标准库I/O缓 冲区的底层,但在write的底层也可以分配一个内核I/O缓冲区,所以write也不一定是直接 写到文件的,也可能写到内核I/O缓冲区中,至于究竟写到了文件中还是内核缓冲区中对于 进程来说是没有差别的,如果进程A和进程B打开同一文件,进程A写到内核I/O缓冲区中的数 据从进程B也能读到,而C标准库的I/O缓冲区则不具有这一特性(想一想为什么)

image.png


1.1 C标准函数与系统函数的区别


image.png


1.1.1 I/O缓冲区


每一个FILE文件流都有一个缓冲区buffer,默认大小8192Byte。


1.1.2 效率


1.1.3 程序的跨平台性


事实上Unbuffered I/O这个名词是有些误导的,虽然write系统调用位于C标准库I/O缓 冲区的底层,但在write的底层也可以分配一个内核I/O缓冲区,所以write也不一定是直接 写到文件的,也可能写到内核I/O缓冲区中,至于究竟写到了文件中还是内核缓冲区中对于 进程来说是没有差别的,如果进程A和进程B打开同一文件,进程A写到内核I/O缓冲区中的数 据从进程B也能读到,而C标准库的I/O缓冲区则不具有这一特性(想一想为什么)。


1.2 PCB概念


1.2.1 task_struct结构体


/usr/src/linux-headers/include/linux/sched.h


1.2.2 files_struct结构体


1.3 open/close


image.png


1.3.1 文件描述符


一个进程默认打开3个文件描述符


STDIN_FILENO 0 STDOUT_FILENO 1 STDERR_FILENO 2


新打开文件返回文件描述符表中未使用的最小文件描述符。 open函数可以打开或创建一个文件。


#include <sys/types.h> #include <sys/stat.h> #include <fcntl.h>
int open(const char *pathname, int flags);
int open(const char *pathname, int flags, mode_t mode); 返回值:成功返回新分配的文件描述符,出错返回-1并设置errno


在Man Page中open函数有两种形式,一种带两个参数,一种带三个参数,其实在C代码 中open函数是这样声明的:


int open(const char *pathname, int flags, ...);


最后的可变参数可以是0个或1个,由flags参数中的标志位决定,见下面的详细说明。


pathname参数是要打开或创建的文件名,和fopen一样,pathname既可以是相对路径也 可以是绝对路径。flags参数有一系列常数值可供选择,可以同时选择多个常数用按位或运 算符连接起来,所以这些常数的宏定义都以O_开头,表示or。


必选项:以下三个常数中必须指定一个,且仅允许指定一个。


* O_RDONLY 只读打开 * O_WRONLY 只写打开 * O_RDWR 可读可写打开


以下可选项可以同时指定0个或多个,和必选项按位或起来作为flags参数。可选项有很多, 这里只介绍一部分,其它选项可参考open(2)的Man Page:


  • *  O_APPEND 表示追加。如果文件已有内容,这次打开文件所写的数据附加到文件的末尾 而不覆盖原来的内容。


  • *  O_CREAT 若此文件不存在则创建它。使用此选项时需要提供第三个参数mode,表示该 文件的访问权限。


  • *  O_EXCL 如果同时指定了O_CREAT,并且文件已存在,则出错返回。


  • *  O_TRUNC 如果文件已存在,并且以只写或可读可写方式打开,则将其长度截断(Trun-
    cate)为0字节。


  • *  O_NONBLOCK 对于设备文件,以O_NONBLOCK方式打开可以做非阻塞I/O(Nonblock I/
    O),非阻塞I/O在下一节详细讲解。


注意open函数与C标准I/O库的fopen函数有些细微的区别: 以可写的方式fopen一个文件时,如果文件不存在会自动创建,而open一个文件时必须


明确指定O_CREAT才会创建文件,否则文件不存在就出错返回。 以w或w+方式fopen一个文件时,如果文件已存在就截断为0字节,而open一个文件时必


须明确指定O_TRUNC才会截断文件,否则直接在原来的数据上改写。 第三个参数mode指定文件权限,可以用八进制数表示,比如0644表示-rw-r-r–,也可


以用S_IRUSR、S_IWUSR等宏定义按位或起来表示,详见open(2)的Man Page。要注意的是, 文件权限由open的mode参数和当前进程的umask掩码共同决定。


补充说明一下Shell的umask命令。Shell进程的umask掩码可以用umask命令查看:


$ umask 
0002


用touch命令创建一个文件时,创建权限是0666,而touch进程继承了Shell进程的umask 掩码,所以最终的文件权限是0666&∼022=0644。


$ touch file123
$ ls -l file123
-rw-rw-r-- 1 qingkouwei qingkouwei 0 9月 11 23:48 file123


同样道理,用gcc编译生成一个可执行文件时,创建权限是0777,而最终的文件权限是


0777 & ∼022 = 0755。


ubuntu:~$ umask
0002
ubuntu:~$ gcc main.c
ubuntu:~$ ls -l a.out
-rwxrwxr-x 1 qingkouwei qingkouwei 7158 9月 11 23:51 a.out


我们看到的都是被umask掩码修改之后的权限,那么如何证明touch或gcc创建文件的权 限本来应该是0666和0777呢?我们可以把Shell进程的umask改成0,再重复上述实验:


$ rm file123 a.out
$ umask 0
$ touch file123
$ ls -l file123
-rw-rw-rw- 1 qingkouwei qingkouwei $ gcc main.c
0 9月 11 23:52 file123
$ ls -l a.out
-rwxrwxr-x 1 qingkouwei qingkouwei 7158 9月 11 23:52 a.out


现在我们自己写一个程序,在其中调用open(“somefile”, O_WRONLY | O_CREAT, 0664);创建文件,然后在Shell中运行并查看结果:


close函数关闭一个已打开的文件:


#include <unistd.h>
int close(int fd); 返回值:成功返回0,出错返回-1并设置errno


参数fd是要关闭的文件描述符。需要说明的是,当一个进程终止时,内核对该进程所有 尚未关闭的文件描述符调用close关闭,所以即使用户程序不调用close,在终止时内核也会 自动关闭它打开的所有文件。但是对于一个长年累月运行的程序(比如网络服务器),打开 的文件描述符一定要记得关闭,否则随着打开的文件越来越多,会占用大量文件描述符和系 统资源。


由open返回的文件描述符一定是该进程尚未使用的最小描述符。由于程序启动时自动打 开文件描述符0、1、2,因此第一次调用open打开文件通常会返回描述符3,再调用open就会 返回4。可以利用这一点在标准输入、标准输出或标准错误输出上打开一个新文件,实现重 定向的功能。例如,首先调用close关闭文件描述符1,然后调用open打开一个常规文件, 则一定会返回文件描述符1,这时候标准输出就不再是终端,而是一个常规文件了,再调用 printf就不会打印到屏幕上,而是写到这个文件中了。后面要讲的dup2函数提供了另外一种 办法在指定的文件描述符上打开文件。


1.3.2 最大打开文件个数


查看当前系统允许打开最大文件个数


cat /proc/sys/fs/file-max


当前默认设置最大打开文件个数1024


ulimit -a


修改默认设置最大打开文件个数为4096


ulimit -n 4096


1.4 总结


文本介绍了Linux下的文件操作命令、系统调用、API接口等。并介绍了C标准函数与系统函数的区别,PCB概念等。

目录
相关文章
|
1月前
|
网络协议 安全 Linux
Linux C/C++之IO多路复用(select)
这篇文章主要介绍了TCP的三次握手和四次挥手过程,TCP与UDP的区别,以及如何使用select函数实现IO多路复用,包括服务器监听多个客户端连接和简单聊天室场景的应用示例。
89 0
|
1月前
|
存储 Linux C语言
Linux C/C++之IO多路复用(aio)
这篇文章介绍了Linux中IO多路复用技术epoll和异步IO技术aio的区别、执行过程、编程模型以及具体的编程实现方式。
73 1
Linux C/C++之IO多路复用(aio)
|
1月前
|
Ubuntu Linux 编译器
Linux/Ubuntu下使用VS Code配置C/C++项目环境调用OpenCV
通过以上步骤,您已经成功在Ubuntu系统下的VS Code中配置了C/C++项目环境,并能够调用OpenCV库进行开发。请确保每一步都按照您的系统实际情况进行适当调整。
262 3
|
1月前
|
Linux C++
Linux C/C++之IO多路复用(poll,epoll)
这篇文章详细介绍了Linux下C/C++编程中IO多路复用的两种机制:poll和epoll,包括它们的比较、编程模型、函数原型以及如何使用这些机制实现服务器端和客户端之间的多个连接。
23 0
Linux C/C++之IO多路复用(poll,epoll)
|
1月前
|
Linux C++
Linux c/c++文件的基本操作
在Linux环境下使用C/C++进行文件的基本操作,包括文件的创建、写入、读取、关闭以及文件描述符的定位。
19 0
Linux c/c++文件的基本操作
|
1月前
|
搜索推荐 索引
【文件IO】实现:查找文件并删除、文件复制、递归遍历目录查找文件
【文件IO】实现:查找文件并删除、文件复制、递归遍历目录查找文件
34 2
|
1月前
|
编解码 Java 程序员
【文件IO】文件内容操作
【文件IO】文件内容操作
47 2
|
1月前
|
Linux C++
Linux c/c++文件虚拟内存映射
这篇文章介绍了在Linux环境下,如何使用虚拟内存映射技术来提高文件读写的速度,并通过C/C++代码示例展示了文件映射的整个流程。
46 0
|
1月前
|
Linux C++
Linux c/c++文件移动
这篇文章介绍了在Linux环境下,使用C/C++语言通过命令方式和文件操作方式实现文件移动的方法。
66 0
|
3月前
|
存储 Java
【IO面试题 四】、介绍一下Java的序列化与反序列化
Java的序列化与反序列化允许对象通过实现Serializable接口转换成字节序列并存储或传输,之后可以通过ObjectInputStream和ObjectOutputStream的方法将这些字节序列恢复成对象。