什么是空洞文件?
“在UNIX文件操作中,文件位移量可以大于文件的当前长度,在这种情况下,对该文件的下一次写将延长该文件,并在文件中构成一个空洞,这一点是允许的。位于文件中但没有写过的字节都被设为 0。”
如果 offset 比文件的当前长度更大,下一个写操作就会把文件“撑大(extend)”。这就是所谓的在文件里创造“空洞(hole)”。没有被实际写入文件的所有字节由重复的 0 表示。空洞是否占用硬盘空间是由文件系统(file system)决定的。大部分文件系统是不占用的。
怎么获得一个空洞文件?
以Linux来说,使用lseek或truncate到一个固定位置生成的“空洞文件”是不会占据真正的磁盘空间的。
空洞文件特点就是offset大于实际大小,也就是说一个文件的两头有数据而中间为空,以‘\0‘填充。那文件系统会不会不做任何处理的将其存放在硬盘上呢?大部分文件系统是不会将其存放在硬盘上。
文件预留
为什么需要文件预留
在开发过程中有时候需要为某个文件快速地分配固定大小的磁盘空间,为什么要这样做呢?
(1)可以让文件尽可能的占用连续的磁盘扇区,减少后续写入和读取文件时的磁盘寻道开销;
(2)迅速占用磁盘空间,防止使用过程中所需空间不足。
(3)后面再追加数据的话,不会需要改变文件大小,所以后面将不涉及metadata的修改
前面提到使用lseek或truncate到一个固定位置生成的“空洞文件”是不会占据真正的磁盘空间的。
快速的为某个文件分配实际的磁盘空间在Linux下可通过fallocate(对应的posix接口为posix_fallocate)系统调用来实现,大部分主流文件系统如ext4,xfs还是支持fallocate
2,fallocate和truncate有所区别
fallocate:为文件预分配物理空间,
不是生成空洞文件而且fallocate分配的空间在磁盘的扇区上是连续的, 能减少后续写入和读取文件时的磁盘寻道的资源开销,
这个函数是Linux系统从3.15版本开始出现的一个特有的函数, POSIX标准类似的函数是posix_fallocate(),
truncate:生成的是空洞文件,并不占用实际的磁盘空间,
只是文件看上去逻辑大小比较大,
但实际占用的空间是0
这是一个不可移植的、特定于linux的系统调用。
函数原型
#define _GNU_SOURCE /* See feature_test_macros(7) */
#include <fcntl.h>
int fallocate(int fd, int mode, off_t offset, off_t len);
/*
fd:文件fd
mode:选择模式,填0表示分配磁盘空间
offset偏移量
len:长度
*/
代码示例
首先创建一个空的文件1.txt
编写简单代码,修改文件大小1024*1024==1mb
执行后可以发现文件变成了1mb,并且整个文件被填0