面试官给我挖坑:rm删除文件之后,空间就被释放了吗?

简介: 在Linux,你是不是曾经天真的以为,使用rm删除一个文件,占用的空间就释放了?事情可能不是常常如人意。

云栖号资讯:【点击查看更多行业资讯
在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来!

在Linux,你是不是曾经天真的以为,使用rm删除一个文件,占用的空间就释放了?事情可能不是常常如人意。

产生一个指定大小的随机内容文件

我们先看一下当前各个挂载目录的空间大小:

$ df -h
/dev/sda11      454M  280M  147M  66% /boot

我这里挑选了其中一个结果展示(你可以选择任一挂载目录),接下来准备在/boot下生成一个文件。

首先我们产生一个50M大小的文件:

$ dd if=/dev/urandom of=/boot/test.txt bs=50M count=1

至此,我们产生了一个50M大小的文件,再看boot下:

$ df -h
/dev/sda11      454M  312M  115M  74% /boot

这里你不用关心到底多了多少,你只需要关注,/boot下的文件增多了。

8BE11C46_6C77_4db8_A0A2_0191996B3962

测试程序:

#include<stdio.h>
#include<unistd.h>
int main(void)
{
    FILE *fp = NULL;
    fp = fopen("/boot/test.txt", "rw+");
    if(NULL == fp)
    {
       perror("open file failed");
       return -1;
    }
    while(1)
    {
       //do nothing
       sleep(1);
    }
    fclose(fp);
    return 0;
}

至于程序本身,也没干啥实际的事情,就是打开一个文件,然后一直循环。编译并运行:

$ gcc -o openFile openFile.c
$ ./openFile

打开另外一个窗口,删掉test.txt:

$ rm /boot/test.txt

再看一下boot空间:

$ df -h
dev/sda11      454M  312M  115M  74% /boot

咦?空间大小怎么一点都没变!!明明使用rm把它删除了啊?
我们把openFile程序停掉,再看看:

$$ df -h
/dev/sda11      454M  280M  147M  66% /boot

乖乖,空间马上就释放掉了,也就是按照预期,我们的文件被删除了。

一个文件什么情况下才会被删除?

实际上,只有当一个文件的引用计数为0(包括硬链接数)的时候,才可能调用unlink删除,只要它不是0,那么就不会被删除。所谓的删除,也不过是文件名到 inode 的链接删除,只要不被重新写入新的数据,磁盘上的block数据块不会被删除,关注公众号Java面试那些事儿,回复关键字面试,获取最新面试题。因此,你会看到,即便删库跑路了,某些数据还是可以恢复的。换句话说,当一个程序打开一个文件的时候(获取到文件描述符),它的引用计数会被+1,rm虽然看似删除了文件,实际上只是会将引用计数减1,但由于引用计数不为0,因此文件不会被删除。

struct inode {
struct hlist_node   i_hash; /* hash链表的指针 */
struct list_head    i_list; /* backing dev IO list */
struct list_head    i_sb_list; /* 超级块的inode链表 */
struct list_head    i_dentry; /* 引用inode的目录项对象链表头 */
unsigned long    i_ino; /* 索引节点号 */
atomic_t         i_count; /* 引用计数 */
unsigned int     i_nlink; /* 硬链接数目 */

关于里面的细节,还有很多内容(如硬链接数量也会影响文件是否被删除),这里不一一展开。

如何释放已经被删除文件占用的空间?

关于释放,前面已经说了,重启打开该文件的进程即可。但是有没有方法找到哪些文件被删除了,但还是被某些进程打开了呢?

自然是有方法的:

$ lsof |grep deleted

其中被标记为deleted的文件,就是这样的一些文件。

其实在前面的例子中,我们也可以很容易观察到(openFile程序运行,test.txt文件被删除):

$ ls -al /proc/`pidof openFile`/fd
total 0
lrwx------ 1 root root 64 5月   4 09:27 0 -> /dev/pts/25
lrwx------ 1 root root 64 5月   4 09:27 1 -> /dev/pts/25
lrwx------ 1 root root 64 5月   4 09:27 2 -> /dev/pts/25
lrwx------ 1 root root 64 5月   4 09:27 3 -> /boot/test.txt (deleted)

看见没有,test.txt后面还有deleted字样。

既然我们都说了,这样的情况下文件是没有被删除的,那么还能不能恢复呢?实际上还是可以读取的。

总结

实际上对于这种文件被删除了,常常出现于程序的日志文件中,可能你有一个定时任务去清理程序产生的日志文件,但是如果程序本身忘记关闭句柄,就会导致磁盘空间得不到释放,最终就是你认为文件都被删除了,但是磁盘却依然被占着。所以,养成好习惯,打开文件后,不用时,记得关闭文件描述符。

如果发现明明已经删除了大量文件,但是空间却并没有恢复正常,那么不妨看看是不是还有程序打开了这些文件。

【云栖号在线课堂】每天都有产品技术专家分享!
课程地址:https://yqh.aliyun.com/zhibo

立即加入社群,与专家面对面,及时了解课程最新动态!
【云栖号在线课堂 社群】https://c.tb.cn/F3.Z8gvnK

原文发布时间:2020-06-15
本文作者:互联网架构师
本文来自:“互联网架构师 微信公众号”,了解相关信息可以关注“互联网架构师

相关文章
|
Linux 测试技术
软件测试Linux面试题:在Linux查找日志文件的命令是什么,删除文件的命令是什么?
软件测试Linux面试题:在Linux查找日志文件的命令是什么,删除文件的命令是什么?
101 0
|
消息中间件 设计模式 NoSQL
面试题:rm 删除文件之后,空间就被释放了吗?你知道答案吗?
在Linux,你是不是曾经天真的以为,使用rm删除一个文件,占用的空间就释放了?事情可能不是常常如人意。
|
3月前
|
存储 Java
【IO面试题 四】、介绍一下Java的序列化与反序列化
Java的序列化与反序列化允许对象通过实现Serializable接口转换成字节序列并存储或传输,之后可以通过ObjectInputStream和ObjectOutputStream的方法将这些字节序列恢复成对象。
|
1天前
|
存储 缓存 Java
大厂面试必看!Java基本数据类型和包装类的那些坑
本文介绍了Java中的基本数据类型和包装类,包括整数类型、浮点数类型、字符类型和布尔类型。详细讲解了每种类型的特性和应用场景,并探讨了包装类的引入原因、装箱与拆箱机制以及缓存机制。最后总结了面试中常见的相关考点,帮助读者更好地理解和应对面试中的问题。
14 4
|
30天前
|
算法 Java 数据中心
探讨面试常见问题雪花算法、时钟回拨问题,java中优雅的实现方式
【10月更文挑战第2天】在大数据量系统中,分布式ID生成是一个关键问题。为了保证在分布式环境下生成的ID唯一、有序且高效,业界提出了多种解决方案,其中雪花算法(Snowflake Algorithm)是一种广泛应用的分布式ID生成算法。本文将详细介绍雪花算法的原理、实现及其处理时钟回拨问题的方法,并提供Java代码示例。
59 2
|
1月前
|
JSON 安全 前端开发
第二次面试总结 - 宏汉科技 - Java后端开发
本文是作者对宏汉科技Java后端开发岗位的第二次面试总结,面试结果不理想,主要原因是Java基础知识掌握不牢固,文章详细列出了面试中被问到的技术问题及答案,包括字符串相关函数、抽象类与接口的区别、Java创建线程池的方式、回调函数、函数式接口、反射以及Java中的集合等。
27 0
|
3月前
|
Java C++
【Java基础面试十七】、Java为什么是单继承,为什么不能多继承?
这篇文章讨论了Java单继承的设计原因,指出Java不支持多继承主要是为了避免方法名冲突等混淆问题,尽管Java类不能直接继承多个父类,但可以通过接口和继承链实现类似多继承的效果。
【Java基础面试十七】、Java为什么是单继承,为什么不能多继承?
|
3月前
|
存储 安全 Java
这些年背过的面试题——Java基础及面试题篇
本文是技术人面试系列Java基础及面试题篇,面试中关于Java基础及面试题都需要了解哪些内容?一文带你详细了解,欢迎收藏!
|
3月前
|
XML 存储 JSON
【IO面试题 六】、 除了Java自带的序列化之外,你还了解哪些序列化工具?
除了Java自带的序列化,常见的序列化工具还包括JSON(如jackson、gson、fastjson)、Protobuf、Thrift和Avro,各具特点,适用于不同的应用场景和性能需求。
|
3月前
|
Java
【Java基础面试三十七】、说一说Java的异常机制
这篇文章介绍了Java异常机制的三个主要方面:异常处理(使用try、catch、finally语句)、抛出异常(使用throw和throws关键字)、以及异常跟踪栈(异常传播和程序终止时的栈信息输出)。