Linux如何快速删除大量文件

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 最近服务器经常遇到磁盘占用空间满的告警,因此跟进定位问题后,发现原来是airflow的有好几个任务每分钟都在产生日志文件,导致磁盘空间占用率暴涨,因此想了几个策略

背景


最近服务器经常遇到磁盘占用空间满的告警,因此跟进定位问题后,发现原来是airflow的有好几个任务每分钟都在产生日志文件,导致磁盘空间占用率暴涨,因此想了几个策略:

  • airflow降低日志文件输出大小,将原来info级别日志跳高到warning
  • 定时清理日志文件

问题


问题就出现在清理日志文件,打算先清除一遍,主要清除一个月以前的日志文件,命令为find /data/airflow/ -name '*.log' -and -mtime +30 -type f |xargs rm


但是等了半天发现日志文件一直无法清除掉,不知道为什么?


后面直接上机器删除文件,采用rm -rf ./*.log,发现报错如下:

/bin/rm: argument list too long

原因:  删除文件中包含的小文件数量过多,通常是由于受到 shell 参数个数限制所致

虽然网上有其他方案可以快速解决,比如:find减少文件数量。


这下子就搞的很郁闷了,后面上网找了方案,发现可以通过rsync去快速删除大量文件,因此想记录总结一下。

原理


Linux文件存储原理


我们需要对Linux文件存储原理做一个基本的了解,Linux文件存储数据是放在一张inode 表,里面每一个文件的节点,每个节点包括以下内容:

  • 文件类型
  • 权限
  • UID,GID
  • i_nlink 链接数(指向这个文件名路径名称个数)
  • i_count 使用数(指使用这个文件的进程数)
  • 该文件的大小和不同的时间戳
  • 指向磁盘上文件的数据块指针
  • 有关文件的其他数据


Linux文件真正删除的过程:

  • i_nlink=0 没有人进行链接使用,包括任何硬链接
  • i_count=0 没有任何进程使用

rm原理


rm的原理:减少磁盘引用计数i_nlink,就是减少其他文件对这个文件链接,实际并没有删除文件内容。


因此,如果日志文件正在其他进程使用,rm并不是真正删除,i_count并不会减少,因此也不会释放磁盘空间。


如果想要真正删除一个文件,还需要同时将i_count降至0。


了解完rm的原理,也就真正明白为什么find /data/airflow/ -name '*.log' -and -mtime +30 -type f |xargs rm命令会这么慢,因为它要去找日志文件的所有link链接,然后一一删除掉。

解决方案


最终在网上找了最佳解决方案,就是使用rsync


rsync本身的就是将两个文件夹作同步使用,如何使用rsync删除文件,步骤是这样子:

  • 如果将一个空文件夹,同步到要删除的文件夹里,是不是等于将文件夹清空了呢?


很取巧的方式,但是也很有效果,具体命令如下:

#制造一个空文件夹
mkdir -p /opt/airflow/empty;
#执行rsync同步空文件夹
rsync --delete-before -aO  /opt/airflow/empty/ /opt/airflow/logs/;

命令详解:

  • --delete-before 接收者在传输之前进行删除操作
  • -a 归档模式,表示以递归方式传输文件,并保持所有文件属性

参考资料


相关实践学习
【涂鸦即艺术】基于云应用开发平台CAP部署AI实时生图绘板
【涂鸦即艺术】基于云应用开发平台CAP部署AI实时生图绘板
目录
相关文章
|
7月前
|
Linux 开发工具
7种比较Linux中文本文件的最佳工具
7种比较Linux中文本文件的最佳工具
7种比较Linux中文本文件的最佳工具
|
5月前
|
存储 数据管理 Linux
区分Linux中.tar文件与.tar.gz文件的不同。
总之,".tar"文件提供了一种方便的文件整理方式,其归档但不压缩的特点适用于快速打包和解压,而".tar.gz"文件通过额外的压缩步骤,尽管处理时间更长,但可以减小文件尺寸,更适合于需要节约存储空间或进行文件传输的场景。用户在选择时应根据具体需求,考虑两种格式各自的优劣。
764 13
|
6月前
|
安全 Linux
Linux赋予文件000权限的恢复技巧
以上这些步骤就像是打开一扇锁住的门,步骤看似简单,但是背后却有着严格的逻辑和规则。切记,在任何时候,变更文件权限都要考虑安全性,不要无谓地放宽权限,那样可能
201 16
|
7月前
|
Linux
【Linux】 Linux文件I/O常见操作技巧
以上就是Linux文件I/O操作的一些技巧,接纳它们,让它们成为你在Linux世界中的得力伙伴,工作会变得轻松许多。不过记住,技巧的运用也需要根据实际情况灵活掌握,毕竟,最适合的才是最好的。
230 28
|
6月前
|
存储 Linux 数据处理
深入剖析Linux中一切即文件的哲学和重定向的机制
在计算机的奇妙世界中,Linux的这套哲学和机制减少了不同类型资源的处理方式,简化了抽象的概念,并蕴藏着强大的灵活性。就像变戏法一样,轻轻松松地在文件、程序与设备之间转换数据流,标准输入、输出、错误流就在指尖舞动,程序的交互和数据处理因此变得既高效又富有乐趣。
108 4
|
7月前
|
Ubuntu Linux
"unzip"命令解析:Linux下如何处理压缩文件。
总的来说,`unzip`命令是Linux系统下一款实用而方便的ZIP格式文件处理工具。本文通过简明扼要的方式,详细介绍了在各类Linux发行版上安装 `unzip`的方法,以及如何使用 `unzip`命令进行解压、查看和测试ZIP文件。希望本文章能为用户带来实际帮助,提高日常操作的效率。
954 12
|
8月前
|
Linux Shell
Linux系统下快速批量创建和删除文件的方法
总的来说,使用shell脚本来批量处理文件是一种非常强大的工具,只要你愿意花时间学习和实践,你会发现它能大大提高你的工作效率。
463 19
|
6月前
|
Linux
linux文件重命名命令
本指南介绍Linux文件重命名方法,包括单文件操作的`mv`命令和批量处理的`rename`命令。`mv`可简单更改文件名并保留扩展名,如`mv old_file.txt new_name.txt`;`rename`支持正则表达式,适用于复杂批量操作,如`rename 's/2023/2024/' *.log`。提供实用技巧如大小写转换、数字序列处理等,并提醒覆盖风险与版本差异,建议使用`-n`参数预览效果。
|
9月前
|
Linux
Linux 常用文件查看命令
`cat` 命令用于连接文件并打印到标准输出,适用于快速查看和合并文本文件内容。常用示例包括:`cat file1.txt` 查看单个文件,`cat file1.txt file2.txt` 合并多个文件,`cat > filename` 创建新文件,`cat >> filename` 追加内容。`more` 和 `less` 命令用于分页查看文件,`tail` 命令则用于查看文件末尾内容,支持实时追踪日志更新,如 `tail -f file.log`。
406 5
Linux 常用文件查看命令
|
9月前
|
监控 Linux
Linux基础:文件和目录类命令分析。
总的来说,这些基础命令,像是Linux中藏匿的小矮人,每一次我们使用他们,他们就把我们的指令准确的传递给Linux,让我们的指令变为现实。所以,现在就开始你的Linux之旅,挥动你的命令之剑,探索这个充满神秘而又奇妙的世界吧!
168 19