Linux如何快速删除大量文件

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 最近服务器经常遇到磁盘占用空间满的告警,因此跟进定位问题后,发现原来是airflow的有好几个任务每分钟都在产生日志文件,导致磁盘空间占用率暴涨,因此想了几个策略

背景


最近服务器经常遇到磁盘占用空间满的告警,因此跟进定位问题后,发现原来是airflow的有好几个任务每分钟都在产生日志文件,导致磁盘空间占用率暴涨,因此想了几个策略:

  • airflow降低日志文件输出大小,将原来info级别日志跳高到warning
  • 定时清理日志文件

问题


问题就出现在清理日志文件,打算先清除一遍,主要清除一个月以前的日志文件,命令为find /data/airflow/ -name '*.log' -and -mtime +30 -type f |xargs rm


但是等了半天发现日志文件一直无法清除掉,不知道为什么?


后面直接上机器删除文件,采用rm -rf ./*.log,发现报错如下:

/bin/rm: argument list too long

原因:  删除文件中包含的小文件数量过多,通常是由于受到 shell 参数个数限制所致

虽然网上有其他方案可以快速解决,比如:find减少文件数量。


这下子就搞的很郁闷了,后面上网找了方案,发现可以通过rsync去快速删除大量文件,因此想记录总结一下。

原理


Linux文件存储原理


我们需要对Linux文件存储原理做一个基本的了解,Linux文件存储数据是放在一张inode 表,里面每一个文件的节点,每个节点包括以下内容:

  • 文件类型
  • 权限
  • UID,GID
  • i_nlink 链接数(指向这个文件名路径名称个数)
  • i_count 使用数(指使用这个文件的进程数)
  • 该文件的大小和不同的时间戳
  • 指向磁盘上文件的数据块指针
  • 有关文件的其他数据


Linux文件真正删除的过程:

  • i_nlink=0 没有人进行链接使用,包括任何硬链接
  • i_count=0 没有任何进程使用

rm原理


rm的原理:减少磁盘引用计数i_nlink,就是减少其他文件对这个文件链接,实际并没有删除文件内容。


因此,如果日志文件正在其他进程使用,rm并不是真正删除,i_count并不会减少,因此也不会释放磁盘空间。


如果想要真正删除一个文件,还需要同时将i_count降至0。


了解完rm的原理,也就真正明白为什么find /data/airflow/ -name '*.log' -and -mtime +30 -type f |xargs rm命令会这么慢,因为它要去找日志文件的所有link链接,然后一一删除掉。

解决方案


最终在网上找了最佳解决方案,就是使用rsync


rsync本身的就是将两个文件夹作同步使用,如何使用rsync删除文件,步骤是这样子:

  • 如果将一个空文件夹,同步到要删除的文件夹里,是不是等于将文件夹清空了呢?


很取巧的方式,但是也很有效果,具体命令如下:

#制造一个空文件夹
mkdir -p /opt/airflow/empty;
#执行rsync同步空文件夹
rsync --delete-before -aO  /opt/airflow/empty/ /opt/airflow/logs/;

命令详解:

  • --delete-before 接收者在传输之前进行删除操作
  • -a 归档模式,表示以递归方式传输文件,并保持所有文件属性

参考资料


相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
目录
相关文章
|
3月前
|
Linux 数据安全/隐私保护 Windows
命令方式:window向linux传文件
【10月更文挑战第6天】本文介绍了如何在Linux系统中通过命令`ip a`获取IP地址,并在Windows系统下使用CMD命令行工具和SCP命令实现文件传输。示例展示了如何将D盘中的`mm.jar`文件上传至IP地址为192.168.163.122的Linux系统的/up/目录下,最后在Linux系统中确认文件传输结果。
345 65
|
3月前
|
运维 安全 Linux
Linux中传输文件文件夹的10个scp命令
【10月更文挑战第18天】本文详细介绍了10种利用scp命令在Linux系统中进行文件传输的方法,涵盖基础文件传输、使用密钥认证、复制整个目录、从远程主机复制文件、同时传输多个文件和目录、保持文件权限、跨多台远程主机传输、指定端口及显示传输进度等场景,旨在帮助用户在不同情况下高效安全地完成文件传输任务。
481 5
|
3月前
|
Linux Shell 数据库
Linux文件查找新姿势:总有一种你没见过
【10月更文挑战第18天】文件查找是Linux用户提升工作效率的重要技能。本文介绍了几种实用的文件查找方法,包括基础的`find`命令、快速的`locate`和`mlocate`、高效的`fd`工具、以及结合`grep`和`rg`进行内容搜索。此外,还提供了编写Shell脚本和使用图形界面工具的建议,帮助你更灵活地管理文件。
97 3
|
1月前
|
Linux Shell 网络安全
Kali Linux系统Metasploit框架利用 HTA 文件进行渗透测试实验
本指南介绍如何利用 HTA 文件和 Metasploit 框架进行渗透测试。通过创建反向 shell、生成 HTA 文件、设置 HTTP 服务器和发送文件,最终实现对目标系统的控制。适用于教育目的,需合法授权。
71 9
Kali Linux系统Metasploit框架利用 HTA 文件进行渗透测试实验
|
21天前
|
Ubuntu Linux Go
golang编译成Linux可运行文件
本文介绍了如何在 Linux 上编译和运行 Golang 程序,涵盖了本地编译和交叉编译的步骤。通过这些步骤,您可以轻松地将 Golang 程序编译成适合 Linux 平台的可执行文件,并在目标服务器上运行。掌握这些技巧,可以提高开发和部署 Golang 应用的效率。
160 14
|
20天前
|
存储 NoSQL Linux
linux积累-core文件是干啥的
核心文件是Linux系统在程序崩溃时生成的重要调试文件,通过分析核心文件,开发者可以找到程序崩溃的原因并进行调试和修复。本文详细介绍了核心文件的生成、配置、查看和分析方法
57 6
|
22天前
|
存储 NoSQL Linux
linux之core文件如何查看和调试
通过设置和生成 core 文件,可以在程序崩溃时获取详细的调试信息。结合 GDB 等调试工具,可以深入分析 core 文件,找到程序崩溃的具体原因,并进行相应的修复。掌握这些调试技巧,对于提高程序的稳定性和可靠性具有重要意义。
136 6
|
2月前
|
Linux 开发工具 Perl
在Linux中,有一个文件,如何删除包含“www“字样的字符?
在Linux中,如果你想删除一个文件中包含特定字样(如“www”)的所有字符或行,你可以使用多种文本处理工具来实现。以下是一些常见的方法:
48 5
|
2月前
|
安全 Linux 数据安全/隐私保护
在 Linux 系统中,查找文件所有者是系统管理和安全审计的重要技能。
在 Linux 系统中,查找文件所有者是系统管理和安全审计的重要技能。本文介绍了使用 `ls -l` 和 `stat` 命令查找文件所有者的基本方法,以及通过文件路径、通配符和结合其他命令的高级技巧。还提供了实际案例分析和注意事项,帮助读者更好地掌握这一操作。
59 6
|
2月前
|
Linux
在 Linux 系统中,`find` 命令是一个强大的文件查找工具
在 Linux 系统中,`find` 命令是一个强大的文件查找工具。本文详细介绍了 `find` 命令的基本语法、常用选项和具体应用示例,帮助用户快速掌握如何根据文件名、类型、大小、修改时间等条件查找文件,并展示了如何结合逻辑运算符、正则表达式和排除特定目录等高级用法。
186 6