查看磁盘占用情况
# 查看服务器磁盘空间整体情况 df -h # 查看当前目录,哪个文件占用最大 du -h --max-depth=1 # 查看当前目录下各文件及目录占用大小 du -sh *
按文件类型日期查找文件并删除
# 不加 -maxdepth 则会遍历当前目录下所有子目录中所有文件 # 找出当前目录下不包含子目录1天之前的 log 文件并删除 find ./ -maxdepth 1 -name "*.log*" -mtime +0 -exec rm -rf {} \; # 找出当前目录下不包含子目录3天之内的 .log 文件并删除 find ./ -maxdepth 1 -name "*.log*" -mtime -3 -exec rm -rf {} \;
其他参数
-mindepth n: 限定搜索指定目录的最小深度 -maxdepth n: 限定搜索指定目录的最大深度 atime 最后一次访问时间, 如 less, more 等, 但 chmod, chown, ls, stat 等不会修改些时间, 使用 ls -utl 可以按此时间顺序查看 ctime 最后一次状态修改时间, 如 chmod, chown 等状态时间改变但修改时间不会改变, 使用 stat file 可以查看 mtime 最后一次内容修改时间, 如 vi 保存后等, 修改时间发生改变的话, atime 和 ctime 也相应跟着发生改变 -ctime -n 查找距现在 n*24H 内修改过的文件 -ctime n 查找距现在 n*24H 前, (n+1)*24H 内修改过的文件 -ctime +n 查找距现在 (n+1)*24H 前修改过的文件 [a|c|m]min [最后访问|最后状态修改|最后内容修改]分钟数(n*min) [a|c|m]time [最后访问|最后状态修改|最后内容修改]天数(n*24H)
查看文件目录数量
# 查看当前目录下的文件数量(不包含子目录中的文件) ls -l | grep "^-" | wc -l # 查看当前目录下的文件数量(包含子目录中的文件)注意:R,代表子目录 ls -lR | grep "^-" | wc -l # 查看当前目录下的目录个数(不包含子目录中的目录) ls -l | grep "^d" | wc -l # 查看当前目录下的目录数量(包含子目录中的目录)注意:R,代表子目录 ls -lR | grep "^d" | wc -l # 统计所有以"test"开头的目录下的全部文件数量 ls -lR test*/|grep "^-"| wc -l # 统计当前目录下42天前所有文件总共大小(单位字节) find ./ -name "*.*" -mtime +42 -exec ls -l {} \;|awk 'BEGIN {SUM=0}{SUM+=$5} END{print SUM}'
找出已经删除但空间未释放的大文件并清空
找出已经删除但磁盘空间未释放的文件,如果文件已经删除,但实际的磁盘空间未释放,这个时候文件句柄 fd 相关信息还在内存中,可以通过 lsof 命令找出,比如打开文件的pid和读写文件的系统fd。
# yum -y install lsof # lsof |grep -i delete java 20302 5351 hbase 3w REG 253,1 25778031203 43040 /var/log/hbase/gc.log-201812251535 (deleted) java 20302 5354 hbase 3w REG 253,1 25778031203 43040 /var/log/hbase/gc.log-201812251535 (deleted) java 20302 5988 hbase 3w REG 253,1 25778031203 43040 /var/log/hbase/gc.log-201812251535 (deleted) java 20302 12680 hbase 3w REG 253,1 25778031203 43040 /var/log/hbase/gc.log-201812251535 (deleted) java 20302 15047 hbase 3w REG 253,1 25778031203 43040 /var/log/hbase/gc.log-201812251535 (deleted) java 20302 16379 hbase 3w REG 253,1 25778031203 43040 /var/log/hbase/gc.log-201812251535 (deleted) java 20302 16380 hbase 3w REG 253,1 25778031203 43040 /var/log/hbase/gc.log-201812251535 (deleted)
清空已经删除但未释放的大文件
如果要让大文件彻底删除,通常需要重启打开文件的进程,但是有时在线服务不方便重启,影响服务的可用性。
这个时候可以通过 /proc/${pid}/fd 信息找到打开这个文件的系统 fd,然后通过 fd 来清空文件
# ll /proc/20302/fd/ |grep 201812251535 l-wx------ 1 hbase hadoop 64 Oct 18 21:02 3 -> /var/log/hbase/gc.log-201812251535 (deleted) # 清空文件 # echo > /proc/20302/fd/3