早上一个网站页面打开空白,后来查看是磁盘空间满了,查看是nginx的access.log占用了170多个G,于是通过rm将其删除,后重启nginx问题依然,此时再查看磁盘发现空间并未释放
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
|
[root@localhost logs]
# du -h *
176G access.log
0 error.log
4.0K nginx.pid
[root@localhost logs]
# du -sh
176G .
[root@localhost logs]
# rm access.log
[root@localhost logs]
# df -Th
文件系统 类型 容量 已用 可用 已用% 挂载点
/dev/mapper/VolGroup00-LogVol00
ext3 189G 180G 0 100% /
/dev/sda1
ext3 99M 13M 82M 13%
/boot
tmpfs tmpfs 2.0G 0 2.0G 0%
/dev/shm
[root@localhost logs]
# du -sh
26M .
[root@localhost logs]
#
|
这个郁闷啊,明明删除文件了,怎么空间没有被释放啊,rm命令应该是直接删除啊,在查看/opt/nginx/longs/显示空间已经释放了,于是google下
未释放磁盘空间原因:
在Linux或者Unix系统中,通过rm或者文件管理器删除文件将会从文件系统的目录结构上解除链接(unlink).然而如果文件是被打开的(有一个进程正在使用),那么进程将仍然可以读取该文件,磁盘空间也一直被占用。
此时想起来在rm前我查看了下access.log,这不是关键,问题是我结束查看的时候使用ctrl+c时候将c按成了z,因为文件175G,cat会一致在后面运行,
解决方法:
首先获得一个已经被删除但是仍然被应用程序占用的文件列表
1
2
3
|
[root@localhost logs]
# lsof |grep deleted
cat
4435 root 3r REG 8,3 184549376 399932
/opt/nginx/logs/access
.log (deleted)
[root@localhost logs]
#
|
从输出结果可以看到/opt/nginx/logs/access.log还被使用,未被释放空间,
如何让进程释放呢?
一种方法是kill掉相应的进程,或者停掉使用这个文件的应用,让os自动回收磁盘空间。
当linux打开一个文件的时候,Linux内核会为每一个进程在/proc/ 『/proc/nnnn/fd/目录(nnnn为pid)』建立一个以其pid为名的目录用来保存进程的相关信息,而其子目录fd保存的是该进程打开的所有文件的fd(fd:file descriptor)。
kill进程是通过截断proc文件系统中的文件可以强制要求系统回收分配给正在使用的的文件。这是一项高级技术,仅到管理员确定不会对运行中的进程造成影响时使用。应用程序对这种方式支持的并不好,当一个正在使用的文件被截断可能会引发不可预知的问题
我这里直接使用了kill
1
2
3
4
5
6
7
8
|
[root@localhost logs]
# kill -9 4435
[root@localhost ~]
# df -Th
文件系统 类型 容量 已用 可用 已用% 挂载点
/dev/mapper/VolGroup00-LogVol00
ext3 189G 3.4G 185G 2% /
/dev/sda1
ext3 99M 13M 82M 13%
/boot
tmpfs tmpfs 2.0G 0 2.0G 0%
/dev/shm
[root@localhost ~]
#
|
在查看磁盘空间的使用情况,发现空间已经回收了。
关于lsof命令
lsof(list open files)是一个列出当前系统打开文件的工具。在linux环境下,任何事物都以文件的形式存在,通过文件不仅仅可以访问常规数据,还可以访问网络连接和硬件。所以如传输控制协议 (TCP) 和用户数据报协议 (UDP) 套接字等,系统在后台都为该应用程序分配了一个文件描述符,无论这个文件的本质如何,该文件描述符为应用程序与基础操作系统之间的交互提供了通用接口。因为应用程序打开文件的描述符列表提供了大量关于这个应用程序本身的信息,因此通过lsof工具能够查看这个列表对系统监测以及排错将是很有帮助的
1
2
3
4
5
|
[root@localhost ~]
# lsof|more
COMMAND PID USER FD TYPE DEVICE SIZE
/OFF
NODE NAME
init 1 root cwd DIR 8,3 4096 2 /
init 1 root rtd DIR 8,3 4096 2 /
init 1 root txt REG 8,3 149284 130607
/sbin/init
|
TYPE:文件类型,如DIR、REG等
DEVICE:指定磁盘的名称
NODE:索引节点(文件在磁盘上的标识)
FD:文件描述符,应用程序通过文件描述符识别该文件。如cwd、txt等
cwd 值表示应用程序的当前工作目录,这是该应用程序启动的目录,除非它本身对这个目录进行更改。
txt 类型的文件是程序代码,如应用程序二进制文件本身或共享库,如上列表中显示的 /sbin/init 程序。其次数值表示应用程序的文件描述符,这是打开该文件时返回的一个整数。如上的最后一行文件/dev/initctl,其文件描述符为 10。u 表示该文件被打开并处于读取/写入模式,而不是只读 或只写 (w) 模式。同时还有大写 的W 表示该应用程序具有对整个文件的写锁。该文件描述符用于确保每次只能打开一个应用程序实例。初始打开每个应用程序时,都具有三个文件描述符,从 0 到 2,分别表示标准输入、输出和错误流。所以大多数应用程序所打开的文件的 FD 都是从 3 开始。
与 FD 列相比,Type 列则比较直观。文件和目录分别称为 REG 和 DIR。而CHR 和 BLK,分别表示字符和块设备;或者 UNIX、FIFO 和 IPv4,分别表示 UNIX 域套接字、先进先出 (FIFO) 队列和网际协议 (IP) 套接字。
lsof参数:
-d FD 显示指定文件描述符的进程
-c string 显示COMMAND列中包含指定字符的进程所有打开的文件
-u username 显示所属user进程打开的文件
-g gid 显示归属gid的进程情况
+d /DIR/ 显示目录下被进程打开的文件
+D /DIR/ 同上,但是会搜索目录下的所有目录,时间相对较长
-n 不将IP转换为hostname,缺省是不加上-n参数
-i 用以显示符合条件的进程情况
eg、查看22端口现在运行的情况
1
2
3
|
[root@localhost ~]
# lsof -i :22
COMMAND PID USER FD TYPE DEVICE SIZE
/OFF
NODE NAME
sshd 1568 root 3u IPv4 10443 0t0 TCP *:
ssh
(LISTEN)
|
-a 表示两个参数都必须满足时才显示结果
1
2
3
|
[root@localhost ~]# lsof -a -u root -d txt|more
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
init
1
root txt REG
8
,
3
149284
130607
/sbin/init
|
查找谁在使用文件系统
1
2
3
4
|
[root@localhost home]
# lsof lsof
COMMAND PID USER FD TYPE DEVICE SIZE
/OFF
NODE NAME
bash
2106 root cwd DIR 8,3 4096 130855
lsof
[root@localhost home]
#
|