本节书摘来自华章出版社《构建高可用Linux服务器 第3版》一 书中的第3章,第3.4节,作者:余洪春 ,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
3.4 Linux下强大的查找命令find
这一节跟大家介绍一下Linux强大的查找命令find。find的强大就在于它完美地支持了正则表达式。由于find具有强大的功能,所以它的选项也很多,其中大部分选项都值得我们花时间来了解一下。即使系统中含有网络文件系统(NFS),find命令在该文件系统中也同样有效,只要具有相应的权限。在运行一个非常消耗资源的find命令时,很多人都倾向于把它放在后台执行,因为遍历一个大的文件系统可能会花费很长的时间(这里是指100GB以上的文件系统)。
1.find命令的格式
find命令的一般形式如下:
find pathname -options [-print -exec -ok ...]
pathname:是find命令所查找的目录路径。例如用符号.来表示当前目录,用/来表示系统根目录。
-print:表示find命令将匹配的文件输出到标准输出中。
-exec:表示find命令对匹配的文件执行该参数所给出的Shell命令。相应命令的形式为'command'{}\;,注意{}和符号\;之间的空格。
-ok:它的作用和-exec相同,只不过是以一种更为安全的模式来执行该参数所给出的Shell命令,即在执行每一个命令之前,都会给出提示,让用户来确定是否执行。
下面来看看find命令选项。
-name
按照文件名查找文件。
-perm
按照文件权限来查找文件。
-prune
使用这一选项可以使find命令不在当前指定的目录中查找,如果同时使用-depth选项,那么-prune将被find命令忽略。
-user
按照文件属主来查找文件。
-group
按照文件所属的组来查找文件。
-mtime -n+n
按照文件的更改时间来查找文件,-n表示从此刻算起,文件的更改时间是在n天以内;+n表示文件的更改时间是在n天以前。find命令还有-atime和-ctime选项,它们和-m time选项的时间规定类似。
-nogroup
查找无有效所属组的文件,即该文件所属的组在/etc/groups中不存在。
-nouser
查找无有效属主的文件,即该文件的属主在/etc/passwd中不存在。
-newer file1!file2
查找更改时间比文件file1新但比文件file2旧的文件。
-type
查找某一类型的文件,诸如:
b:表示块设备文件。
d:表示目录。
c:表示字符设备文件。
p:表示管道文件。
l:表示符号链接文件。
f:表示普通文件。
-size n:[c]:表示查找文件长度为n块的文件,带有c时表示文件长度以字节计。
-depth:表示在查找文件时,首先查找当前目录中的文件,然后再在其子目录中查找。
-fstype:表示查找位于某一类型文件系统中的文件,这些文件系统类型通常可以在配置文件/etc/fstab中找到,该配置文件中包含了本系统中有关文件系统的信息。
-mount:表示在查找文件时不跨越文件系统mount点。
-follow:表示如果find命令遇到符号链接文件,就跟踪至链接所指向的文件。
-cpio:表示对匹配的文件使用cpio命令,将这些文件备份到磁带设备中。
我们一般使用exec或ok来执行Shell命令。
使用find时,只要把想要的操作写到一个文件里,就可以用exec来配合find查找,很方便。
在有些操作系统中只允许-exec选项执行诸如ls或ls -l这样的命令。大多数用户使用这一选项是为了查找旧文件并删除它们。建议在真正执行rm命令删除文件之前,最好先用ls命令查看一下,确认它们是所要删除的文件。
exec选项后面跟随着所要执行的命令或脚本,然后是一对{}、一个空格和一个\符号,最后是一个分号。为了使用exec选项,必须要同时使用print选项。如果验证一下find命令,你会发现该命令只输出从当前路径起的相对路径及文件名。
例如:为了用ls -l命令列出所匹配的文件,可以把ls -l命令放在find命令的-exec选项中,如下所示:
find . -type f -exec ls -l {} \ ;
-rw------- 1 root root 1024 06-20 20:34 ./.rnd
-rw-r--r-- 1 root root 939 06-22 17:59 ./cat
-rw------- 1 root root 8022 06-22 19:47 ./.viminfo
-rw-r--r-- 1 root root 939 06-22 17:59 ./list.txt
-rw-r--r-- 1 root root 3972 06-15 13:30 ./install.log.syslog
-rwxr-xr-x 1 root root 448 06-21 11:45 ./rsync.sh
-rw-r--r-- 1 root root 100 2007-01-06 ./.cshrc
-rw-r--r-- 1 root root 36730 06-18 11:52 ./New_Text_Document.txt
-rw------- 1 root root 6 06-21 11:03 ./.mysql_history
-rw-r--r-- 1 root root 789 06-18 23:24 ./.ssh/known_hosts
-rw-r--r-- 1 root root 167 06-21 11:34 ./.vimrc
-rw-r--r-- 1 root root 191 2007-01-06 ./.bash_profile
-rw-r--r-- 1 root root 24 2007-01-06 ./.bash_logout
-rw-r--r-- 1 root root 309 06-19 23:23 ./.bashrc
-rw-r--r-- 1 root root 22772 06-15 13:30 ./install.log
-rw-r--r-- 1 root root 939 06-22 18:00 ./file
-rw------- 1 root root 1254 06-15 13:30 ./anaconda-ks.cfg
-rw-r--r-- 1 root root 129 2007-01-06 ./.tcshrc
-rw------- 1 root root 13844 06-22 10:07 ./.bash_history
在上面的例子中,find命令匹配到了当前目录下的所有普通文件,并在-exec选项中使用ls -l命令将它们列出。
下面在/logs目录中查找更改时间在5日以前的文件并删除它们,如下所示:
find/logs -type f -mtime +5 -exec rm {} \ ;
注意 在Shell中用任何方式删除文件之前,应当先查看相应的文件,一定要小心使用诸如mv或rm的命令。可以使用安全模式-ok,它将在对每个匹配到的文件进行操作之前提示你。
在下面的例子中,find命令在当前目录中查找所有文件名以.log结尾、更改时间在5日以上的文件,并删除它们,只不过在删除之前先给出提示。命令如下所示:
find . -name "*.log" -mtime +5 -ok rm {} \ ;
按[y]键删除文件,按[n]键不删除。
任何形式的命令都可以在-exec选项中使用。
在下面的例子中我们使用grep命令。先用find命令匹配所有文件名为“passwd*”的文件,例如passwd、passwd.old、passwd.bak,然后执行grep命令看看在这些文件中是否存在一个sam用户。命令如下所示:
find /etc -name "passwd*" -exec grep "sam" {} \ ;
sam:x:501:501::/usr/sam:/bin/bash
2.find命令的实例说明
下面是find命令的实例说明。
1)查找当前用户主目录下的所有文件,命令如下:
find ~ -print
2)让当前目录中的文件属主具有读、写权限,并且文件所属组的用户和其他用户具有读权限的文件,其实就是查找权限为644的文件,命令如下:
find . -type f -perm 644 -exec ls -l {} \ ;
3)查找系统中所有文件长度为0的普通文件,并列出它们的完整路径,命令如下:
find / -type f -size 0 -exec ls -l {} \ ;
4)查找/var/logs目录中更改时间在7日以前的普通文件,并在删除之前进行提示,命令如下所示:
find /var/logs -type f -mtime +7 -ok rm {} \ ;
5)查找当前目录中所有属于root组的文件,命令如下所示:
find . -group root -exec ls -l { } \ ;
-rw-r--r-- 1 root root 789 06-18 23:24 known_hosts
-rw-r--r-- 1 root root 789 06-18 23:24 ./.ssh/known_hosts
-rw-r--r-- 1 root root 167 06-21 11:34 ./.vimrc
-rw-r--r-- 1 root root 191 2007-01-06 ./.bash_profile
-rw-r--r-- 1 root root 24 2007-01-06 ./.bash_logout
-rw-r--r-- 1 root root 309 06-19 23:23 ./.bashrc
-rw-r--r-- 1 root root 22772 06-15 13:30 ./install.log
-rw-r--r-- 1 root root 939 06-22 18:00 ./file
-rw------- 1 root root 1254 06-15 13:30 ./anaconda-ks.cfg
-rw-r--r-- 1 root root 129 2007-01-06 ./.tcshrc
-rw------- 1 root root 13844 06-22 10:07 ./.bash_history
6)find命令将删除目录中访问时间在7日以内且含有数字后缀的admin.log文件。
由于该命令只检查三位数字,所以相应文件的后缀不要超过999。我们先建几个admin.log*的文件,然后再使用下面的命令删除:
find . -name "admin.log[0-9]" -atime -7 -ok rm {} \ ;
7)查找当前文件系统中的所有目录并排序,命令如下:
find . -type d | sort
/data
/data/htdocs
/data/logs
/data/mysql
/data/mysql/3306
/data/mysql/3306/binlog
/data/mysql/3306/data
/data/mysql/3306/data/mysql
/data/mysql/3306/data/performance_schema
/data/mysql/3306/data/test
/data/mysql/3306/relaylog
与Shell下自带的ls命令比较一下结果,你会发现find命令可以列出当前目录下所有的目录,我们可以根据需求来选择到底采用哪种方法。下面看看Shell下查找目录的方法,如下所示:
ls –lF | grep /$
drwxrwxrwx 2 root root 4096 06-22 10:02 htdocs/
drwxr-xr-x 2 root root 4096 06-20 20:58 logs/
drwxr-xr-x 3 mysql mysql 4096 06-20 20:17 mysql/
8)查找系统中所有的rmt磁带设备,命令如下:
find /dev/rmt -print
3.用xargs来配合find工作
在使用find命令的-exec选项处理匹配到的文件时,find命令将所有匹配到的文件一起传递给exec执行。但有些系统对传递给exec的命令长度是有限制的,这样,在find命令运行几分钟之后,就会出现溢出错误。错误信息通常是“参数列太长”或“参数列溢出”。这就是xargs命令的用处所在,特别是在与find命令一起使用时。
find命令把匹配到的文件传递给xargs命令,而xargs命令每次只获取一部分文件而不是全部,不像-exec选项那样。这样它就可以先处理最先获取的那一部分文件,然后是下一批,并且如此继续下去。
在有些系统中,使用-exec选项会为处理每一个匹配到的文件而发起一个相应的进程,并非将匹配到的文件全部作为参数一次执行。这样,在有些情况下就会出现进程过多,系统性能下降的问题,因而效率不高。
而使用xargs命令则只有一个进程。另外,在使用xargs命令时,究竟是一次获取所有的参数,还是分批取得参数,包括每一次所获取参数的数目,都会根据该命令的选项及系统内核中相应的可调参数来确定。
来看看xargs命令是如何同find命令一起使用的,同时给出一些例子。
1)下面的例子用来查找系统中的每一个普通文件,然后使用xargs命令来测试它们分别属于哪类文件。
#find . -type f -print | xargs file
./.rnd: data
./cat: Non-ISO extended-ASCII text, with LF, NEL line terminators
./.viminfo: ISO-8859 text
./list.txt: Non-ISO extended-ASCII text, with LF, NEL line terminators
./install.log.syslog: ASCII text
./rsync.sh: Bourne-Again shell script text executable
./.cshrc: ASCII text
./New_Text_Document.txt: ISO-8859 English text, with very long lines, with CRLF line terminators
./admin.log2: empty
./.mysql_history: ASCII text
./.ssh/known_hosts: ASCII text, with very long lines
./.vimrc: ASCII text
./.bash_profile: ASCII English text
./.bash_logout: ASCII text
./admin.log1: empty
./.bashrc: ASCII text
./install.log: ASCII text
./file: Non-ISO extended-ASCII text, with LF, NEL line terminators
./anaconda-ks.cfg: ASCII English text
./.tcshrc: ASCII text
./.bash_history: ASCII text, with very long lines```
2)在当前目录下查找所有用户具有读、写和执行权限的文件,并收回相应的写权限,命令如下:
find . -perm -777 -print | xargs chmod o-w
然后我们用ls -lsart命令检查一下最后一句find命令是否生效,如下所示:
ls -lsart 1 2 3
0 -rwxrwxr-x 1 root root 0 06-22 20:09 1
0 -rwxrwxr-x 1 root root 0 06-22 20:09 2
0 -rwxrwxr-x 1 root root 0 06-22 20:09 3
[root@server andrewy0m]#
3)用grep命令在所有的普通文件中搜索包含rmt字符的文件。find命令配合着exec和xargs使用,可以使用户对所匹配到的文件执行几乎所有的命令,如下所示:
find . -type f -print | xargs grep rmt
./install.log:Installing rmt-0.4b41-4.el5.x86_64
嫌麻烦的朋友也可以采用以下命令来查找:
grep rmt -rl .
grep也有两个很厉害的参数,一个是r,表示递归;另一个是l,表示列出来。这条命令也会在当前目录下的所有目录和文件查找包含rmt字符的文件。
4.更详细和强大的find实例
下面是find一些常用参数的例子,先看看,没必要死记硬背,可以随用随查。
(1)使用name选项
文件名(name)选项是find命令最常用的选项,要么单独使用该选项,要么和其他选项一起使用。
可以使用某种文件名模式来匹配文件,记住要用引号将文件名模式引起来。
不管当前路径是什么,如果想要在自己的根目录$HOME中查找文件名符合*.txt的文件,使用~作为'pathname'参数,波浪号~代表你的$HOME目录。
想要在当前目录及子目录中查找所有的*.txt文件,可以使用如下命令:
find . -name "*.txt" -print
想要在当前目录及子目录中查找文件名以一个大写字母开头的文件,可以用如下命令:
find . -name "[A-Z]*" -print
想要在/etc目录中查找文件名以host开头的文件,可以用如下命令:
find /etc -name "host*" -print
想要查找$HOME目录中的文件,可以用如下命令:
find ~ -name "*" -print
find . -print
要想让系统高负荷运行,就从根目录开始查找所有的文件,命令如下所示:
find / -name "*" -print
如果想在当前目录中查找文件名以两个小写字母开头,跟着是两个数字,最后是.txt的文件,如下命令就能够返回名为ax37.txt的文件:
find . -name "[a-z][a-z][0-9][0-9].txt" -print
(2)使用perm选项
文件权限模式即-perm选项,find会按文件权限模式来查找文件,不过最好使用八进制的权限表示法。如果要在当前目录下查找文件权限位为755的文件,即文件属主可以读、写、执行,其他用户可以读、执行的文件,可以用如下命令:
find . -perm 755 -print
还有一种表达方法:在八进制数字前面要加一个横杠-,表示都匹配,如-007就相当于777,-006相当于666,如下所示:
find . -perm -006
./c
./b
./a
这里只是介绍一下这种用法,建议大家还是采用前面一种直观的方法。下面针对其中的部分参数进行说明:
-perm mode:文件许可正好符合mode。
-perm +mode:文件许可部分符合mode,如果是+006,表示文件的某一项权限为6,可以随便是哪一项,如果属主符合6权限,也可由find命令打印出来。
-perm -mode:文件许可完全符合mode,如果是-007,表示文件的所有权限都必须是7,即777。
(3)忽略某个目录进行查找
如果在查找文件时希望忽略某个目录,因为你知道那个目录中没有你所要查找的文件,那么可以使用-prune选项来指出需要忽略的目录。在使用-prune选项时要当心,因为如果你同时使用了-depth选项,那么-prune选项就会被find命令忽略。
如果希望在/home/andrewy目录下查找文件,但不希望在/home/andrewy/tv目录下查找,可以用:
find /home/andrewy/ -path "/home/andrewy/tv" -prune -o -type f -print
/home/andrewy/第九章.doc
/home/andrewy/1
/home/andrewy/3
/home/andrewy/.bash_profile
/home/andrewy/2
/home/andrewy/.bash_logout
/home/andrewy/.bashrc
/home/andrewy/test
/home/andrewy/file
(4)使用user和nouser选项
按文件属主查找文件,如果要在$HOME目录中查找文件属主为sam的文件,可以用如下命令:
find ~ -user sam -print
在/etc目录下查找文件属主为uucp的文件,可以用如下命令:
find /etc -user uucp -print
为了查找属主账户已经被删除的文件,可以使用-nouser选项,这样就能够找到那些属主在/etc/passwd文件中没有有效账户的文件了。在使用-nouser选项时,不必给出用户名,find命令能够为你完成相应的工作。
例如,希望在/home目录下查找所有的这类文件,可以用如下命令:
find /home -nouser -print
(5)使用group和nogroup选项
就像user和nouser选项一样,针对文件所属于的用户组,find命令也具有同样的选项,为了在/apps目录下查找属于gem用户组的文件,可以用如下命令:
find /apps -group gem -print
要查找没有有效所属用户组的所有文件,可以使用nogroup选项。下面的find命令从文件系统的根目录处查找这样的文件:
find / -nogroup-print
(6)按照更改时间或访问时间等查找文件
如果希望按照更改时间来查找文件,可以使用mtime、atime或ctime选项。如果系统突然没有可用空间了,很可能是某一个文件的长度在此期间增长迅速造成的,这时就可以用mtime选项来查找这样的文件。
用减号(-)来限定更改时间在距今n日以内的文件,而用加号(+)来限定更改时间是n日以前的文件。如果希望在系统根目录下查找更改时间在5日以内的文件,可以用如下命令:
find / -mtime -5 -print
为了在/var/adm目录下查找更改时间在3日以前的文件,可以用如下命令:
find /var/adm -mtime +3 -print
(7)查找比某个文件新或旧的文件
如果希望查找更改时间比某个文件新但比另一个文件旧的所有文件,可以使用-newer选项。它的一般形式如下:
newest_file_name ! oldest_file_name
查找更改时间比temp文件新的文件,可以用如下命令:
find . -newer temp -print
在进行系统维护时,我们经常遇到一种情况,即发现磁盘在不停地发生写现象,这时候我们要定位这个正在写的文件,可以选择建立一个文件,比如test.txt,然后用以下命令找出这个频繁写磁盘的文件(最好带上一些限制大小的参数来精确定位),命令如下所示:
find / -newer test.txt -print
(8)使用type选项
在/etc目录下查找所有的目录,可以用如下命令:
find /etc -type d -print
在当前目录下查找除目录以外所有类型的文件,可以用如下命令:
find . ! -type d -print
在/etc目录下查找所有的符号链接文件,可以用如下命令:
find /etc -type l -print
(9)使用size选项
可以按照文件长度来查找文件,这里所指的文件长度既可以用块(block)来计量,也可以用字节来计量。以字节计量文件长度的表达形式为Nc;以块计量文件长度只用数字表示即可。在按照文件长度查找文件时,一般使用这种以字节表示的方式;查看文件系统的大小,则用以块表示的方式,因为这时使用块来计量更容易转换。
在当前目录下查找文件长度大于1MB的文件,命令如下所示:
find . -size +1000000c -print
在/home/apache目录下查找文件长度恰好为100B的文件,命令如下所示:
find /home/apache -size 100c -print
在当前目录下查找长度超过10块的文件(一块等于512B),命令如下所示:
find . -size +10 -print
以上只是介绍一下size的各种表示方法,在工作中我们其实都是用M来进行比对的,最简单的方法通常也是最有效率的。
(10)使用depth选项
在使用find命令时,我们可能希望先匹配所有的文件,再在子目录中查找。在find命令中使用depth选项就可以达到此目的。比如,当在使用find命令向磁带上备份文件系统时,我们希望首先备份所有的文件,其次备份子目录中的文件。
在下面的例子中,find命令从文件系统的根目录开始,查找一个名为CON.FILE的文件:
find / -name "CON.FILE" -depth -print