Linux文件管理命令
grep:查找字符串
作用:查找文件中符合条件的字符串。grep(global search regular expression(RE) and print out
the line,全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,它能使用正则表
达式搜索文本,并把匹配的行打印出来。
UNIX 的 grep 家族包括 grep、egrep 和 fgrep。egrep
和 fgrep 的命令只跟 grep 略有不同。egrep 是 grep 的扩展,支持更多的 re 元字符,fgrep 就是
fixed grep 或 fast grep,它们把所有的字母都看作单词,也就是说,正则表达式中的元字符表示
其自身的字面意义,不再特殊。
Linux 使用 GNU 版本的 grep。它功能更强,可以通过-G、-E、
-F 命令行选项来使用 egrep 和 fgrep 的功能。grep 的工作方式是这样的:它在一个或多个文件
中搜索字符串模板。如果模板包括空格,则必须被引用,模板后的所有字符串被看作文件名。
搜索的结果被送到屏幕,不影响原文件内容。
grep 可用于 Shell 脚本,因为 grep 通过返回一个
状态值来说明搜索的状态。如果模板搜索成功,则返回 0;如果搜索不成功,则返回 1;如果
搜索的文件不存在,则返回 2。我们利用这些返回值就可进行一些自动化的文本处理工作。
用法:grep [选项]
1.匹配模式选择
命令 | 描述 |
-E,--extended-regexp |
扩展正则表达式 egrep。 |
-F,--fixed-strings |
一个换行符分隔的字符串的集合 fgrep。 |
-G,--basic-regexp |
基本正则。 |
-P,--perl-regexp |
调用的 perl 正则。 |
-e,--regexp=PATTERN |
后面跟正则模式,默认无 |
-f,--file=FILE |
从文件中获得匹配模式。 |
-i,--ignore-case |
不区分大小写。 |
-w,--word-regexp |
匹配整个单词。 |
-x,--line-regexp |
匹配整行。 |
-z,--null-data |
一个 0 字节的数据行,但不是空行。 |
2.杂项
命令 | 描述 |
-s,--no-messages |
不显示错误信息。 |
-v,--invert-match |
显示不匹配的行。 |
-V,--version |
显示版本号。 |
--help |
显示帮助信息。 |
3.输入控制
命令 | 描述 |
-m,--max-count=NUM |
匹配的最大数。 |
-b,--byte-offset |
打印该行所在的块号码。 |
-n,--line-number |
显示加上匹配所在的行号。 |
--line-buffered |
刷新输出每一行。 |
-H,--with-filename |
当搜索多个文件时,显示匹配文件名前缀。 |
-h,--no-filename |
输出时不显示文件名前缀。 |
--label=LABEL |
将 LABEL 作为标准输入文件名前缀。 |
-o,--only-matching |
只显示一行中匹配 PATTERN 的部分。 |
-q,--quiet,--silent |
不显示任何信息。 |
--binary-files=TYPE |
假定二进制文件的 TYPE 类型。TYPE 可以是’binary’、 ‘text’或’without-match’。 |
-a,--text |
匹配二进制的信息。 |
-I |
不匹配二进制的信息。 |
-d,--directories=ACTION |
目录操作,如读取、递归、跳过。 |
-D,--devices=ACTION |
设置对设备、FIFO、管道的操作,如读取、跳过。 |
-R,-r,--recursive |
递归调用。 |
--include=PATTERN |
只查找匹配 FILE_PATTERN 的文件。 |
--exclude=PATTERN |
跳过匹配 FILE_PATTERN 的文件和目录。 |
--exclude-from=FILE |
跳过所有除 FILE 以外的文件。 |
-L,--files-without-match |
匹配多个文件时,显示不匹配的文件名 |
-l,--files-with-matches |
匹配多个文件时,显示匹配的文件名。 |
-c,--count |
显示匹配了多少次。 |
-Z,--null |
在 FILE 文件最后打印空字符。 |
4.文件控制
命令 | 描述 |
-B,--before-context=NUM |
打印匹配本身及前面的几行,由 NUM 控制。 |
-A,--after-context=NUM |
打印匹配本身及随后的几行,由 NUM 控制。 |
-C,--context=NUM |
打印匹配本身及随后、前面的几行,由 NUM 控制。 |
-NUM |
与-C 的用法相同。 |
--color[=WHEN] |
使用标志高亮匹配字串。 |
-u,--unix-byte-offsets |
当 CR 字符不存在时,报告字节偏移(MSDOS 模式)。 |
练习案例
(1)查找文件“file.php”中是否包含字符串“html”。
# grep 'html' file.php
(2)检查/etc/passwd 文件中是否有可疑用户。
Linux 中的/etc/passwd 文件是存储系统用户密码等重要信息的文件,黑客入侵系统后往往 会使用在 passwd 文件中增加特权用户的方法为自己留个后门。所以,我们要经常查看该文件。 如果系统用户较少,可以采用直接查看 passwd 文件的方法,命令为“cat /etc/passwd”。如果系 统有成百上千个用户,那么直接查看就不行了,不过只要检测其中是否有 UID 为 0 的特权用户 就行了,这时可以使用以下命令来实现。
# grep '0:0' /etc/passwd
(3)通过管道过滤 ls -l 输出的内容,只显示以 a 开头的行。
ls -l | grep '^a'
(4)显示所有以 d 开头的文件中包含 test 的行。
$ grep 'test' d*
(5)显示在 aa、bb、cc 文件中匹配 test 的行。
$ grep 'test' aa bb cc
(6)显示所有包含每个字符串至少有 5 个连续小写字符的字符串的行。
$ grep ' [a-z] ' aa
grep 命令用于查找内容包含指定的范本样式的文件,如果发现某个文件的内容符 合所指定的范本样式,预设 grep 命令会把含有范本样式的那一列显示出来。若不指定 任何文件名称,或是所给予的文件名为“-”,则 grep 命令会从标准输入设备读取数据。要 用好 grep 这个工具,其实就是要写好正则表达式。上面(3)(4)(5)是正则表达式的应用实例。