Shell 脚本正则表达式(一)
一、正则表达式概述
1.正则表达式定义
2.正则表达式用途
3.基础正则表达式
二、基础正则表达式
1.基础正则表达式常见元字符
2.基础正则表达式示例
三、扩展正则表达式
1.扩展正则表达式的常见元字符
2.扩展正则表达式示例
一、正则表达式概述
1.正则表达式定义
正则表达式,又称正规表达式、常规表达式。在代码中常简写为 regex 、regexp 或 PE。正则表达式是使用单个字符串来描述,匹配一系列符合某个句法规则的字符串,简单来说,是一种匹配字符串的方法,通过一些特殊符号,实现快速查找、删除、替换某个特定字符串。
正则表达式是由普通字符与元字符组成的文字模式。
- 普通字符包括大小写字母、数字、标点符号及一些其他符号。
- 元字符则是指那些在正则表达式中具有特殊意义的专用字符,可以用来规定其前导字符(即位于元字符前面的字符)在目标对象中的出现模式。
2.正则表达式用途
正则表达式对于系统管理员来说是非常重要的,系统运行过程中会产生大量的信息,系统管理员可以通过正则表达式快速提取"有问题"的信息。如此一来,可以将运维工作变得更加简单、方便。
3.基础正则表达式
正则表达式的字符串表达方法根据不同的严谨程度与功能分别为正则表达式与扩展正则表达式。基础正则表达式是常用的正则表达式的最基础的部分。
二、基础正则表达式
1.基础正则表达式常见元字符
2.基础正则表达式示例
1)查找特定字符
创建测试文件
[root@localhost ~]# vim test.txt he was short and fat. He was wearing a blue polo shirt with black pants. The home of Football on BBC Sport online. the tongue is boneless but it breaks bones.12! google is the best tools for search keyword. The year ahead will test our political establishment to the li PI=3.141592653589793238462643383249901429 a wood cross! Actions speak louder than words #woood # #woooooood # AxyzxyzxyzxyzC I bet this place is really spooky late at night! Misfortunes never come alone/single. I shouldn't have lett so tast.
查找 the 并显示行号
[root@localhost ~]# grep -n 'the' test.txt
查找 the 并不区分大小写
[root@localhost ~]# grep -ni 'the' test.txt
反向查找不包含 the 的行
[root@localhost ~]# grep -nv 'the' test.txt
2)利用中括号 [ ] 来查找集合字符
- [ ]:里面无论有多少字符,都代表一个字符,为 或 的关系。
- [^ ]:括号里面的 ^ 是 取反 的意思。
查找包含 shirt 和 short 的行
[root@localhost ~]# grep -n 'sh[io]rt' test.txt
查找重复单个字符 oo 的行
[root@localhost ~]# grep -n 'oo' test.txt
查找 oo 前面不是 w 的行
[root@localhost ~]# grep -n '[^w]oo' test.txt
查找 oo 前面不是小写字母的行
[root@localhost ~]# grep -n '[^a-z]oo' test.txt
查找 oo 前面不是大写字母的行
[root@localhost ~]# grep -n '[^A-Z]oo' test.txt
查找包含数字的行
[root@localhost ~]# grep -n '[0-9]' test.txt
3)查找行首 ^ 与行尾字符 $
- 小数点 . 在正则表达式中为元字符,需要使用转义字符 \ 将其转化为普通字符。
查找以小数点 . 结尾的行
[root@localhost ~]# grep -n '\.$' test.txt
查找空行
[root@localhost ~]# grep -n '^$' test.txt
4)查找任意一个字符用 .,重复字符用 *
- *:表示重复零个或多个前面的单个字符。
查找以 w 开头,d 结尾共 4 个字符的行
[root@localhost ~]# grep -n 'w..d' test.txt
查询至少包含两个 o 以上的字符串
[root@localhost ~]# grep -n 'ooo*' test.txt
查找以 w 开头,中间至少包含一个 o 的,d 结尾的行
[root@localhost ~]# grep -n 'woo*d' test.txt
查找以 w 开头,d 结尾,中间字符可有可无的行
[root@localhost ~]# grep -n 'w.*d' test.txt
查询任意数字的行
[root@localhost ~]# grep -n '[0-9][0-9]*' test.txt
5)查找连续字符范围 {}
- 使用 . 和 * 可以设置零个或无限个重复的字符。
- 但如果要限制一个范围则使用 {}。
查看 2 个 o 的字符
[root@localhost ~]# grep -n 'o\{2\}' test.txt
查看以 w 开头,d 结尾,中间为 2,5 个 o 的字符串
[root@localhost ~]# grep -n 'wo\{2,5\}d' test.txt
三、扩展正则表达式
1.扩展正则表达式的常见元字符
2.扩展正则表达式示例
[root@localhost ~]# egrep -n 'wo+d' test.txt 执行该命令即可查询到"wood","woood","wooooood"等字符串
[root@localhost ~]# egrep -n 'bes?t' test.txt 执行该命令即可查询到"bet""best"这两个字符串
[root@localhost ~]# egrep -n 'of|is|on' test.txt 执行该命令即可查询到"of",或者"is",或者"on"字符串
[root@localhost ~]# egrep -n 't(a|e)st' test.txt "tast"与"test"因为这两个单词的"t"与"st"是重复的,所以将"a"与"e"列入"()"符号当中,并以"|"分隔,即可查询"tast"或者"test"字符串
[root@localhost ~]# egrep -n 'A(xyz)+C' test.txt 该命令是查询开头的"A"结尾是"C",中间有一个以上的"xyz"字符串的意思