Linux行处理工具: grep 正则表达式

简介: Linux行处理工具: grep 正则表达式

在介绍正则表达式之前,我们先来尝试一下,假如有如下文本。


image.png


我们想获取空行,应该如何来写呢?

命令: grep ^$ test1 -n


image.png


通过上述例子,我们使用正则表达式^$已经成功拿到了第四行数据,那么,这究竟如何解呢,我们细看博文。



正则表达式在grep应用以及差别


grep表达式有三种不同的版本,分别为basic(BRE) 、extendedERE) 以及 perl(PCRE) ,我们grep默认支持的是BRE,而EREegrep支持的,或者说是grep -E支持的, 而PCRE则是grep -P支持的,那么这三者究竟有啥区别呢?

BRE ERE PCRE
任意字符 . . .
前一个字符0次或者出现1次 ? ? ?
前一个字符出现0次或无数次 * * *
前一个字符出现一个或者更多 + + +
字符集 [...] [...] [...]
字符集取反 [^...] [^...] [^...]
匹配前面字符出现的n次 {n} {n} {n}
匹配前面字符出现的n次以上 {n,} {n,} {n,}
匹配前面字符出现的n次到m次 {n,m} {n,m} {n,m}
开头
结尾 $ $ $
多表达式连接 |
单词 \w \w \w 或者 [[:word:]]
字母大写/小写 [[:upper:]]/[[:lower:]] [[:upper:]]/[[:lower:]] [[:upper:]]/[[:lower:]]
非单词 \W
空白字符 \s 或者 [[:space:]] \s 或者 [[:space:]]
非空白字符 [^[:space:]] [^[:space:]] \S
数字 \d 或者 [[:digit:]] [[:digit:]] [[:digit:]]
非数字 \D [^[:digit:]] [^[:digit:]]

那么如何进行切换呢? 如上面所示,我们来看下。

image.png


如上所述,若我们需要连接多个匹配项,在BRE(grep)中则是|,而在ERE(egrep)PCRE(grep -P)中则是|,所以我们可以顺利获取出结果,更多匹配项如上所述


匹配案例


匹配电话号码

若电话号码为xxx-xxxx-xxxx类型的,如何进行匹配呢? 我们可以使用'[0-9]{3}-[0-9]{4}-[0-9]{4}'进行匹配。


例如:

命令:

echo "telphone: 180-1234-5678" | grep  '[0-9]{3}-[0-9]{4}-[0-9]{4}' -o


image.png

同样的,该方法还可以用来匹配其ip地址,正则: [0-9]{0,3}.[0-9]{0,3}.[0-9]{0,3}.[0-9]{0,3}

image.png


匹配空行

若我们想匹配空行,则可以使用^$进行匹配,即: 开头就是结尾。

例如:

image.png


如上命令,我们顺利取出了 第3、5、6行数据

匹配所有字母

命令:

echo 'Ac123e23dddwQW21' | grep "[[:upper:]]|[[:lower:]]" -o

image.png

取出redis在使用的配置文件

我们知道redis服务器是以#来注释的,我们可以利用grep或者egrep来过滤掉注释和空格,例如:

image.png


fgrep

fgrep最为简单,它不会启用正则表达式,而是按照字符来进行搜索,什么意思呢? 我们举个小案例就清楚了,

image.png

它不会进行任何正则匹配,所以可以直接使用搜索选就成,不用考虑转移啥的。



总结


我们一般将BRE称之为 基本正则表达式、ERE称之为 扩展正则表达式 而 PCRE称之为Perl兼容的正则表达式,如上正则表达式不是grep工具所实现的,而是单独的一套表达式,有很多语言在使用中,例如 sed默认正则表达式是 BRE, 而我们之前所学习的awk使用的正则表达式则是ERE,是不是感觉知识被串联起来了呢,好巧,我也是,怎么样,快来动手试验一下吧。



相关文章
|
1月前
|
Linux 网络安全 数据安全/隐私保护
Linux 超级强大的十六进制 dump 工具:XXD 命令,我教你应该如何使用!
在 Linux 系统中,xxd 命令是一个强大的十六进制 dump 工具,可以将文件或数据以十六进制和 ASCII 字符形式显示,帮助用户深入了解和分析数据。本文详细介绍了 xxd 命令的基本用法、高级功能及实际应用案例,包括查看文件内容、指定输出格式、写入文件、数据比较、数据提取、数据转换和数据加密解密等。通过掌握这些技巧,用户可以更高效地处理各种数据问题。
92 8
|
2月前
|
监控 Unix Linux
Linux系统工具
Linux系统工具
52 6
|
2月前
|
监控 Java Linux
Linux系统之安装Ward服务器监控工具
【10月更文挑战第17天】Linux系统之安装Ward服务器监控工具
64 5
Linux系统之安装Ward服务器监控工具
|
2月前
|
JSON JavaScript Linux
Linux系统之安装cook菜谱工具
【10月更文挑战第15天】Linux系统之安装cook菜谱工具
42 2
Linux系统之安装cook菜谱工具
|
1月前
|
缓存 监控 Linux
Linux性能分析利器:全面掌握perf工具
【10月更文挑战第18天】 在Linux系统中,性能分析是确保软件运行效率的关键步骤。`perf`工具,作为Linux内核自带的性能分析工具,为开发者提供了强大的性能监控和分析能力。本文将全面介绍`perf`工具的使用,帮助你成为性能优化的高手。
141 1
|
1月前
|
缓存 监控 Linux
掌握Linux性能分析:深入探索perf工具
【10月更文挑战第26天】
51 1
|
3月前
|
监控 Linux
linux之grep详解
linux之grep详解
|
3月前
|
Linux
linux之centos安装dataease数据报表工具
linux之centos安装dataease数据报表工具
|
6月前
|
数据库 Python
Python网络数据抓取(8):正则表达式
Python网络数据抓取(8):正则表达式
64 2
|
6月前
|
自然语言处理 JavaScript 前端开发
Python高级语法与正则表达式(二)
正则表达式描述了一种字符串匹配的模式,可以用来检查一个串是否含有某种子串、将匹配的子串做替换或者从某个串中取出符合某个条件的子串等。
下一篇
DataWorks