正则表达式详解

简介:

正则表达式


正则表达式(或称Regular Expression,简称RE)就是由普通字符(例如字符 a  z)以及特殊字符(称为元字符)组成的文字模式。


该模式描述在查找文字主体时待匹配的一个或多个字符串。


正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。简单的说,正则表示式就是处理字符串的方法,它是以行为单位来进行字符串的处理行为,正则表示式通过一些特殊符号的辅助,可以让使用者轻易的达到搜寻/删除/取代某特定字符串的处理程序。vimgrepfindawksed等命令都支持正则表达式。

常用正则表达式:

1.代表任意单个字符,如:/l..e/与包含一个l,后跟两个字符,然后跟一个e的行相匹配

  ? 匹配零个或一个字符。如:'gr?p'匹配gr后跟一个或没有字符,然后是p的行


2^代表行的开始。 ^love 如:与所有love开头的行匹配


3$代表行的结束。love$ 如:与所有love结尾的行匹配

那么‘^$’ 就表示空行


4[]匹配括号中的字符之一

[abc]匹配单个字符abc

[123]匹配单个字符123

[a-z]匹配小写字母a-z之一

[a-zA-Z]匹配任意英文字母之一

[0-9a-zA-Z]匹配任意英文字母或数字之一

注意:上面标红色的单个和之一,不管[]里面多复杂,它的结果都是一个字符!


可以用^标记做[]内的前缀,表示[]内的字符之外的字符。比如搜索oo前没有g的字符串的行应用 '[^g]oo' 作搜索字符串,^符号如果出现[]的起始位置表示否定,但是[]的其他位置是普通字符[^ab^c] 匹配b^c不是a的任意单个字符


5、* 用于修饰前导字符,表示前导字符出现0或任意多

如:'a*grep'匹配所有0个或多个a后紧跟grep的行。.*”表示任意字符串


6\?用于修饰前导字符,表示前导字符出现0或1

a\? 匹配0或1个a


7\+用于修饰前导字符,表示前导字符出现1或多

a\+ 匹配1或多个a


8\{n,m\}用于修饰前导字符,表示前导字符出现n至m次 (n和m都是整数,且n<m)

a\{3,5\} 匹配3至5个连续的a


\{n,m\}还有其他几种形式:

\{n\}连续的n前导字符

\{n,\}连续的至少n个前导字符

9、\用于转义紧跟其后的单个特殊字符,使该特殊字符成为普通字符


如:^\.[0-9][0-9]以一个句点和两个数字开始



例如:

a* 匹配连续的任意(也包括0)个a

a\? 匹配0或1个a

a\+ 匹配1或多个a

a\{3,5\} 匹配3至5个连续的a

\.* 匹配0或多个连续的. \.表示普通字符句点


10|表示如:a|b|c 匹配abc。如:grep|sed匹配grepsed


11(),将部分内容合成一个单位组,比如要搜索 glad  good可以如下 'g(la|oo)d'


综合举例1:

1 Christian Scott lives here and will put ona Christmas party.

2 There are around 30 to 35 people invited.

3 They are:

4  Tom

5 Dan

6 Rhonda Savage

7 Nicky and Kimerly.

8 Steve, Suzanne, Ginger and Larry.

^[A-Z]..$

搜索行以A至Z的一个字母开头,然后跟两个任意字母,然后跟一个换行符的行。将找到第5行。


^[A-Z][a-z]*3[0-5]

搜索以一个大写字母开头,后跟0个或多个小写字母,再跟数字3,再跟05之间的一个数字。无法找到匹配行(改成^[A-Z][a-z]*.*3[0-5]可找到第2行)


^ *[A-Z][a-z][a-z]$

搜索以0个或多个空格开头,跟一个大写字母,两个小写字母和一个换车符。将找到第4行的TOM(整行匹配)和第5行。注意,*前面有一个空格


^[A-Za-z]*[^,][A-Za-z]*$

将查找以0个或多个大写或小写字母开头,不跟逗号,然后跟0个或多个大写或小写字母,然后跟一个换车符。将找到第4和5行。


综合举例2:

# ls -l  /bin | grep  '^...s'

上面的命令是用来查找suid文件的;

# ls -lR /usr | grep   '^...s..s'

上面的命令是用来查找suidguid的。


本文转自甘兵 51CTO博客,原文链接:http://blog.51cto.com/ganbing/1220939,如需转载请自行联系原作者


相关文章
|
8月前
|
人工智能 自然语言处理 Rust
【内附榜单】评估AI大模型的代码修复能力!Multi-SWE-bench:字节开源代码修复能力评估基准,覆盖7大主流编程语言
Multi-SWE-bench是首个覆盖Python外7种主流编程语言的代码修复基准,包含1632个真实GitHub问题样本,通过严格筛选与人工验证确保数据质量。
638 0
【内附榜单】评估AI大模型的代码修复能力!Multi-SWE-bench:字节开源代码修复能力评估基准,覆盖7大主流编程语言
|
4月前
|
人工智能 监控 安全
智慧工地主要包括哪些内容?
智慧工地运用物联网、AI、大数据等技术,实现施工全过程的数字化与智能化管理。涵盖人员、设备、安全、环境、质量与信息化六大板块,通过智能设备与系统协同,提升效率、保障安全、降低成本,助力绿色施工与科学决策。
780 5
|
5月前
|
SQL JavaScript 前端开发
从混乱到聚焦:任务优先级排序工具在敏捷管理中的核心作用解析
在快节奏的工作中,任务多却难出成绩?问题往往不在“做得少”,而在“乱做”。本文详解任务优先级排序工具的原理与实战,帮助团队统一评估标准、聚焦关键目标,避免被紧急事务干扰真正重要的工作。通过实用工具与代码示例,助你建立科学的任务排序机制,提升效率与产出。
|
3月前
|
传感器 人工智能 安全
物联网
万物互联,智启未来。物联网通过连接人、物、环境,重塑生活、城市与产业。从智能家居到智慧城市,从工业互联网到精准农业,数据驱动智能化变革。融合AI、5G等技术,构建高效、安全、可持续的智能世界,开启人类社会新篇章。(238字)
|
数据采集 异构计算
LabVIEW编程LabVIEW开发高级数据采集技术 操作数字IO 例程与相关资料
LabVIEW编程LabVIEW开发高级数据采集技术 操作数字IO 例程与相关资料
242 22
|
开发框架 JavaScript 前端开发
TypeScript 是一种静态类型的编程语言,它扩展了 JavaScript,为 Web 开发带来了强大的类型系统、组件化开发支持、与主流框架的无缝集成、大型项目管理能力和提升开发体验等多方面优势
TypeScript 是一种静态类型的编程语言,它扩展了 JavaScript,为 Web 开发带来了强大的类型系统、组件化开发支持、与主流框架的无缝集成、大型项目管理能力和提升开发体验等多方面优势。通过明确的类型定义,TypeScript 能够在编码阶段发现潜在错误,提高代码质量;支持组件的清晰定义与复用,增强代码的可维护性;与 React、Vue 等框架结合,提供更佳的开发体验;适用于大型项目,优化代码结构和性能。随着 Web 技术的发展,TypeScript 的应用前景广阔,将继续引领 Web 开发的新趋势。
304 2
|
人工智能 运维 数据库
未来的后端开发:人工智能与云计算的融合
【2月更文挑战第10天】 传统的后端开发一直依赖于对数据库、服务器和网络等底层技术的熟练运用,然而随着人工智能和云计算技术的飞速发展,未来的后端开发方向也将发生深刻的变革。本文将探讨人工智能与云计算在后端开发中的应用前景,以及它们将如何重塑后端开发的方式和手段。
|
SQL 分布式计算 大数据
大数据-168 Elasticsearch 单机云服务器部署运行 详细流程
大数据-168 Elasticsearch 单机云服务器部署运行 详细流程
344 2
网站是什么?怎么样制作网站?
网站就是‌HTML等工具制作的用于展示特定内容相关网页的集合。用户可以通过网站发布信息或提供网站服务。
11658 4