正则表达式 - 元字符

简介: 基本字符描述\将下一个字符转义^匹配输入字符串的开始位置$匹配输入字符串的结束位置.匹配除 "\n" 之外的任何单个字符。

基本

字符 描述
\ 将下一个字符转义
^ 匹配输入字符串的开始位置
$ 匹配输入字符串的结束位置
. 匹配除 "\n" 之外的任何单个字符。
|
[abc] 匹配包含abc的任意一个字符串
[^abc] 匹配未包含abc的任意字符串
[a-z] [A-Z] [0-9] 匹配指定范围的字符串
[\u4e00-\u9fa5] 匹配任意中文

限制符 - 匹配次数

表明前面的子表达式需要匹配几次

字符 描述
* 匹配零次或多次
+ 匹配一次或多次
? 匹配零次或一次
{n} 匹配n次
{n,} 至少匹配n次
{n,m} 至少匹配n次 至多匹配m次
限制符后跟? 将匹配模式改为非贪婪

子表达式

字符 描述 是否获取
(pattern) 匹配 pattern 通常和 | 连用
(?:pattern) 匹配 pattern 通常和 | 连用
(?=pattern) 正向预查 在任何匹配 pattern 的开始处查找
(?<=pattern) 正向预查 在任何匹配 pattern 的结束处查找
(?!pattern) 负向预查 在任何不匹配 pattern 的开始处查找

转义字符

字符 描述 等价于
\b 在单词的边界处匹配之前的字符串
\B 在非单词边界处匹配之前的字符串
\d 匹配一个数字字符 [0-9]
\D 匹配一个非数字字符 [^0-9]
\f 匹配一个换页符 \x0c 和 \cL
\n 匹配一个换行符 \x0a 和 \cJ
\r 匹配一个回车符 \x0d 和 \cM
\s 匹配任何空白字符,包括空格、制表符、换页符等等 [ \f\n\r\t\v]
\S 匹配任何非空白字符 [^ \f\n\r\t\v]
\t 匹配一个制表符 \x09 和 \cI
\v 匹配一个垂直制表符 \x0b 和 \cK
\w 匹配包括下划线的任何单词字符 [A-Za-z0-9_]
\W 匹配任何非单词字符 [^A-Za-z0-9_]
目录
相关文章
|
Java
避免分割字符串的常见错误:正则表达式元字符未转义
在编程和文本处理中,我们经常需要将一个字符串按照特定的分隔符拆分成多个部分。为了实现这一目标,我们使用分割函数或正则表达式来定义我们所需的分隔符。 在 Java 的 String 类的 split() 函数中,如果你使用字符串参数作为分隔符,例如 split(","),它会按照每个字符作为分隔符进行字符串拆分。
111 0
|
机器学习/深度学习 Java Unix
最详解的正则表达式------元字符
正则表达式是通过一些特殊字符的排列,用以查找、替换、删除一行或多行文字字符串,简单的说,正则表达式就是用在字符串的处理上面的一项表示式。由于正则表达式语法简练,功能强大,得到了许多 程序设计语言的支持,包括Java、C++、Perl以及Shell等。
136 0
|
机器学习/深度学习 移动开发 前端开发
Sublime Text3快捷键大全--正则表达式元字符-详细说明
Sublime Text3快捷键大全--正则表达式元字符-详细说明
291 0
正则表达式重复元字符
正则表达式重复元字符
143 0
|
机器学习/深度学习 Shell C++
正则表达式普通字符、非打印字符、特殊字符、限定符的应用、定位符、元字符(规则,匹配,和实际使用)与运算符优先级
正则表达式普通字符、非打印字符、特殊字符、限定符的应用、定位符、元字符(规则,匹配,和实际使用)与运算符优先级
311 0
|
机器学习/深度学习
正则表达式(一):常用元字符
正则是什么 正则表达式是一种字符串模式,用来对某些规则的文本内容进行处理。利用字符串构成成的数据结构,来完成对文本内容的匹配。 经常可以看到正则表达式的句子里包含了一些\d、\w和()之类的符号,这些特殊格式的符号可以看做正则结构中的元素,这些符号也成之为元字符,下面介绍下这些元字符的作用。
1123 0