正则表达式完整指南(上)https://developer.aliyun.com/article/1410941
四、修饰符
正则表达式常见的修饰符如下:
g
:表示全局模式,即运用于所有字符串;i
:表示不区分大小写,即匹配时忽略字符串的大小写;m
:表示多行模式,强制 $ 和 ^ 分别匹配每个换行符。
这些修饰符总是用在最后一个正斜杠后面,可以一起使用。下面来分别看看这些修饰符的作用。
最开始的例子中,字符串中有两个“处”,但是只匹配到了一个。这是因为正则表达式默认匹配第一个符合条件的字符。如果想要匹配所有符合条件的字符,就可以使用 g
修饰符:
javascript
复制代码
/处/g
这样就匹配到了所有符合条件的字符:
当需要匹配引英文字符串,并且忽略字符串的字母大小写时,i
修饰符就派上用场了。先来看下面的表达式:
javascript
复制代码
/a/g
在进行匹配时,它匹配到了字符串中所有的 a
字符。但是最开始的 A
是没匹配到的,因为两者大小写不一致:
那我们来添加上 i
修饰符:
javascript
复制代码
/a/gi
这时所有的 a
都被匹配到了,无论是大写还是小写,总共匹配到了三个 a
:
还有一个小疑问, 如果是对象构造函数的方式来构造正则表达式使,如何添加这些修饰符呢?其实很简单,只要将修饰符作为第二个参数传递给 构造函数就可以了:
let regExp = new RegExp('[2b|^2b]', 'gi') console.log(regExp) // 输出结果:/[2b|^2b]/gi
五、RegExp 实例
1. 实例方法
RegExp 实例置了test()
和exec()
这两个方法来校验正则表达式。下面来分别看一下这两个方法。
(1)test()test()
用于检测一个字符串是否匹配某个模式,如果字符串中含有匹配的文本,则返回 true,否则返回 false。
const regex1 = /a/ig; const regex2 = /hello/ig; const str = "Action speak louder than words"; console.log(regex1.test(str)); // true console.log(regex2.test(str)); // false
(2)exec()exec()
用于检索字符串中的正则表达式的匹配。该函数返回一个数组,其中存放匹配的结果。如果未找到匹配,则返回值为 null。
const regex1 = /a/ig; const regex2 = /hello/ig; const str = "Action speak louder than words"; console.log(regex1.exec(str)); // ['A', index: 0, input: 'Action speak louder than words', groups: undefined] console.log(regex2.exec(str)); // null
在当在全局正则表达式中使用 exec
时,每隔一次就会返回null
,如图:
这是怎么回事呢?MDN 的解释如下:
在设置了 global 或 sticky 标志位的情况下(如 /foo/g or /foo/y),JavaScript RegExp 对象是有状态的。他们会将上次成功匹配后的位置记录在 lastIndex 属性中。使用此特性,exec() 可用来对单个字符串中的多次匹配结果进行逐条的遍历(包括捕获到的匹配),而相比之下, String.prototype.match() 只会返回匹配到的结果。
为了解决这个问题,我们可以在运行每个exec命令之前将lastIndex
赋值为 0:
2. 实例属性
RegExp实例还内置了一些属性,这些属性可以获知一个正则表达式的各方面的信息,但是用处不大。
属性 | 描述 |
global | 布尔值,表示是否设置了g标志 |
ignoreCase | 布尔值,表示是否设置了i标志 |
lastIndex | 整数,表示开始搜索下一个匹配项的字符位置,从0算起 |
multiline | 布尔值,表示是否设置了m标志 |
source | 正则表达式的字符串表示,按照字面量形式而非传入构造函数重大的字符串模式匹配 |
六、字符串方法
在 JavaScript 中有6种常用的方法是支持正则表达式的,下面来分别看看这些方法。
1. search()
search()
方法用于检索字符串中指定的子字符串,或检索与正则表达式相匹配的子字符串,并返回子串的起始位置。如果没有找到任何匹配的子串,则返回 -1。
const regex1 = /a/ig; const regex2 = /p/ig; const regex3 = /m/ig; const str = "Action speak louder than words"; console.log(str.search(regex1)); // 输出结果:0 console.log(str.search(regex2)); // 输出结果:8 console.log(str.search(regex3)); // 输出结果:-1
可以看到,search()
方法只会返回匹配到的第一个字符的索引值,当没有匹配到相应的值时,就会返回-1。
2. match()
match()
方法可在字符串内检索指定的值,或找到一个或多个正则表达式的匹配。如果没有找到任何匹配的文本, match()
将返回 null
。否则,它将返回一个数组,其中存放了与它找到的匹配文本有关的信息。
const regex1 = /a/ig; const regex2 = /a/i; const regex3 = /m/ig; const str = "Action speak louder than words"; console.log(str.match(regex1)); // 输出结果:['A', 'a', 'a'] console.log(str.match(regex2)); // 输出结果:['A', index: 0, input: 'Action speak louder than words', groups: undefined] console.log(str.match(regex3)); // 输出结果:null
可以看到,当没有 g
修饰符时,就只能在字符串中执行一次匹配,如果想要匹配所有符合条件的值,就需要添加 g
修饰符。
3. matchAll()
matchAll()
方法返回一个包含所有匹配正则表达式的结果及分组捕获组的迭代器。因为返回的是遍历器,所以通常使用for...of
循环取出。
for (const match of 'abcabc'.matchAll(/a/g)) { console.log(match) } //["a", index: 0, input: "abcabc", groups: undefined] //["a", index: 3, input: "abcabc", groups: undefined]
需要注意,该方法的第一个参数是一个正则表达式对象,如果传的参数不是一个正则表达式对象,则会隐式地使用 new RegExp(obj)
将其转换为一个 RegExp
。另外,RegExp必须是设置了全局模式g
的形式,否则会抛出异常 TypeError
。
4. replace()
const regex = /A/g; const str = "Action speak louder than words"; console.log(str.replace(regex, 'a')); // 输出结果:action speak louder than words
可以看到,第一个参数中的正则表达式匹配到了字符串的第一个大写的 A,并将其替换为了第二个参数中的小写的 a。
5. replaceAll()
replaceAll()
方法用于在字符串中用一些字符替换另一些字符,或替换一个与正则表达式匹配的子串,该函数会替换所有匹配到的子字符串。
const regex = /a/g; const str = "Action speak louder than words"; console.log(str.replaceAll(regex, 'A')); // 输出结果:Action speAk louder thAn words
需要注意,当使用一个 regex
时,您必须设置全局("g")标志, 否则,它将引发 TypeError
:"必须使用全局 RegExp 调用 replaceAll"。
6. split()
split()
方法用于把一个字符串分割成字符串数组。其第一个参数是一个字符串或正则表达式,从该参数指定的地方分割字符串。
const regex = / /gi; const str = "Action speak louder than words"; console.log(str.split(regex)); // 输出结果:['Action', 'speak', 'louder', 'than', 'words']
这里的 regex
用来匹配空字符串,所以最终在字符串的每个空格处将字符串拆成了数组。
七、实际应用
下面来通过正则表达式的几个实际应用来巩固一下上面的知识。
1. 匹配密码
检查密码的格式,其包含至少一个大写字母、小写字母、数字、符号,长度为8-12位:
/^(?=.*[a-z])(?=.*[A-Z])(?=.*\d)(?=.*\W).{8,12}$/g
这里我们主要使用了正则表达式中的正向前瞻,正向前瞻语法为(?=pattern)
,即在目标字符串的相应位置必须有pattern
部分匹配的内容,但不作为匹配结果处理,更不会存储在缓冲区内供以后使用。来看一下这个正则表达式的每一部分的含义:
(?=.*[a-z])
:匹配任何后面跟着小写字母的字符;(?=.*[A-Z])
:匹配任何后面跟着大写字母的字符;(?=.*\d)
:匹配任何后面跟着数字的字符;(?=.*\W)
:匹配任何后面跟着符号的字符;.{8,12}
:匹配的长度至少为 8 个字符,至多为12个字符。^
和$
可以保证匹配从字符串的开头到结尾进行匹配,也就是只对整个密码进行匹配,不考虑部分匹配。
下面是测试结果:
2. 匹配邮箱
检查电子邮箱的地址:
/^[a-zA-Z0-9.!#$%&'*+/=?^_`{|}~-]+@[a-zA-Z0-9-]+(?:\.[ a-zA-Z0-9-]+)*$/g
下面来看一下这个正则表达式每一部分的含义:
^[a-zA-Z0-9.!#$%&'*+/=?^_
{|}~-]+:检查是否使用了所有有效字符并且至少有了一个(末尾的
+`用于检查是否至少有一个字符);[a-zA-Z0-9-]+
:这一部分用来检验主机名是否有效,主机名可以是大小写字母、数字、中横线。最后的 + 表示至少有一位;(?:\.[a-zA-Z0-9-]+)*
:这一部分是可选的域名后缀,这里使用的*
就表示前面的字符是0个或者多个,这样.com、.com.cn等域名都可以匹配到;^
和$
可以保证匹配从字符串的开头到结尾进行匹配,也就是只对整个邮箱字符串进行匹配,不考虑部分匹配。
下面是测试结果:
3. 匹配数字
检查数字是否是整数:/^\d+$/
,其中\d+
表示至少有一位数字。测试结果如下:
检查数字是否是小数:/^\d*\.\d+$/
,其中\d*
表示至少有0位数字,\.
就是把小数点进行了转义操作,\d+
就表示至少有一位小数位。测试结果如下:
校验一个数字是不是一个金额:/^\d+(.\d{2})?$/
八、实用工具
1. Regex101
Regex101 是学习正则表达式最有效的工具网站之一。在REGULAR EXPRESSION栏中可以输入正则表达式,可以在输入框右侧选择需要的修饰符,在下面的TEST STRING栏中输入要测试的字符串,即可显示出匹配到的结果。在右侧的EXPLANATION区域会显示出对输入的正则表达式的详细解释。右下角的 QUICK REFERENCE 栏会显示正则表达式速查表。
Regex101 还支持在上面练习编写正则表达式:
可以在上面搜索一些正则表达式的库:
除此之外,我们还可以使用 RegexDebugger 来跟踪匹配的过程。更多功能可以在Regex101 上进行探索。
2. RegExr
RegExr 是一个基于 JavaScript 开发的在线工具,用来创建、测试和学习正则表达式。它是一个开源的工具,具有以下特性:
- 输入时,结果会实时更新;
- 支持 JavaScript 和 PHP/PCRE RegEx;
- 将匹配项或表达式移至详细信息;
- 保存并与他人共享表达式;
- 使用工具探索结果;
- 浏览参考以获取帮助和示例;
- 在编辑器中使用 cmd-Z/Y 撤消和重做。
官网:regexr.com/
3. Regex Pal
Regexpal 是一个基于 Javascript 的在线正则表达式验证工具。它的页面非常简洁,只有两个输入框,上面的输入框中可以输入正则表达式(匹配规则),下面的输入框可以输入待匹配的数据。此外,根据具体要求,还可以设置忽略大小写、多行匹配等参数。
4. Regex-Vis
Regex-Vis 是一个辅助学习、编写和验证正则的工具。它不仅能对正则进行可视化展示,而且提供可视编辑正则的能力。在输入一个正则表达式后,会生成它的可视化图形。然后可以点选或框选图形中的单个或多个节点,再在右侧操作面板对其进行操作,具体操作取决于节点的类型,比如在其右侧插入空节点、为节点编组、为节点增加量词等。
5. Regex previewer
Regex previewer 是一个 VScode 插件,在插件市场搜索名称即可安装。当我们在编写正则表达式时,可以直接使用快捷键 Ctrl+Alt+M (windows)或者 ⌥+⌘+M
(Mac)在编辑器右侧启动一个标签页,我们可以在这个标签页写一写测试用例,用来测试我们写的正则表达式,写完字符串用例之后,点击我们编写的正则表达式上方的 Test Regex...即可,这样右侧匹配到字符就会高亮显示了,如下图: