二十四、正则表达式的常见问题与练习
正则表达式是面试中经常被提及的主题之一,但很多人在面试中对于正则表达式的问题常常感到困惑。在本节中,我将通过一些常见问题和练习题目来帮助你更好地理解和掌握正则表达式的技巧。
问题一:JavaScript 中的字符串与正则表达式操作
- 在 JavaScript 中,我们可以使用三个方法来操作字符串和正则表达式:test、exec 和 match。下面是它们的具体用法及括号在这些方法中的作用。
- RegExp.prototype.test(): test 是 JavaScript 中正则表达式对象的一个方法,用于检测正则表达式对象与传入的字符串是否匹配。如果匹配,则返回 true,否则返回 false。使用方法如下:
regexObj.test(str);
示例:
/Jack/.test('ack'); // false
在 test 方法中,括号只起到分组的作用,例如:
/123{2}/.test('123123'); // false /(123){2}/.test('123123'); // true
- String.prototype.match(): match 是字符串的方法,它接受一个正则表达式作为参数,并返回字符串中与正则表达式匹配的结果。在 match 方法中,括号的作用有两个:
- 分组
- 捕获。捕获的意思是将用户指定的匹配到的子字符串暂存并返回给用户。
当传入的正则表达式没有使用 g 标志时,返回一个数组。数组的第一个值为第一个完整匹配,后续的值分别为括号捕获的所有值,并且数组还包含以下三个属性:
- groups:命名捕获组
- index:匹配结果的开始下标
- input:传入的原始字符串
示例:
const result1 = '123123'.match(/123{2}/); // nullconst result2 = '123123'.match(/(123){2}/); // ["123123", "123", index: 0, input: "123123", groups: undefined] console.log(result2.index); // 0 console.log(result2.input); // 123123 console.log(result2.groups); // undefined
当传入的正则表达式有 g 标志时,将返回所有与正则表达式匹配的结果,忽略捕获。
- RegExp.prototype.exec(): exec 是正则表达式的方法,它接受一个字符串作为参数,并返回与正则表达式匹配的结果。返回结果是一个数组,其中包含了匹配到的信息。在 exec 方法中,括号的作用同样是分组和捕获。
- 当传入的正则表达式没有使用 g 标志时,每次调用 exec 方法都会返回第一个匹配结果的信息数组,包括匹配的字符串、分组捕获的值以及其他属性。
示例:
const regex = /(\d+)([a-z])/;const str = '123a';let result; while ((result = regex.exec(str)) !== null) { console.log(result[0]); // 123a console.log(result[1]); // 123 console.log(result[2]); // a console.log(result.index); // 0 console.log(result.input); // 123a console.log(result.groups); // undefined regex.lastIndex = result.index + 1; // 设置下次匹配开始的位置}
当传入的正则表达式有 g 标志时,exec 方法将持续查找匹配的结果。
问题二:在正则表达式中匹配多个空格
有时候,我们希望匹配连续的多个空格,可以使用正则表达式中的特殊字符 \s。
示例:
const str = 'Hello World';const regex = /\s+/;const result = str.split(regex); console.log(result); // ["Hello", "World"]
在上述示例中,我们使用 \s+ 匹配连续的多个空格,并通过 split 方法将字符串分割成数组。结果中的多个空格被去除,只留下了单词。
问题三:在正则表达式中匹配邮箱地址
匹配邮箱地址是正则表达式中的一个常见需求。下面给出一个简单的匹配规则:
const regex = /^[A-Za-z0-9]+@[A-Za-z0-9]+\.[A-Za-z]{2,}$/;
这个正则表达式的意思是匹配由字母、数字组成的用户名,紧接着是一个 @ 符号,然后是由字母、数字组成的域名,最后是一个以两个或更多字母组成的顶级域名。
示例:
const email = 'example@example.com';const regex = /^[A-Za-z0-9]+@[A-Za-z0-9]+\.[A-Za-z]{2,}$/; console.log(regex.test(email)); // true
在上述示例中,我们使用 test 方法检测邮箱地址是否符合正则表达式的规则。
带你读《现代Javascript高级教程》二十四、正则表达式的常见问题与练习(2)https://developer.aliyun.com/article/1349515?groupCode=tech_library