第二章 正则表达式
1. 学习目标
- 掌握正则表达式的作用
- 掌握正则表达式的语法
- 了解常见的正则表达式
2. 内容讲解
2.1 正则表达式的概念
正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。用我们自己的话来说: 正则表达式用来校验字符串是否满足一定的规则的公式
2.2 正则表达式的用途
所以正则表达式有三个主要用途:
- 模式验证: 检测某个字符串是否符合规则,例如检测手机号、身份证号等等是否符合规范
- 匹配读取: 将目标字符串中满足规则的部分读取出来,例如将整段文本中的邮箱地址读取出来
- 匹配替换: 将目标字符串中满足标准的部分替换为其他字符串,例如将整段文本中的"hello"替换成"haha"
2.3 正则表达式的语法
2.3.1 创建正则表达式对象
- 对象形式:
var reg = new RegExp("正则表达式")
当正则表达式中有"/"那么就使用这种 - 直接量形式:
var reg = /正则表达式/
一般使用这种声明方式
2.3.2 正则表达式入门案例
2.3.2.1 模式验证: 校验字符串中是否包含’o’字母
注意:这里是使用正则表达式对象来调用方法。
// 创建一个最简单的正则表达式对象 var reg = /o/; // 创建一个字符串对象作为目标字符串 var str = 'Hello World!'; // 调用正则表达式对象的test()方法验证目标字符串是否满足我们指定的这个模式,返回结果true console.log("字符串中是否包含'o'="+reg.test(str));
2.3.2.2 匹配读取: 读取字符串中的所有’o’
//匹配读取: 读取一个字符串中的所有'l'字母 // g表示全文查找,如果不使用g那么就只能查找到第一个匹配的内容 //1. 编写一个正则表达式 var reg2 = /l/g //2. 使用正则表达式去读取字符串 var arr = str.match(reg2); console.log(arr)
2.3.2.3 匹配替换: 将字符串中的第一个’o’替换成’@’
var newStr = str.replace(reg,'@'); // 只有第一个o被替换了,说明我们这个正则表达式只能匹配第一个满足的字符串 console.log("str.replace(reg)="+newStr);//Hell@ World! // 原字符串并没有变化,只是返回了一个新字符串 console.log("str="+str);//str=Hello World!
2.3.3 正则表达式的匹配模式
2.3.3.1 全文查找
如果不使用g对正则表达式对象进行修饰,则使用正则表达式进行查找时,仅返回第一个匹配;使用g后,返回所有匹配。
// 目标字符串 var targetStr = 'Hello World!'; // 没有使用全局匹配的正则表达式 var reg = /[A-Z]/; // 获取全部匹配 var resultArr = targetStr.match(reg); // 数组长度为1 console.log("resultArr.length="+resultArr.length); // 遍历数组,发现只能得到'H' for(var i = 0; i < resultArr.length; i++){ console.log("resultArr["+i+"]="+resultArr[i]); }
对比代码:
// 目标字符串 var targetStr = 'Hello World!'; // 使用了全局匹配的正则表达式 var reg = /[A-Z]/g; // 获取全部匹配 var resultArr = targetStr.match(reg); // 数组长度为2 console.log("resultArr.length="+resultArr.length); // 遍历数组,发现可以获取到“H”和“W” for(var i = 0; i < resultArr.length; i++){ console.log("resultArr["+i+"]="+resultArr[i]); }
2.3.3.2 忽略大小写
//目标字符串 var targetStr = 'Hello WORLD!'; //没有使用忽略大小写的正则表达式 var reg = /o/g; //获取全部匹配 var resultArr = targetStr.match(reg); //数组长度为1 console.log("resultArr.length="+resultArr.length); //遍历数组,仅得到'o' for(var i = 0; i < resultArr.length; i++){ console.log("resultArr["+i+"]="+resultArr[i]); }
对比代码:
//目标字符串 var targetStr = 'Hello WORLD!'; //使用了忽略大小写的正则表达式 var reg = /o/gi; //获取全部匹配 var resultArr = targetStr.match(reg); //数组长度为2 console.log("resultArr.length="+resultArr.length); //遍历数组,得到'o'和'O' for(var i = 0; i < resultArr.length; i++){ console.log("resultArr["+i+"]="+resultArr[i]); }
2.3.3.3 多行查找
不使用多行查找模式,目标字符串中不管有没有换行符都会被当作一行。
//目标字符串1 var targetStr01 = 'Hello\nWorld!'; //目标字符串2 var targetStr02 = 'Hello'; //匹配以'Hello'结尾的正则表达式,没有使用多行匹配 var reg = /Hello$/; console.log(reg.test(targetStr01));//false console.log(reg.test(targetStr02));//true
对比代码:
//目标字符串1 var targetStr01 = 'Hello\nWorld!'; //目标字符串2 var targetStr02 = 'Hello'; //匹配以'Hello'结尾的正则表达式,使用了多行匹配 var reg = /Hello$/m; console.log(reg.test(targetStr01));//true console.log(reg.test(targetStr02));//true
2.3.4 元字符
在正则表达式中被赋予特殊含义的字符,不能被直接当做普通字符使用。如果要匹配元字符本身,需要对元字符进行转义,转义的方式是在元字符前面加上“\”,例如:^
2.3.4.1 常用的元字符
代码 | 说明 |
. | 匹配除换行字符以外的任意字符。 |
\w | 匹配字母或数字或下划线等价于[a-zA-Z0-9_] |
\W | 匹配任何非单词字符。等价于A-Za-z0-9_ |
\s | 匹配任意的空白符,包括空格、制表符、换页符等等。等价于[\f\n\r\t\v]。 |
\S | 匹配任何非空白字符。等价于\f\n\r\t\v。 |
\d | 匹配数字。等价于[0-9]。 |
\D | 匹配一个非数字字符。等价于0-9 |
\b | 匹配单词的开始或结束 |
^ | 匹配字符串的开始,但在[]中使用表示取反 |
$ | 匹配字符串的结束 |
2.3.4.2 例子一
var str = 'one two three four'; // 匹配全部空格 var reg = /\s/g; // 将空格替换为@ var newStr = str.replace(reg,'@'); // one@two@three@four console.log("newStr="+newStr);
2.3.4.3 例子二
var str = '今年是2014年'; // 匹配至少一个数字 var reg = /\d+/g; str = str.replace(reg,'abcd'); console.log('str='+str); // 今年是abcd年
2.3.4.4 例子三
var str01 = 'I love Java'; var str02 = 'Java love me'; // 匹配以Java开头 var reg = /^Java/g; console.log('reg.test(str01)='+reg.test(str01)); // flase console.log("<br />"); console.log('reg.test(str02)='+reg.test(str02)); // true
2.3.4.5 例子四
var str01 = 'I love Java'; var str02 = 'Java love me'; // 匹配以Java结尾 var reg = /Java$/g; console.log('reg.test(str01)='+reg.test(str01)); // true console.log("<br />"); console.log('reg.test(str02)='+reg.test(str02)); // flase
2.3.5 字符集合
语法格式 | 示例 | 说明 |
[字符列表] | 正则表达式:[abc] 含义:目标字符串包含abc中的任何一个字符 目标字符串:plain 是否匹配:是 原因:plain中的“a”在列表“abc”中 | 目标字符串中任何一个字符出现在字符列表中就算匹配。 |
[^字符列表] | [^abc] 含义:目标字符串包含abc以外的任何一个字符 目标字符串:plain 是否匹配:是 原因:plain中包含“p”、“l”、“i”、“n” | 匹配字符列表中未包含的任意字符。 |
[字符范围] | 正则表达式:[a-z] 含义:所有小写英文字符组成的字符列表 正则表达式:[A-Z] 含义:所有大写英文字符组成的字符列表 | 匹配指定范围内的任意字符。 |
var str01 = 'Hello World'; var str02 = 'I am Tom'; //匹配abc中的任何一个 var reg = /[abc]/g; console.log('reg.test(str01)='+reg.test(str01));//flase console.log('reg.test(str02)='+reg.test(str02));//true
2.3.6 出现次数
代码 | 说明 |
* | 出现零次或多次 |
+ | 出现一次或多次 |
? | 出现零次或一次 |
{n} | 出现n次 |
{n,} | 出现n次或多次 |
{n,m} | 出现n到m次 |
console.log("/[a]{3}/.test('aa')="+/[a]{3}/g.test('aa')); // flase console.log("/[a]{3}/.test('aaa')="+/[a]{3}/g.test('aaa')); // true console.log("/[a]{3}/.test('aaaa')="+/[a]{3}/g.test('aaaa')); // true
2.3.7 在正则表达式中表达『或者』
使用符号:|
// 目标字符串 var str01 = 'Hello World!'; var str02 = 'I love Java'; // 匹配'World'或'Java' var reg = /World|Java/g; console.log("str01.match(reg)[0]="+str01.match(reg)[0]);//World console.log("str02.match(reg)[0]="+str02.match(reg)[0]);//Java