前言
在项目开发中,很多需要检查一个字符串是否含有另一个字符串,将一个字符串中的某一部分进行替换,或者取出其中的一部分字符串,有时候这个字符串并不是固定的,那么这时候就可以使用正则表达式来进行一个匹配。
一、使用场景
(1)校验:在进行表单提交时,会进行许多校验,如手机号检验,密码格式检验等等
(2)查找:从大量信息中,找出所需要的信息
(3)替换:以指定的格式查找内容,然后进行替换
二、使用说明
(1)普通字符
[^AC] | 匹配除了A C之外其他的内容 |
[ADH] | 匹配A D H这几个字母 |
[A-Z] | 匹配所有的大写字母,a-z则是所有的小写字母 |
\w | 匹配字母、数字、下划线。等价于 [A-Za-z0-9_] |
示例:/^[A-Z]/ 表示以大写字母开头的字符串
/^[0-9](.*)[a-z]$/ 表示以数字开头,以小写字母结尾的字符串
(2)特殊字符
$ | 匹配字符串的结尾 |
() | 一个子表达式的开始和结束位置,如/([0-9])(a-z)/ |
* | 匹配前方子表达式零次或多次,如/1-9*/就是匹配一个正整数 |
+ | 匹配前方子表达式一次或多次 |
. | 匹配除换行符 \n 之外的任何单字符 |
? | 匹配前方子表达式零次或一次 |
^ | 匹配输入字符串的开始位置,在中括号中则是不匹配中括号中的字母 |
{ | 标记限定符表达式的开始 |
\ | 指明两项之间的一个选择 |
示例:匹配一个9位数的数字/^[1-9][0-9]{8}$/,{8}表示匹配8次,{8,}表示匹配至少8次,{4,8}表示匹配最少4次,最多8次
(3)转义字符
\cx | 匹配由x指明的控制字符。例如, \cM 匹配一个 Control-M 或回车符。x 的值必须为 A-Z 或 a-z 之一。否则,将 c 视为一个原义的 'c' 字符 |
\n | 匹配一个换行符 |
\r | 匹配一个回车符 |
\f | 匹配一个换页符 |
\s | 匹配任何空白字符,包括空格、制表符、换页符等等 |
\S | 匹配任何非空白字符 |
\t | 匹配一个制表符 |
\v | 匹配一个垂直制表符 |
(4)非捕获单元
?=:exp1(?=exp2) 查找exp2前面的exp1
?<=:(?<=exp2)exp1 查找exp2后面的exp1
?!:exp1(?!exp2) 查找后面不是exp2的exp1
?< !:(?< !exp2)exp1 查找前面不是exp2的exp1
三、使用简介
(1)在Java中有时候需要通过特定的条件对字符串进行一个截取,但是split方法有时候是不太方便的,对于一些复杂的截取,还是需要通过正则表达式来进行截取。
截取左括号之后的内容:
"aaa(ddd".split("(")这语句是无法实现想要的功能,那么这时候就需要使用正则表达式了
Pattern pattern = Pattern.compile(".*(?=\\()")
Matcher matcher = pattern.matcher("aaa(ddd");
if(matcher.find()){
System.out.println(matcher.group());
}
这段代码就可以实现所需要功能。
(2)在进行注册功能时,经常会对密码进行格式校验,现在就来以必须使用数字大小下字母一起来组成密码举个例子:
Pattern pattern = Pattern.compile("^(?![0-9]+$)(?![a-zA-Z]+$)[0-9A-Za-z]{7,15}$");
Matcher matcher = pattern.matcher("fasda66FF");
上方这个表达式就能达成所需要的效果。
(?![0-9]+$):?!是一个反向预查,就是在字符串结束前,字符串不能由纯数字组成
(?![a-zA-Z_]+$):这个表达式则是判断字符串不能又纯字母组成
[0-9A-Za-z]{7,15}:字符串由字母数字组成,长度为七到十五
(3)有时候也会对手机号来进行一个校验,下面就对手机号的校验来进行一下说明:
首先,我们要对手机号的格式来进行一个了解,手机号都是从1开始的,第二位则为3到9的数字,其他无限制的一个11位的纯数字结构。
Pattern pattern = Pattern.compile("^[1]([3-9])[0-9]{9}$");
Matcher matcher = pattern.matcher("13596325369");
上方这个表达式,就能完成这个校验。
^[1]:表示字符串以1开始
([3-9]):表示第二位为3到9
[0-9]{9}:表示一个9位的纯数字
这样叠加起来,便能完成一个手机号的校验