1.捕获分组
常用分组:
程序实例,编号分组获取:
Pattern pattern = Pattern.compile("(\\d\\d)(\\d\\d)"); Matcher matcher = pattern.matcher("7788 abc7765"); while (matcher.find()) { System.out.println("找到:" + matcher.group(0)); System.out.println("找到分组1:" + matcher.group(1)); System.out.println("找到分组2:" + matcher.group(2)); } ------------------------------- 输出: 找到:7788 找到分组1:77 找到分组2:88 找到:7765 找到分组1:77 找到分组2:65
程序实例,命名分组获取:
// 命名分组 Pattern pattern2 = Pattern.compile("(?<g1>\\d\\d)(?<g2>\\d\\d)"); Matcher matcher2 = pattern2.matcher("7788 abc7765"); while (matcher2.find()) { System.out.println("找到:" + matcher2.group(0)); System.out.println("找到分组1:" + matcher2.group("g1")); System.out.println("找到分组2:" + matcher2.group("g2")); }
2.非捕获分组
常用非捕获分组:
3.非贪婪匹配
?
当此字符紧随任何其他限定符(*、+、?、{n}、{n,}、{n,m})之后时,匹配模式是"非贪心的"。"非贪心的"模式匹配搜索到的、尽可能短的字符串,而默认的"贪心的"模式匹配搜索到的、尽可能长的字符串。
例如,在字符串"oooo"中,"o+?“只匹配单个"o”,而"o+“匹配所有"o”。
4.正则表达式应用实例
四个简单的案例:
import org.junit.jupiter.api.Test; import java.util.regex.Matcher; import java.util.regex.Pattern; /** * 正则表达式实例 */ public class RegularExpressionExample { /** * 验证字符串是不是纯汉字 */ @Test public void isChinese() { String str = "大河之犬"; String regex = "^[\u0391-\uffe5]+$"; Pattern pattern = Pattern.compile(regex); Matcher matcher = pattern.matcher(str); if (matcher.find()) { System.out.println("格式满足!"); } else { System.out.println("格式不满足!"); } } /** * 验证邮政编码 * 1-9开头的六位数 */ @Test public void isZipCode() { String str = "123450"; String regex = "^[1-9]\\d{5}$"; Pattern pattern = Pattern.compile(regex); Matcher matcher = pattern.matcher(str); if (matcher.find()) { System.out.println("格式满足!"); } else { System.out.println("格式不满足!"); } } /** * 验证QQ号 * 1-9开头的5-10位纯数字 */ @Test public void isQQ() { String str = "256789087"; String regex = "^[1-9]\\d{4,9}$"; Pattern pattern = Pattern.compile(regex); Matcher matcher = pattern.matcher(str); if (matcher.find()) { System.out.println("格式满足!"); } else { System.out.println("格式不满足!"); } } /** * 验证手机号码 * 以13,14,15,18开头的到11位数 */ @Test public void isPhoneNumber() { String str = "13245678901"; String regex = "^1[3|4|5|8]\\d{9}$"; Pattern pattern = Pattern.compile(regex); Matcher matcher = pattern.matcher(str); if (matcher.find()) { System.out.println("格式满足!"); } else { System.out.println("格式不满足!"); } } } ------------------------ 输出都为格式满足!
正则验证复杂URL:👳♀️
/** * 验证是否为合法的URL * 思路: * 1.URL开头部分:https://或者http:// * 2.通过([\w-]+\.)+[\w-]+$匹配https://blog.csdn.net部分 * 3.匹配其余部分 */ @Test public void isUrl() { String str = "https://blog.csdn.net/Gherbirthday0916?spm=1010.2135.3001.5343"; String regex = "^((http|https)://)([\\w-]+\\.)+[\\w-]+(\\/[\\w-?=&/%.#]+)?$"; Pattern pattern = Pattern.compile(regex); Matcher matcher = pattern.matcher(str); if (matcher.find()) { System.out.println("格式满足!"); } else { System.out.println("格式不满足!"); } }
5.Pattern类
matches方法
在验证输入的字符串是否满足条件使用,只是验证是否满足规范🎈
/** * 验证matches方法,用于整体匹配 * 在验证输入的字符串是否满足条件使用 */ @Test public void matchesTest() { String str = "大河之犬"; String regex = "^[\u0391-\uffe5]+$"; boolean matches = Pattern.matches(regex, str); System.out.println(matches); } ------------------------ 输出:true
6.Matcher类
常用方法使用案例:
import java.util.regex.Matcher; import java.util.regex.Pattern; /** * Matcher类演示 */ public class MatcherTest { public static void main(String[] args) { String content = "Go的语法接近C语言,但对于变量的声明有所不同。Go支持垃圾回收功能" + "。Go的并行模型是以东尼·霍尔的通信顺序进程(CSP)为基础,采取类似模型的" + "其他语言包括Occam和Limbo,但它也具有Pi运算的特征,比如通道传输。在" + "1.8版本中开放插件(Plugin)的支持,这意味着现在能从Go中动态加载部分" + "函数。\n" + "与C++相比,Go并不包括如枚举、异常处理、继承、泛型、断言、虚函数等功" + "能,但增加了 切片(Slice) 型、并发、管道、垃圾回收、接口" + "(Interface)等特性的语言级支持。Go 2.0版本将支持泛型,对于断言的" + "存在,则持负面态度,同时也为自己不提供类型继承来辩护。\n" + "不同于Java,Go内嵌了关联数组(也称为哈希表(Hashes)或字典" + "(Dictionaries) ),就像字符串类型一样。aaaaaa11c8abcABCaBc"; // 匹配Go Pattern pattern = Pattern.compile("Go"); Matcher matcher = pattern.matcher(content); while (matcher.find()) { // 找到每一个匹配的开始索引 System.out.println(matcher.start()); // 找到每一个匹配的结束索引 System.out.println(matcher.end()); System.out.println("============================"); } // 整体匹配方法,去检验某个字符串是否满足某个规则 System.out.println(matcher.matches()); // 替换所有的Go为Golang String res = matcher.replaceAll("Golang"); System.out.println(res); } }
7.反向引用
反向引用非常方便,因为它允许重复一个模式(pattern),无需再重写一遍。我们可以使用\#(#是组号)来引用前面已定义的组。比如一个文本以abc开始,接着为xyz,紧跟着abc,对应的正则表达式可以为“abcxyzabc”,也可以使用反向引用重写正则表达式,“(abc)xyz\1”,\1表示第一组(abc)。\2表示第二组,\3表示第三组,以此类推。
小例子:
匹配两个连续的相同数字:
(\\d)\\1
匹配五个连续的相同数字:
(\\d)\\1{4}
匹配个位与千位相同,十位与百位相同的数组:
(\\d)(\\d)\\2\\1
反向引用之结巴去重案例:
import java.util.regex.Matcher; import java.util.regex.Pattern; /** * 结巴去重案例 * 将结巴的语句恢复为正常的语句 */ public class Stuttering { public static void main(String[] args) { String content = "我...要要...学学学学......java"; // 去掉. Pattern pattern = Pattern.compile("\\."); Matcher matcher = pattern.matcher(content); // 将所有的.替换为空 content = matcher.replaceAll(""); // 去掉重读的字 pattern = Pattern.compile("(.)\\1+"); matcher = pattern.matcher(content); content = matcher.replaceAll("$1"); System.out.println(content); } } ------------------------------ 输出: 我要学java