java正则表达式进阶

2022-12-08 333

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 当此字符紧随任何其他限定符（*、+、?、{n}、{n,}、{n,m}）之后时，匹配模式是"非贪心的"。"非贪心的"模式匹配搜索到的、尽可能短的字符串，而默认的"贪心的"模式匹配搜索到的、尽可能长的字符串。例如，在字符串"oooo"中，"o+?“只匹配单个"o”，而"o+“匹配所有"o”。

1.捕获分组

常用分组：

程序实例，编号分组获取：

Pattern pattern = Pattern.compile("(\\d\\d)(\\d\\d)");
Matcher matcher = pattern.matcher("7788 abc7765");
while (matcher.find()) {
    System.out.println("找到：" + matcher.group(0));
    System.out.println("找到分组1：" + matcher.group(1));
    System.out.println("找到分组2：" + matcher.group(2));
}
-------------------------------
输出：
找到：7788
找到分组1：77
找到分组2：88
找到：7765
找到分组1：77
找到分组2：65

程序实例，命名分组获取：

// 命名分组
Pattern pattern2 = Pattern.compile("(?<g1>\\d\\d)(?<g2>\\d\\d)");
Matcher matcher2 = pattern2.matcher("7788 abc7765");
while (matcher2.find()) {
    System.out.println("找到：" + matcher2.group(0));
    System.out.println("找到分组1：" + matcher2.group("g1"));
    System.out.println("找到分组2：" + matcher2.group("g2"));
}

2.非捕获分组

常用非捕获分组：

3.非贪婪匹配

当此字符紧随任何其他限定符（*、+、?、{n}、{n,}、{n,m}）之后时，匹配模式是"非贪心的"。"非贪心的"模式匹配搜索到的、尽可能短的字符串，而默认的"贪心的"模式匹配搜索到的、尽可能长的字符串。

例如，在字符串"oooo"中，"o+?“只匹配单个"o”，而"o+“匹配所有"o”。

4.正则表达式应用实例

四个简单的案例：

import org.junit.jupiter.api.Test;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
/**
 * 正则表达式实例
 */
public class RegularExpressionExample {
    /**
     * 验证字符串是不是纯汉字
     */
    @Test
    public void isChinese() {
        String str = "大河之犬";
        String regex = "^[\u0391-\uffe5]+$";
        Pattern pattern = Pattern.compile(regex);
        Matcher matcher = pattern.matcher(str);
        if (matcher.find()) {
            System.out.println("格式满足！");
        } else {
            System.out.println("格式不满足！");
        }
    }
    /**
     * 验证邮政编码
     * 1-9开头的六位数
     */
    @Test
    public void isZipCode() {
        String str = "123450";
        String regex = "^[1-9]\\d{5}$";
        Pattern pattern = Pattern.compile(regex);
        Matcher matcher = pattern.matcher(str);
        if (matcher.find()) {
            System.out.println("格式满足！");
        } else {
            System.out.println("格式不满足！");
        }
    }
    /**
     * 验证QQ号
     * 1-9开头的5-10位纯数字
     */
    @Test
    public void isQQ() {
        String str = "256789087";
        String regex = "^[1-9]\\d{4,9}$";
        Pattern pattern = Pattern.compile(regex);
        Matcher matcher = pattern.matcher(str);
        if (matcher.find()) {
            System.out.println("格式满足！");
        } else {
            System.out.println("格式不满足！");
        }
    }
    /**
     * 验证手机号码
     * 以13，14，15，18开头的到11位数
     */
    @Test
    public void isPhoneNumber() {
        String str = "13245678901";
        String regex = "^1[3|4|5|8]\\d{9}$";
        Pattern pattern = Pattern.compile(regex);
        Matcher matcher = pattern.matcher(str);
        if (matcher.find()) {
            System.out.println("格式满足！");
        } else {
            System.out.println("格式不满足！");
        }
    }
}
------------------------
输出都为格式满足！

正则验证复杂URL：👳‍♀️

/**
 * 验证是否为合法的URL
 * 思路：
 * 1.URL开头部分：https://或者http://
 * 2.通过([\w-]+\.)+[\w-]+$匹配https://blog.csdn.net部分
 * 3.匹配其余部分
 */
@Test
public void isUrl() {
    String str = "https://blog.csdn.net/Gherbirthday0916?spm=1010.2135.3001.5343";
    String regex = "^((http|https)://)([\\w-]+\\.)+[\\w-]+(\\/[\\w-?=&/%.#]+)?$";
    Pattern pattern = Pattern.compile(regex);
    Matcher matcher = pattern.matcher(str);
    if (matcher.find()) {
        System.out.println("格式满足！");
    } else {
        System.out.println("格式不满足！");
    }
}

5.Pattern类

matches方法

在验证输入的字符串是否满足条件使用，只是验证是否满足规范🎈

/**
 * 验证matches方法，用于整体匹配
 * 在验证输入的字符串是否满足条件使用
 */
@Test
public void matchesTest() {
    String str = "大河之犬";
    String regex = "^[\u0391-\uffe5]+$";
    boolean matches = Pattern.matches(regex, str);
    System.out.println(matches);
}
------------------------
输出：true

6.Matcher类

常用方法使用案例：

import java.util.regex.Matcher;
import java.util.regex.Pattern;
/**
 * Matcher类演示
 */
public class MatcherTest {
    public static void main(String[] args) {
        String content = "Go的语法接近C语言，但对于变量的声明有所不同。Go支持垃圾回收功能" +
                "。Go的并行模型是以东尼·霍尔的通信顺序进程（CSP）为基础，采取类似模型的" +
                "其他语言包括Occam和Limbo，但它也具有Pi运算的特征，比如通道传输。在" +
                "1.8版本中开放插件（Plugin）的支持，这意味着现在能从Go中动态加载部分" +
                "函数。\n" +
                "与C++相比，Go并不包括如枚举、异常处理、继承、泛型、断言、虚函数等功" +
                "能，但增加了 切片(Slice) 型、并发、管道、垃圾回收、接口" +
                "（Interface）等特性的语言级支持。Go 2.0版本将支持泛型，对于断言的" +
                "存在，则持负面态度，同时也为自己不提供类型继承来辩护。\n" +
                "不同于Java，Go内嵌了关联数组（也称为哈希表(Hashes)或字典" +
                "(Dictionaries) ），就像字符串类型一样。aaaaaa11c8abcABCaBc";
        // 匹配Go
        Pattern pattern = Pattern.compile("Go");
        Matcher matcher = pattern.matcher(content);
        while (matcher.find()) {
            // 找到每一个匹配的开始索引
            System.out.println(matcher.start());
            // 找到每一个匹配的结束索引
            System.out.println(matcher.end());
            System.out.println("============================");
        }
        // 整体匹配方法，去检验某个字符串是否满足某个规则
        System.out.println(matcher.matches());
        // 替换所有的Go为Golang
        String res = matcher.replaceAll("Golang");
        System.out.println(res);
    }
}

7.反向引用

反向引用非常方便，因为它允许重复一个模式（pattern），无需再重写一遍。我们可以使用\#（#是组号）来引用前面已定义的组。比如一个文本以abc开始，接着为xyz，紧跟着abc，对应的正则表达式可以为“abcxyzabc”，也可以使用反向引用重写正则表达式，“(abc)xyz\1”，\1表示第一组（abc）。\2表示第二组，\3表示第三组，以此类推。

小例子：

匹配两个连续的相同数字：

(\\d)\\1

匹配五个连续的相同数字：

(\\d)\\1{4}

匹配个位与千位相同，十位与百位相同的数组：

(\\d)(\\d)\\2\\1

反向引用之结巴去重案例：

import java.util.regex.Matcher;
import java.util.regex.Pattern;
/**
 * 结巴去重案例
 * 将结巴的语句恢复为正常的语句
 */
public class Stuttering {
    public static void main(String[] args) {
        String content = "我...要要...学学学学......java";
        // 去掉.
        Pattern pattern = Pattern.compile("\\.");
        Matcher matcher = pattern.matcher(content);
        // 将所有的.替换为空
        content = matcher.replaceAll("");
        // 去掉重读的字
        pattern = Pattern.compile("(.)\\1+");
        matcher = pattern.matcher(content);
        content = matcher.replaceAll("$1");
        System.out.println(content);
    }
}
------------------------------
输出：
我要学java

java正则表达式进阶

1.捕获分组

2.非捕获分组

3.非贪婪匹配

4.正则表达式应用实例

5.Pattern类

6.Matcher类

7.反向引用

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

java正则表达式进阶

1.捕获分组

2.非捕获分组

3.非贪婪匹配

4.正则表达式应用实例

5.Pattern类

6.Matcher类

7.反向引用

热门文章

最新文章

相关课程

相关电子书