java正则表达式进阶

简介: 当此字符紧随任何其他限定符(*、+、?、{n}、{n,}、{n,m})之后时,匹配模式是"非贪心的"。"非贪心的"模式匹配搜索到的、尽可能短的字符串,而默认的"贪心的"模式匹配搜索到的、尽可能长的字符串。例如,在字符串"oooo"中,"o+?“只匹配单个"o”,而"o+“匹配所有"o”。


1.捕获分组


常用分组:



程序实例,编号分组获取:


Pattern pattern = Pattern.compile("(\\d\\d)(\\d\\d)");
Matcher matcher = pattern.matcher("7788 abc7765");
while (matcher.find()) {
    System.out.println("找到:" + matcher.group(0));
    System.out.println("找到分组1:" + matcher.group(1));
    System.out.println("找到分组2:" + matcher.group(2));
}
-------------------------------
输出:
找到:7788
找到分组1:77
找到分组2:88
找到:7765
找到分组1:77
找到分组2:65


程序实例,命名分组获取:


// 命名分组
Pattern pattern2 = Pattern.compile("(?<g1>\\d\\d)(?<g2>\\d\\d)");
Matcher matcher2 = pattern2.matcher("7788 abc7765");
while (matcher2.find()) {
    System.out.println("找到:" + matcher2.group(0));
    System.out.println("找到分组1:" + matcher2.group("g1"));
    System.out.println("找到分组2:" + matcher2.group("g2"));
}


2.非捕获分组


常用非捕获分组:



3.非贪婪匹配


?


当此字符紧随任何其他限定符(*、+、?、{n}、{n,}、{n,m})之后时,匹配模式是"非贪心的"。"非贪心的"模式匹配搜索到的、尽可能短的字符串,而默认的"贪心的"模式匹配搜索到的、尽可能长的字符串。


例如,在字符串"oooo"中,"o+?“只匹配单个"o”,而"o+“匹配所有"o”。


4.正则表达式应用实例


四个简单的案例:


import org.junit.jupiter.api.Test;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
/**
 * 正则表达式实例
 */
public class RegularExpressionExample {
    /**
     * 验证字符串是不是纯汉字
     */
    @Test
    public void isChinese() {
        String str = "大河之犬";
        String regex = "^[\u0391-\uffe5]+$";
        Pattern pattern = Pattern.compile(regex);
        Matcher matcher = pattern.matcher(str);
        if (matcher.find()) {
            System.out.println("格式满足!");
        } else {
            System.out.println("格式不满足!");
        }
    }
    /**
     * 验证邮政编码
     * 1-9开头的六位数
     */
    @Test
    public void isZipCode() {
        String str = "123450";
        String regex = "^[1-9]\\d{5}$";
        Pattern pattern = Pattern.compile(regex);
        Matcher matcher = pattern.matcher(str);
        if (matcher.find()) {
            System.out.println("格式满足!");
        } else {
            System.out.println("格式不满足!");
        }
    }
    /**
     * 验证QQ号
     * 1-9开头的5-10位纯数字
     */
    @Test
    public void isQQ() {
        String str = "256789087";
        String regex = "^[1-9]\\d{4,9}$";
        Pattern pattern = Pattern.compile(regex);
        Matcher matcher = pattern.matcher(str);
        if (matcher.find()) {
            System.out.println("格式满足!");
        } else {
            System.out.println("格式不满足!");
        }
    }
    /**
     * 验证手机号码
     * 以13,14,15,18开头的到11位数
     */
    @Test
    public void isPhoneNumber() {
        String str = "13245678901";
        String regex = "^1[3|4|5|8]\\d{9}$";
        Pattern pattern = Pattern.compile(regex);
        Matcher matcher = pattern.matcher(str);
        if (matcher.find()) {
            System.out.println("格式满足!");
        } else {
            System.out.println("格式不满足!");
        }
    }
}
------------------------
输出都为格式满足!


正则验证复杂URL:👳‍♀️


/**
 * 验证是否为合法的URL
 * 思路:
 * 1.URL开头部分:https://或者http://
 * 2.通过([\w-]+\.)+[\w-]+$匹配https://blog.csdn.net部分
 * 3.匹配其余部分
 */
@Test
public void isUrl() {
    String str = "https://blog.csdn.net/Gherbirthday0916?spm=1010.2135.3001.5343";
    String regex = "^((http|https)://)([\\w-]+\\.)+[\\w-]+(\\/[\\w-?=&/%.#]+)?$";
    Pattern pattern = Pattern.compile(regex);
    Matcher matcher = pattern.matcher(str);
    if (matcher.find()) {
        System.out.println("格式满足!");
    } else {
        System.out.println("格式不满足!");
    }
}


5.Pattern类


matches方法

在验证输入的字符串是否满足条件使用,只是验证是否满足规范🎈


/**
 * 验证matches方法,用于整体匹配
 * 在验证输入的字符串是否满足条件使用
 */
@Test
public void matchesTest() {
    String str = "大河之犬";
    String regex = "^[\u0391-\uffe5]+$";
    boolean matches = Pattern.matches(regex, str);
    System.out.println(matches);
}
------------------------
输出:true


6.Matcher类


常用方法使用案例:


import java.util.regex.Matcher;
import java.util.regex.Pattern;
/**
 * Matcher类演示
 */
public class MatcherTest {
    public static void main(String[] args) {
        String content = "Go的语法接近C语言,但对于变量的声明有所不同。Go支持垃圾回收功能" +
                "。Go的并行模型是以东尼·霍尔的通信顺序进程(CSP)为基础,采取类似模型的" +
                "其他语言包括Occam和Limbo,但它也具有Pi运算的特征,比如通道传输。在" +
                "1.8版本中开放插件(Plugin)的支持,这意味着现在能从Go中动态加载部分" +
                "函数。\n" +
                "与C++相比,Go并不包括如枚举、异常处理、继承、泛型、断言、虚函数等功" +
                "能,但增加了 切片(Slice) 型、并发、管道、垃圾回收、接口" +
                "(Interface)等特性的语言级支持。Go 2.0版本将支持泛型,对于断言的" +
                "存在,则持负面态度,同时也为自己不提供类型继承来辩护。\n" +
                "不同于Java,Go内嵌了关联数组(也称为哈希表(Hashes)或字典" +
                "(Dictionaries) ),就像字符串类型一样。aaaaaa11c8abcABCaBc";
        // 匹配Go
        Pattern pattern = Pattern.compile("Go");
        Matcher matcher = pattern.matcher(content);
        while (matcher.find()) {
            // 找到每一个匹配的开始索引
            System.out.println(matcher.start());
            // 找到每一个匹配的结束索引
            System.out.println(matcher.end());
            System.out.println("============================");
        }
        // 整体匹配方法,去检验某个字符串是否满足某个规则
        System.out.println(matcher.matches());
        // 替换所有的Go为Golang
        String res = matcher.replaceAll("Golang");
        System.out.println(res);
    }
}


7.反向引用


反向引用非常方便,因为它允许重复一个模式(pattern),无需再重写一遍。我们可以使用\#(#是组号)来引用前面已定义的组。比如一个文本以abc开始,接着为xyz,紧跟着abc,对应的正则表达式可以为“abcxyzabc”,也可以使用反向引用重写正则表达式,“(abc)xyz\1”,\1表示第一组(abc)。\2表示第二组,\3表示第三组,以此类推。


小例子:


匹配两个连续的相同数字:


(\\d)\\1


匹配五个连续的相同数字:


(\\d)\\1{4}


匹配个位与千位相同,十位与百位相同的数组:


(\\d)(\\d)\\2\\1


反向引用之结巴去重案例:


import java.util.regex.Matcher;
import java.util.regex.Pattern;
/**
 * 结巴去重案例
 * 将结巴的语句恢复为正常的语句
 */
public class Stuttering {
    public static void main(String[] args) {
        String content = "我...要要...学学学学......java";
        // 去掉.
        Pattern pattern = Pattern.compile("\\.");
        Matcher matcher = pattern.matcher(content);
        // 将所有的.替换为空
        content = matcher.replaceAll("");
        // 去掉重读的字
        pattern = Pattern.compile("(.)\\1+");
        matcher = pattern.matcher(content);
        content = matcher.replaceAll("$1");
        System.out.println(content);
    }
}
------------------------------
输出:
我要学java
目录
相关文章
|
1天前
|
Java API 开发者
探索Java中的Lambda表达式:简洁与强大的代码实践
本文深入探讨Java中Lambda表达式的定义、用法及优势,通过实例展示其如何简化代码、提升可读性,并强调在使用中需注意的兼容性和效率问题。Lambda作为Java 8的亮点功能,不仅优化了集合操作,还促进了函数式编程范式的应用,为开发者提供了更灵活的编码方式。
|
3天前
|
Java 测试技术
java正则表达式
java正则表达式
22 7
|
4天前
|
Java 开发者
探索Java中的Lambda表达式
【9月更文挑战第23天】本文将深入探讨Java中的Lambda表达式,从其基本概念、语法结构到实际应用案例,旨在帮助读者更好地理解并掌握这一现代编程特性。我们将通过简洁明了的代码示例,展示Lambda表达式如何简化代码、提高开发效率。无论你是Java新手还是资深开发者,这篇文章都将为你提供有价值的见解和技巧。
|
2天前
|
Java API
Java中的Lambda表达式及其应用
本文将深入探讨Java中的Lambda表达式,通过简洁易懂的语言和示例代码,帮助读者理解Lambda表达式的定义、优势以及在实际开发中的应用。同时,我们将解析一些常见的使用场景,并展示如何利用Lambda表达式简化代码,提高编程效率。
8 2
|
3天前
|
Java 程序员 API
Java 8新特性之Lambda表达式与Stream API的探索
【9月更文挑战第24天】本文将深入浅出地介绍Java 8中的重要新特性——Lambda表达式和Stream API,通过实例解析其语法、用法及背后的设计哲学。我们将一探究竟,看看这些新特性如何让Java代码变得更加简洁、易读且富有表现力,同时提升程序的性能和开发效率。
|
9天前
|
Java
Java 正则表达式高级用法
Java 中的正则表达式是强大的文本处理工具,用于搜索、匹配、替换和分割字符串。`java.util.regex` 包提供了 `Pattern` 和 `Matcher` 类来高效处理正则表达式。本文介绍了高级用法,包括使用 `Pattern` 和 `Matcher` 进行匹配、断言(如正向和负向前瞻/后顾)、捕获组与命名组、替换操作、分割字符串、修饰符(如忽略大小写和多行模式)及 Unicode 支持。通过这些功能,可以高效地处理复杂文本数据。
|
10天前
|
Java 程序员 API
Java中的Lambda表达式:简化代码的秘密武器
在Java 8中引入的Lambda表达式是一种强大的编程工具,它可以显著简化代码,提高可读性。本文将介绍Lambda表达式的基本概念、优势以及在实际开发中的应用。通过具体示例,您将了解如何使用Lambda表达式来简化集合操作、线程编程和函数式编程。让我们一起探索这一革命性的特性,看看它是如何改变Java编程方式的。
21 4
|
10天前
|
Java 开发者
探索Java中的Lambda表达式:简化你的代码
【8月更文挑战第49天】在Java 8的发布中,Lambda表达式无疑是最令人兴奋的新特性之一。它不仅为Java开发者提供了一种更加简洁、灵活的编程方式,而且还极大地提高了代码的可读性和开发效率。本文将通过实际代码示例,展示如何利用Lambda表达式优化和重构Java代码,让你的编程之旅更加轻松愉快。
|
13天前
|
Java 开发者
探索Java中的Lambda表达式:简化代码,提升效率
【9月更文挑战第14天】本文旨在揭示Java 8中引入的Lambda表达式如何革新了我们编写和管理代码的方式。通过简洁明了的语言和直观的代码示例,我们将一起走进Lambda表达式的世界,了解其基本概念、语法结构以及在实际编程中的应用。文章不仅会展示Lambda表达式的魅力所在,还会指导读者如何在日常工作中有效利用这一特性,以提高编码效率和程序可读性。
|
21天前
|
存储 Java
探索Java中的Lambda表达式
【9月更文挑战第6天】Lambda表达式是Java 8引入的一个强大特性,它允许我们将函数作为参数传递或作为返回值。在这篇文章中,我们将深入探讨Lambda表达式的概念、语法和用法,以及如何在实际项目中应用它们来简化代码。通过学习本文,你将能够更好地理解Lambda表达式的作用,并掌握如何在Java中使用它们。