一文学会java正则表达式

简介: 1.什么是正则表达式?在了解正则表达式之前,我们先看几个非常常见的问题:如何判断字符串是否是有效的电话号码?例如:010-1234567,123ABC456,13510001000等;如何判断字符串是否是有效的电子邮件地址?例如:test@example.com,test#example等;如何判断字符串是否是有效的时间?例如:12:34,09:60,99:99等。一种直观的想法是通过程序判断,这种方法需要为每种用例创建规则,然后用代码实现。为每一种判断逻辑编写代码实在是太繁琐了。有没有更简单的方法?


1.什么是正则表达式?


在了解正则表达式之前,我们先看几个非常常见的问题:

如何判断字符串是否是有效的电话号码?例如:010-1234567,123ABC456,13510001000等;

如何判断字符串是否是有效的电子邮件地址?例如:test@example.com,test#example等;

如何判断字符串是否是有效的时间?例如:12:34,09:60,99:99等。

一种直观的想法是通过程序判断,这种方法需要为每种用例创建规则,然后用代码实现。

为每一种判断逻辑编写代码实在是太繁琐了。有没有更简单的方法?

有!用正则表达式!

正则表达式可以用字符串来描述规则,并用来匹配字符串。例如,判断手机号,我们用正则表达式\d{11}

使用正则表达式的好处有哪些?一个正则表达式就是一个描述规则的字符串,所以,只需要编写正确的规则,我们就可以让正则表达式引擎去判断目标字符串是否符合规则。

正则表达式是一套标准,它可以用于任何语言。Java标准库的java.util.regex包内置了正则表达式引擎,在Java程序中使用正则表达式非常简单。


2.快速入门案例


找到文本中的所有英文单词(含字母):


import java.util.regex.Matcher;
import java.util.regex.Pattern;
/**
 * 正则表达式快速入门
 */
public class HelloRegularExpression {
    public static void main(String[] args) {
        String content = "Go的语法接近C语言,但对于变量的声明有所不同。Go支持垃圾回收功能" +
                "。Go的并行模型是以东尼·霍尔的通信顺序进程(CSP)为基础,采取类似模型的" +
                "其他语言包括Occam和Limbo,但它也具有Pi运算的特征,比如通道传输。在" +
                "1.8版本中开放插件(Plugin)的支持,这意味着现在能从Go中动态加载部分" +
                "函数。\n" +
                "与C++相比,Go并不包括如枚举、异常处理、继承、泛型、断言、虚函数等功" +
                "能,但增加了 切片(Slice) 型、并发、管道、垃圾回收、接口" +
                "(Interface)等特性的语言级支持。Go 2.0版本将支持泛型,对于断言的" +
                "存在,则持负面态度,同时也为自己不提供类型继承来辩护。\n" +
                "不同于Java,Go内嵌了关联数组(也称为哈希表(Hashes)或字典" +
                "(Dictionaries) ),就像字符串类型一样。";
        // 实例:找到文本中的所有英文单词(含字母)
        // 先创建一个Pattern模式对象
        Pattern pattern = Pattern.compile("[a-zA-Z]+");
        // 创建一个匹配器对象
        Matcher matcher = pattern.matcher(content);
        // 开始匹配
        while (matcher.find()) {
            System.out.println("找到:" + matcher.group(0));
        }
    }
}
-------------------------------
输出:
找到:Go
找到:C
找到:Go
找到:Go
找到:CSP
找到:Occam
找到:Limbo
找到:Pi
找到:Plugin
找到:Go
找到:C
找到:Go
找到:Slice
找到:Interface
找到:Go
找到:Java
找到:Go
找到:Hashes
找到:Dictionaries


3.正则表达式语法


转义符号🙌


当我们在检索某些字符时,需要用到转义符号,否则检索不到结果,甚至发生错误❌

在正则表达式中,两个\\代表其他语言中的一个\


字符匹配符🧂


[]   - 可接受的字符列表


[efgh] 表示可接收的efgh中的任意一个字符


[^]   - 不可接受的字符列表


^abc 表示除了abc之外的任意一个字符,包括数字和特殊字符


-   - 连字符


A-Z 表示任意一个大写字母


.   - 匹配除\n以外的任意一个字符


a..b 以a开头,b结尾,中间包括2个任意字符的长度为4的字符串


\\d   - 匹配单个数字字符


\\d{3}(\\d)? 包含3个或者4个数字的字符串


\\D 匹配单个非数字字符


\D(\\d)* 以单个非数字字符开头,后接任意个数字字符串


\\w 匹配单个数字、大小写字符


\\d{3}\\w{4} 以三个数字字符开头的长度为7的数字字母字符串


\\W 匹配非数字字母字符串


\\W+\\d{2} 以至少一个非数字字母字符开头,2个数字字符结尾的字符串


字符匹配符演示🤞


import java.util.regex.Matcher;
import java.util.regex.Pattern;
/**
 * 正则表达式快速入门
 */
public class HelloRegularExpression {
    public static void main(String[] args) {
        String content = "Go的语法接近C语言,但对于变量的声明有所不同。Go支持垃圾回收功能" +
                "。Go的并行模型是以东尼·霍尔的通信顺序进程(CSP)为基础,采取类似模型的" +
                "其他语言包括Occam和Limbo,但它也具有Pi运算的特征,比如通道传输。在" +
                "1.8版本中开放插件(Plugin)的支持,这意味着现在能从Go中动态加载部分" +
                "函数。\n" +
                "与C++相比,Go并不包括如枚举、异常处理、继承、泛型、断言、虚函数等功" +
                "能,但增加了 切片(Slice) 型、并发、管道、垃圾回收、接口" +
                "(Interface)等特性的语言级支持。Go 2.0版本将支持泛型,对于断言的" +
                "存在,则持负面态度,同时也为自己不提供类型继承来辩护。\n" +
                "不同于Java,Go内嵌了关联数组(也称为哈希表(Hashes)或字典" +
                "(Dictionaries) ),就像字符串类型一样。a11c8abcABCaBc";
        // 实例:找到文本中的所有英文单词(含字母)
        // 先创建一个Pattern模式对象
        Pattern pattern = Pattern.compile("[a-zA-Z]+");
        // 创建一个匹配器对象
        Matcher matcher = pattern.matcher(content);
        // 开始匹配
        while (matcher.find()) {
            System.out.println("找到:" + matcher.group(0));
        }
        // 实例:找到a-z之间的任意一个字符
        Pattern pattern1 = Pattern.compile("[a-z]");
        Matcher matcher1 = pattern1.matcher(content);
        while (matcher1.find()) {
            System.out.println("2找到:" + matcher1.group(0));
        }
        // 实例:找到abc字符,不区分大小写
        Pattern pattern2 = Pattern.compile("(?i)abc");
        Matcher matcher2 = pattern2.matcher(content);
        while (matcher2.find()) {
            System.out.println("3找到:" + matcher2.group(0));
        }
        // 实例:找到abc字符,b不区分大小写
        Pattern pattern3 = Pattern.compile("a((?i)b)c");
        Matcher matcher3 = pattern3.matcher(content);
        while (matcher3.find()) {
            System.out.println("4找到:" + matcher3.group(0));
        }
        // 实例:找到abc字符,不区分大小写,设置参数的方式
        Pattern pattern4 = Pattern.compile("abc", Pattern.CASE_INSENSITIVE);
        Matcher matcher4 = pattern4.matcher(content);
        while (matcher4.find()) {
            System.out.println("5找到:" + matcher4.group(0));
        }
        // 实例:找到非数字字母字符的所有字符(含中文)
        Pattern pattern5 = Pattern.compile("\\W", Pattern.CASE_INSENSITIVE);
        Matcher matcher5 = pattern5.matcher(content);
        while (matcher5.find()) {
            System.out.println("6找到:" + matcher5.group(0));
        }
    }
}


选择匹配符🎈


|   - 多个条件满足一个即可匹配成功


例如:匹配文本中的Go/C/Java中的任意一个字符串


String content = "Go的语法接近C语言,但对于变量的声明有所不同。Go支持垃圾回收功能" +
        "。Go的并行模型是以东尼·霍尔的通信顺序进程(CSP)为基础,采取类似模型的" +
        "其他语言包括Occam和Limbo,但它也具有Pi运算的特征,比如通道传输。在" +
        "1.8版本中开放插件(Plugin)的支持,这意味着现在能从Go中动态加载部分" +
        "函数。\n" +
        "与C++相比,Go并不包括如枚举、异常处理、继承、泛型、断言、虚函数等功" +
        "能,但增加了 切片(Slice) 型、并发、管道、垃圾回收、接口" +
        "(Interface)等特性的语言级支持。Go 2.0版本将支持泛型,对于断言的" +
        "存在,则持负面态度,同时也为自己不提供类型继承来辩护。\n" +
        "不同于Java,Go内嵌了关联数组(也称为哈希表(Hashes)或字典" +
        "(Dictionaries) ),就像字符串类型一样。a11c8abcABCaBc";
Pattern pattern = Pattern.compile("Go|C|Java");
Matcher matcher = pattern.matcher(content);
while (matcher.find()) {
    System.out.println("找到:" + matcher.group(0));
}


正则限定符😶‍🌫️


*   - 指定字符重复0次或n次


示例:(abc)* 指定abc字符串重复0次或者n次

实例:abc,abcabcabc


+   - 指定字符重复1次或n次


示例:m+(abc)* 指定以至少一个m开头,后面接任意个abc的字符串

实例:m,mabc,mmabcabc


?   - 指定字符重复0次或者1次


示例:m+abc? 指定以至少一个m开头,后面是ab或者abc的字符串

实例:mab,mmabc


{n}   - 只能输入n个字符


示例:[abcd]{3} 由abcd字符组成的任意长度为3的字符串

实例:abc,dbc,adc


{n,}   - 指定至少n个匹配


示例:[abcd]{3,} 由abcd组成的任意长度不小于3的字符串

实例:aab,aaadbc


{n,m}   - 指定至少n个但是不多于m个匹配
注意:java的匹配是贪婪匹配,即尽可能匹配多的,即优先匹配m个字符


示例:[abcd]{3,5} 由abcd组成的任意长度不小于3大于5的字符串

实例:abc,aaabb

代码演示:(匹配六个a)


import java.util.regex.Matcher;
import java.util.regex.Pattern;
/**
 * 正则限定符
 */
public class Qualifier {
    public static void main(String[] args) {
        String content = "Go的语法接近C语言,但对于变量的声明有所不同。Go支持垃圾回收功能" +
                "。Go的并行模型是以东尼·霍尔的通信顺序进程(CSP)为基础,采取类似模型的" +
                "其他语言包括Occam和Limbo,但它也具有Pi运算的特征,比如通道传输。在" +
                "1.8版本中开放插件(Plugin)的支持,这意味着现在能从Go中动态加载部分" +
                "函数。\n" +
                "与C++相比,Go并不包括如枚举、异常处理、继承、泛型、断言、虚函数等功" +
                "能,但增加了 切片(Slice) 型、并发、管道、垃圾回收、接口" +
                "(Interface)等特性的语言级支持。Go 2.0版本将支持泛型,对于断言的" +
                "存在,则持负面态度,同时也为自己不提供类型继承来辩护。\n" +
                "不同于Java,Go内嵌了关联数组(也称为哈希表(Hashes)或字典" +
                "(Dictionaries) ),就像字符串类型一样。aaaaaa11c8abcABCaBc";
        // 匹配六个a
        Pattern pattern = Pattern.compile("a{6}");
        Matcher matcher = pattern.matcher(content);
        while (matcher.find()) {
            System.out.println("找到:" + matcher.group(0));
        }
    }
}


正则定位符🎶


^   - 指定起始字符


示例:^[0-9]+[a-z]* 以至少1个数字开头,后接任意个小写字母的字符串

实例:123,6aa,555edf


$   - 指定结束字符


示例:^[0-9]\\-[a-z]+$ 以至少一个数字开头连接-并以至少一个小写字母结尾的字符串

实例:1-a,2-abc

程序演示:


Pattern pattern = Pattern.compile("^[0-9]+[a-z]*");
Matcher matcher = pattern.matcher("123abc");
while (matcher.find()) {
    System.out.println("找到:" + matcher.group(0));
}
Pattern pattern2 = Pattern.compile("^[0-9]\\-[a-z]+$");
Matcher matcher2 = pattern2.matcher("1-a");
while (matcher2.find()) {
    System.out.println("找到:" + matcher2.group(0));
}
------------------------------------------------
输出:
找到:123abc
找到:1-a


\\b   - 匹配目标字符串的边界(结尾)


示例:guo\\B 字串间有空格,或者是目标字符串的开头位置匹配guo


实例:guoyunyun guotime

目录
相关文章
|
4天前
|
Java API
Java 8新特性之Lambda表达式与Stream API
【5月更文挑战第17天】本文将介绍Java 8中的两个重要特性:Lambda表达式和Stream API。Lambda表达式是一种新的编程语法,它允许我们将函数作为参数传递给其他方法,从而使代码更加简洁。Stream API是一种用于处理集合的新工具,它提供了一种高效且易于使用的方式来处理数据。通过结合使用这两个特性,我们可以编写出更加简洁、高效的Java代码。
13 0
|
6天前
|
Java 测试技术
Java一分钟之-正则表达式在Java中的应用
【5月更文挑战第14天】正则表达式是Java中用于文本处理的强大力量,通过`java.util.regex`包支持。常见问题包括元字符的理解、边界匹配和贪婪/懒惰量词的使用。错误通常涉及未转义特殊字符、不完整模式或过度匹配。要避免这些问题,需学习实践、使用在线工具和测试调试。示例代码展示了如何验证邮箱地址。掌握正则表达式需要不断练习和调试。
26 2
|
6天前
|
Java 开发者
Java一分钟之-Lambda表达式与函数式接口
【5月更文挑战第12天】Java 8引入的Lambda表达式简化了函数式编程,与函数式接口结合,实现了代码高效编写。本文介绍了Lambda的基本语法,如参数列表、箭头符号和函数体,并展示了如何使用Lambda实现`Runnable`接口。函数式接口仅有一个抽象方法,可与Lambda搭配使用。`@FunctionalInterface`注解用于确保接口具有单一抽象方法。文章还讨论了常见的问题和易错点,如非函数式接口、类型冲突以及Lambda表达式的局部变量可见性,并提供了避免这些问题的策略。通过理解Lambda和函数式接口,开发者能提高代码可读性和效率。
44 4
|
6天前
|
Java
探索Java世界的奇妙工具——运算符与表达式运算符
探索Java世界的奇妙工具——运算符与表达式运算符
9 0
|
1天前
|
Java API
Java 8新特性之Lambda表达式
【5月更文挑战第20天】本文将介绍Java 8中的一个重要特性——Lambda表达式。Lambda表达式是Java 8引入的一种新的编程语法,它允许我们将函数作为参数传递给方法,从而实现更加简洁、灵活的代码。本文将从Lambda表达式的基本概念、语法、使用方法以及优缺点等方面进行详细介绍,帮助读者更好地理解和应用Lambda表达式。
|
1天前
|
Java 程序员 API
Java 8 Lambda 表达式和Stream API:概念、优势和实战应用
【5月更文挑战第20天】在Java 8中,Lambda 表达式和Stream API是两个非常强大的特性,它们显著改变了Java程序员处理数据和编写代码的方式。本篇技术文章将深入探讨这些特性的概念、优点,并提供实战示例,帮助理解如何有效地利用这些工具来编写更简洁、更高效的代码。
18 6
|
6天前
|
Java API
Java 8新特性之Lambda表达式与Stream API实践指南
【5月更文挑战第15天】 随着Java语言的不断发展,Java 8作为一个重要的版本,引入了许多令人兴奋的新特性。其中,Lambda表达式和Stream API是Java 8最受关注的两个特性。本文将深入探讨Lambda表达式的基本概念、语法和使用场景,以及如何结合Stream API实现更加简洁、高效的代码编写。通过实例演示,帮助读者快速掌握这两个新特性,提高Java编程能力。
|
6天前
|
Java
Java正则表达式去掉非汉字字符
【5月更文挑战第11天】Java正则表达式去掉非汉字字符
18 3
|
6天前
|
Java API 开发者
Java中Lambda表达式的深入理解与应用
【5月更文挑战第12天】在Java 8之后,Lambda表达式已经成为了Java开发者必备的技能之一。Lambda表达式以其简洁、灵活的特点,大大提高了编程的效率。本文将深入探讨Lambda表达式的基本概念,语法规则,以及在实际开发中的应用,帮助读者更好地理解和使用Lambda表达式。
|
6天前
|
Java 程序员 API
Java 8新特性之Lambda表达式与Stream API的深度解析
【5月更文挑战第12天】本文将深入探讨Java 8中的两个重要新特性:Lambda表达式和Stream API。我们将从基本概念入手,逐步深入到实际应用场景,帮助读者更好地理解和掌握这两个新特性,提高Java编程效率。
44 2