Java的正则表达式原理及使用场景(上)

简介: Java的正则表达式原理及使用场景(上)

主要用到如下类:


java.util.regex.Pattern

java.util.regex.Matcher。

Pattern对应正则表达式,一个Pattern与一个String对象关联,生成一个Matcher,它对应Pattern在String中的一次匹配;

调用Matcher对象的find()方法,Matcher对象就会更新为下一次匹配的匹配信息。示例:

Pattern pattern = Pattern.compile("\\d{4}-\\d{2}-]]d{2}");
String string = "2010-12-20 2011-02-14";
Matcher matcher = pattern.matcher(string);
while(matcher.find()) {
    System.out.println(matcher.group(0));
}

Pattern

Java语言中的正则表达式对象。

要使用正则表达式,首先必须从字符串“编译”出Pattern对象,这需要用到Pattern.compile(String regex)

e.g:

Pattern pattern = Pattern.compile("a.b+");

指定匹配模式

可在表达式中使用(?modifier)修饰符指定,也可以使用预定义常量。

下面的两个Pattern对象的生成方法不同,结果却是等价的。

Pattern pattern = Pattern.compile("(?i)a.b+");
Pattern pattern = Pattern.compile("a.b+",Pattern.CASE_INSENSITIVE);

指定多种模式

可连写模式修饰符,也可以直接用|运算符将预定义常量连接,以下两个Pattern对象也是等价的。

Pattern pattern = Pattern.compile("(?is)a.b+");
Pattern pattern = Pattern.compile("a.b+",Pattern.CASE_INSENSITIVE | Pattern.DOTALL);

主要API

image.png

可检验字符串input能否由正则表达式regex匹配。

静态方法,所以无需编译生成各个对象,方便随手使用。

它检验的是“整个字符串能否由表达式匹配”,而不是“表达式能否在字符串中找到匹配”。

可认为regex的首尾自动加上了匹配字符串起始和结束位置的锚点 \A和\z 。

// false
Pattern.matches("\\d{6}","a123456");
// true
Pattern.matches("\\d{6}","123456");

5.png

通常,Pattern对象需配合下面的Matcher一起完成正则操作。若只用正则表达式切分字符串,只用Pattern的这个方法也可。

这个方法接收的参数类型是CharSequence

image.png

它是String的父类,因而可应对常见的各种表示“字符串”的类。

下面仅以String为例:

String s = "2018-3-26";
Pattern pattern = Pattern.compile("\\s+");
for(String part : pattern.split(s)){
    System.out.println(part);
}

与上面的方法相似,只是多了一个参数limit,限定返回的String数组的最大长度。

即规定了字符串至多只能“切”limit-1次。

若不需要对字符串比较大,进行尽可能多的切分,使用这个方法。

String s = " 2010-12-20  ";
Pattern pattern = Pattern.compile("\\s+");
for(String part : Pattern.split(s,2)){
    System.out.println(part);
}

既然limit是一个int类型,那么它自然可以设定为各种值,下表总结了limit在各个取值区间对结果的影响(未指定limit时,最终返回包含n个元素的数组,实际能切分的次数是 n-1 ):


limit < 0

等于未设定limit时,保留末尾的空字符串

limit = 0

等于未设定limit时,切分n-1次,忽略末尾的空字符串

0 < limit < n

返回数组包含limit个元素,切分limit-1次,最后一个元素是第limit-1次切分后,右侧剩下的所有文本

limit >= n

等于未指定limit时

image.png

用来取消字符串text中所有转义字符的特殊含义,实质就是在字符串首尾添加 \Q 和 \E。

通常,如果需要把某个字符串作为没有任何特殊意义的正则表达式(比如从外界读入的字符串,用在某个复杂的正则表达式中),就可以使用这个方法:

"aacb".matches("a*.b");            //true
"a*.b".matches("a*.b");             //false
"a*.b".matches("a*.b");             //false
"a*.b".matches(Pattern.quote("a*.b"));        //true
目录
相关文章
|
21天前
|
存储 Java 关系型数据库
高效连接之道:Java连接池原理与最佳实践
在Java开发中,数据库连接是应用与数据交互的关键环节。频繁创建和关闭连接会消耗大量资源,导致性能瓶颈。为此,Java连接池技术通过复用连接,实现高效、稳定的数据库连接管理。本文通过案例分析,深入探讨Java连接池的原理与最佳实践,包括连接池的基本操作、配置和使用方法,以及在电商应用中的具体应用示例。
40 5
|
1月前
|
存储 算法 Java
Java HashSet:底层工作原理与实现机制
本文介绍了Java中HashSet的工作原理,包括其基于HashMap实现的底层机制。通过示例代码展示了HashSet如何添加元素,并解析了add方法的具体过程,包括计算hash值、处理碰撞及扩容机制。
|
11天前
|
存储 算法 Java
大厂面试高频:什么是自旋锁?Java 实现自旋锁的原理?
本文详解自旋锁的概念、优缺点、使用场景及Java实现。关注【mikechen的互联网架构】,10年+BAT架构经验倾囊相授。
大厂面试高频:什么是自旋锁?Java 实现自旋锁的原理?
|
11天前
|
Java
Java之CountDownLatch原理浅析
本文介绍了Java并发工具类`CountDownLatch`的使用方法、原理及其与`Thread.join()`的区别。`CountDownLatch`通过构造函数接收一个整数参数作为计数器,调用`countDown`方法减少计数,`await`方法会阻塞当前线程,直到计数为零。文章还详细解析了其内部机制,包括初始化、`countDown`和`await`方法的工作原理,并给出了一个游戏加载场景的示例代码。
Java之CountDownLatch原理浅析
|
13天前
|
Java 索引 容器
Java ArrayList扩容的原理
Java 的 `ArrayList` 是基于数组实现的动态集合。初始时,`ArrayList` 底层创建一个空数组 `elementData`,并设置 `size` 为 0。当首次添加元素时,会调用 `grow` 方法将数组扩容至默认容量 10。之后每次添加元素时,如果当前数组已满,则会再次调用 `grow` 方法进行扩容。扩容规则为:首次扩容至 10,后续扩容至原数组长度的 1.5 倍或根据实际需求扩容。例如,当需要一次性添加 100 个元素时,会直接扩容至 110 而不是 15。
Java ArrayList扩容的原理
|
19天前
|
存储 Java 关系型数据库
在Java开发中,数据库连接是应用与数据交互的关键环节。本文通过案例分析,深入探讨Java连接池的原理与最佳实践
在Java开发中,数据库连接是应用与数据交互的关键环节。本文通过案例分析,深入探讨Java连接池的原理与最佳实践,包括连接创建、分配、复用和释放等操作,并通过电商应用实例展示了如何选择合适的连接池库(如HikariCP)和配置参数,实现高效、稳定的数据库连接管理。
37 2
|
22天前
|
Java 数据格式 索引
使用 Java 字节码工具检查类文件完整性的原理是什么
Java字节码工具通过解析和分析类文件的字节码,检查其结构和内容是否符合Java虚拟机规范,确保类文件的完整性和合法性,防止恶意代码或损坏的类文件影响程序运行。
|
19天前
|
算法 Java 数据库连接
Java连接池技术,从基础概念出发,解析了连接池的工作原理及其重要性
本文详细介绍了Java连接池技术,从基础概念出发,解析了连接池的工作原理及其重要性。连接池通过复用数据库连接,显著提升了应用的性能和稳定性。文章还展示了使用HikariCP连接池的示例代码,帮助读者更好地理解和应用这一技术。
32 1
|
25天前
|
存储 安全 Java
深入理解Java中的FutureTask:用法和原理
【10月更文挑战第28天】`FutureTask` 是 Java 中 `java.util.concurrent` 包下的一个类,实现了 `RunnableFuture` 接口,支持异步计算和结果获取。它可以作为 `Runnable` 被线程执行,同时通过 `Future` 接口获取计算结果。`FutureTask` 可以基于 `Callable` 或 `Runnable` 创建,常用于多线程环境中执行耗时任务,避免阻塞主线程。任务结果可通过 `get` 方法获取,支持阻塞和非阻塞方式。内部使用 AQS 实现同步机制,确保线程安全。
|
26天前
|
移动开发 Java Windows
Java 匹配\r 和 \n 的正则表达式如何编写
【10月更文挑战第19天】Java 匹配\r 和 \n 的正则表达式如何编写
72 3