Java的正则表达式原理及使用场景(上)

简介: Java的正则表达式原理及使用场景(上)

主要用到如下类:


java.util.regex.Pattern

java.util.regex.Matcher。

Pattern对应正则表达式,一个Pattern与一个String对象关联,生成一个Matcher,它对应Pattern在String中的一次匹配;

调用Matcher对象的find()方法,Matcher对象就会更新为下一次匹配的匹配信息。示例:

Pattern pattern = Pattern.compile("\\d{4}-\\d{2}-]]d{2}");
String string = "2010-12-20 2011-02-14";
Matcher matcher = pattern.matcher(string);
while(matcher.find()) {
    System.out.println(matcher.group(0));
}

Pattern

Java语言中的正则表达式对象。

要使用正则表达式,首先必须从字符串“编译”出Pattern对象,这需要用到Pattern.compile(String regex)

e.g:

Pattern pattern = Pattern.compile("a.b+");

指定匹配模式

可在表达式中使用(?modifier)修饰符指定,也可以使用预定义常量。

下面的两个Pattern对象的生成方法不同,结果却是等价的。

Pattern pattern = Pattern.compile("(?i)a.b+");
Pattern pattern = Pattern.compile("a.b+",Pattern.CASE_INSENSITIVE);

指定多种模式

可连写模式修饰符,也可以直接用|运算符将预定义常量连接,以下两个Pattern对象也是等价的。

Pattern pattern = Pattern.compile("(?is)a.b+");
Pattern pattern = Pattern.compile("a.b+",Pattern.CASE_INSENSITIVE | Pattern.DOTALL);

主要API

image.png

可检验字符串input能否由正则表达式regex匹配。

静态方法,所以无需编译生成各个对象,方便随手使用。

它检验的是“整个字符串能否由表达式匹配”,而不是“表达式能否在字符串中找到匹配”。

可认为regex的首尾自动加上了匹配字符串起始和结束位置的锚点 \A和\z 。

// false
Pattern.matches("\\d{6}","a123456");
// true
Pattern.matches("\\d{6}","123456");

5.png

通常,Pattern对象需配合下面的Matcher一起完成正则操作。若只用正则表达式切分字符串,只用Pattern的这个方法也可。

这个方法接收的参数类型是CharSequence

image.png

它是String的父类,因而可应对常见的各种表示“字符串”的类。

下面仅以String为例:

String s = "2018-3-26";
Pattern pattern = Pattern.compile("\\s+");
for(String part : pattern.split(s)){
    System.out.println(part);
}

与上面的方法相似,只是多了一个参数limit,限定返回的String数组的最大长度。

即规定了字符串至多只能“切”limit-1次。

若不需要对字符串比较大,进行尽可能多的切分,使用这个方法。

String s = " 2010-12-20  ";
Pattern pattern = Pattern.compile("\\s+");
for(String part : Pattern.split(s,2)){
    System.out.println(part);
}

既然limit是一个int类型,那么它自然可以设定为各种值,下表总结了limit在各个取值区间对结果的影响(未指定limit时,最终返回包含n个元素的数组,实际能切分的次数是 n-1 ):


limit < 0

等于未设定limit时,保留末尾的空字符串

limit = 0

等于未设定limit时,切分n-1次,忽略末尾的空字符串

0 < limit < n

返回数组包含limit个元素,切分limit-1次,最后一个元素是第limit-1次切分后,右侧剩下的所有文本

limit >= n

等于未指定limit时

image.png

用来取消字符串text中所有转义字符的特殊含义,实质就是在字符串首尾添加 \Q 和 \E。

通常,如果需要把某个字符串作为没有任何特殊意义的正则表达式(比如从外界读入的字符串,用在某个复杂的正则表达式中),就可以使用这个方法:

"aacb".matches("a*.b");            //true
"a*.b".matches("a*.b");             //false
"a*.b".matches("a*.b");             //false
"a*.b".matches(Pattern.quote("a*.b"));        //true
目录
相关文章
|
2月前
|
存储 Java 关系型数据库
高效连接之道:Java连接池原理与最佳实践
在Java开发中,数据库连接是应用与数据交互的关键环节。频繁创建和关闭连接会消耗大量资源,导致性能瓶颈。为此,Java连接池技术通过复用连接,实现高效、稳定的数据库连接管理。本文通过案例分析,深入探讨Java连接池的原理与最佳实践,包括连接池的基本操作、配置和使用方法,以及在电商应用中的具体应用示例。
78 5
|
11天前
|
监控 Java API
探索Java NIO:究竟在哪些领域能大显身手?揭秘原理、应用场景与官方示例代码
Java NIO(New IO)自Java SE 1.4引入,提供比传统IO更高效、灵活的操作,支持非阻塞IO和选择器特性,适用于高并发、高吞吐量场景。NIO的核心概念包括通道(Channel)、缓冲区(Buffer)和选择器(Selector),能实现多路复用和异步操作。其应用场景涵盖网络通信、文件操作、进程间通信及数据库操作等。NIO的优势在于提高并发性和性能,简化编程;但学习成本较高,且与传统IO存在不兼容性。尽管如此,NIO在构建高性能框架如Netty、Mina和Jetty中仍广泛应用。
26 3
|
11天前
|
安全 算法 Java
Java CAS原理和应用场景大揭秘:你掌握了吗?
CAS(Compare and Swap)是一种乐观锁机制,通过硬件指令实现原子操作,确保多线程环境下对共享变量的安全访问。它避免了传统互斥锁的性能开销和线程阻塞问题。CAS操作包含三个步骤:获取期望值、比较当前值与期望值是否相等、若相等则更新为新值。CAS广泛应用于高并发场景,如数据库事务、分布式锁、无锁数据结构等,但需注意ABA问题。Java中常用`java.util.concurrent.atomic`包下的类支持CAS操作。
42 2
|
30天前
|
监控 Java Python
Java 中的正则表达式
正则表达式是Java中强大的文本处理工具,支持灵活的匹配、搜索、替换和验证功能。本文介绍了正则表达式的语法基础及其在Java中的应用,包括字符串匹配、替换、分割及实际场景中的邮箱验证和电话号码提取等示例。通过这些技术,可以显著提高文本处理的效率和准确性。
107 8
|
2月前
|
存储 算法 Java
大厂面试高频:什么是自旋锁?Java 实现自旋锁的原理?
本文详解自旋锁的概念、优缺点、使用场景及Java实现。关注【mikechen的互联网架构】,10年+BAT架构经验倾囊相授。
大厂面试高频:什么是自旋锁?Java 实现自旋锁的原理?
|
2月前
|
Java
Java之CountDownLatch原理浅析
本文介绍了Java并发工具类`CountDownLatch`的使用方法、原理及其与`Thread.join()`的区别。`CountDownLatch`通过构造函数接收一个整数参数作为计数器,调用`countDown`方法减少计数,`await`方法会阻塞当前线程,直到计数为零。文章还详细解析了其内部机制,包括初始化、`countDown`和`await`方法的工作原理,并给出了一个游戏加载场景的示例代码。
Java之CountDownLatch原理浅析
|
2月前
|
Java 索引 容器
Java ArrayList扩容的原理
Java 的 `ArrayList` 是基于数组实现的动态集合。初始时,`ArrayList` 底层创建一个空数组 `elementData`,并设置 `size` 为 0。当首次添加元素时,会调用 `grow` 方法将数组扩容至默认容量 10。之后每次添加元素时,如果当前数组已满,则会再次调用 `grow` 方法进行扩容。扩容规则为:首次扩容至 10,后续扩容至原数组长度的 1.5 倍或根据实际需求扩容。例如,当需要一次性添加 100 个元素时,会直接扩容至 110 而不是 15。
Java ArrayList扩容的原理
|
2月前
|
存储 Java 关系型数据库
在Java开发中,数据库连接是应用与数据交互的关键环节。本文通过案例分析,深入探讨Java连接池的原理与最佳实践
在Java开发中,数据库连接是应用与数据交互的关键环节。本文通过案例分析,深入探讨Java连接池的原理与最佳实践,包括连接创建、分配、复用和释放等操作,并通过电商应用实例展示了如何选择合适的连接池库(如HikariCP)和配置参数,实现高效、稳定的数据库连接管理。
72 2
|
2月前
|
Java 数据格式 索引
使用 Java 字节码工具检查类文件完整性的原理是什么
Java字节码工具通过解析和分析类文件的字节码,检查其结构和内容是否符合Java虚拟机规范,确保类文件的完整性和合法性,防止恶意代码或损坏的类文件影响程序运行。
54 5
|
2月前
|
算法 Java 数据库连接
Java连接池技术,从基础概念出发,解析了连接池的工作原理及其重要性
本文详细介绍了Java连接池技术,从基础概念出发,解析了连接池的工作原理及其重要性。连接池通过复用数据库连接,显著提升了应用的性能和稳定性。文章还展示了使用HikariCP连接池的示例代码,帮助读者更好地理解和应用这一技术。
63 1