【Java实用技术】字符串的拆分怎么最快?

简介: 本文是《【Java实用技术】字符串的拆分用什么方法好?》的姊妹篇,拆分方法最常用,使用看似简单但也有很多复杂的细节要注意,今天我们就来聊一聊字符串拆分怎么最快?

本文是《【Java实用技术】字符串的拆分用什么方法好?》的姊妹篇,拆分方法最常用,使用看似简单但也有很多复杂的细节要注意,今天我们就来聊一聊字符串拆分怎么最快?

2种操作性能对比

importorg.apache.commons.lang3.StringUtils;
/*** Java实用技术课程 By Pandas.* 公众号:Java实用技术手册* JDK版本:jdk1.8.0_66** @author Pandas* @date 2021/10/31*/publicclassStringSplitQuick {
publicstaticvoidmain(String[] args) {
StringBuildersb=newStringBuilder();
intmax=100_0000;
for (inti=0; i<max; i++) {
sb.append("a.");
        }
// 构造一个100W个"a."拼接成的字符串:"a.a.a.a.a.......a."Stringstr=sb.toString();
longstart1=System.currentTimeMillis();
String[] cs1=str.split("\\.");
longcost1=System.currentTimeMillis() -start1;
longstart2=System.currentTimeMillis();
String[] cs2=StringUtils.split(str, '.');
longcost2=System.currentTimeMillis() -start2;
longstart11=System.currentTimeMillis();
String[] cs11=str.split("a");
longcost11=System.currentTimeMillis() -start11;
longstart22=System.currentTimeMillis();
String[] cs22=StringUtils.split(str, 'a');
longcost22=System.currentTimeMillis() -start22;
System.out.println("原生拆分.耗时:"+cost1+"ms");
System.out.println("StringUtils拆分.耗时:"+cost2+"ms");
System.out.println("原生拆分a耗时:"+cost11+"ms");
System.out.println("StringUtils拆分a耗时:"+cost22+"ms");
    }
}

运行结果如下:

image.png

总体上来说,原生方法拆分是比StringUtils拆分耗时久点。

还能不能再快呢?这就要分析下源码。


字符串拆分之arraycopy

  • 对于字符串拆分的原生操作!
  • StringUtils拆分操作!

我们注意到上面2个方法都用到了list.toArray()方法,这个方法的源码用到了System.arraycopy(elementData, 0, a, 0, size);方法,这个操作不仅增加额外耗时,也增加内存消耗。

PS:List扩容过程中也会用到这System.arraycopy()方法哦,有兴趣的同学可以多看看他的实现。

public<T>T[] toArray(T[] a) {
if (a.length<size)
// Make a new array of a's runtime type, but my contents:return (T[]) Arrays.copyOf(elementData, size, a.getClass());
System.arraycopy(elementData, 0, a, 0, size);
if (a.length>size)
a[size] =null;
returna;
}

如果内存不够的话,一开始的例子,你可能会遇到下面的错误:

Exception in thread "main" java.lang.OutOfMemoryError: Java heap space

考虑到我们在通常开发场景中,我们使用字符串拆分后的操作一般是对拆分后内容遍历,因此使用数组还是List,都不影响我们操作。

上述方法中的List转数组,白白消耗了内存和时间。

在有的工具类(比如hutool)中就改成了List<String>作为返回类型。


补充说明

在《阿里巴巴Java开发手册》(嵩山版)中,有这么一句话

在上一节中,无论是原生split还是StringUtils,都将拆分后为空字符串的部分去掉,因此原始的List容量实际是小于等于保留全部分割数据的大小的。这个在一些拆分后业务处理是有影响的=>就是会数组越界。

比如很常见的场景,由"key=value"组成的字符串,按照“=”拆分,如果不注意,直接使用arr[1]获取value,一定会数组越界。

这时候使用StringUtils.splitPreserveAllTokens(str, "=");可以有效保留空白字符位置。

当然,如果字符串中连要分割的字符都没有,上述方法还是不能返回第二个位置的数据

这个时候你需要自己写一个字符串拆分工具类,返回固定长度的数组/List,这样方法调用者可以放心使用数组。

感谢阅读本期内容,希望对新入行的你有帮助。


往期内容:

我是Pandas,专注Java实用技术分享,公众号Java实用技术手册和B站均有视频解说,欢迎来玩。

如果你觉得这篇文章有用,别忘了点赞+关注,一起进步!


相关文章
|
11天前
|
存储 监控 安全
单位网络监控软件:Java 技术驱动的高效网络监管体系构建
在数字化办公时代,构建基于Java技术的单位网络监控软件至关重要。该软件能精准监管单位网络活动,保障信息安全,提升工作效率。通过网络流量监测、访问控制及连接状态监控等模块,实现高效网络监管,确保网络稳定、安全、高效运行。
40 11
|
20天前
|
XML Java 编译器
Java注解的底层源码剖析与技术认识
Java注解(Annotation)是Java 5引入的一种新特性,它提供了一种在代码中添加元数据(Metadata)的方式。注解本身并不是代码的一部分,它们不会直接影响代码的执行,但可以在编译、类加载和运行时被读取和处理。注解为开发者提供了一种以非侵入性的方式为代码提供额外信息的手段,这些信息可以用于生成文档、编译时检查、运行时处理等。
58 7
|
28天前
|
SQL Java 索引
java小工具util系列2:字符串工具
java小工具util系列2:字符串工具
141 83
|
2天前
|
移动开发 前端开发 Java
Java最新图形化界面开发技术——JavaFx教程(含UI控件用法介绍、属性绑定、事件监听、FXML)
JavaFX是Java的下一代图形用户界面工具包。JavaFX是一组图形和媒体API,我们可以用它们来创建和部署富客户端应用程序。 JavaFX允许开发人员快速构建丰富的跨平台应用程序,允许开发人员在单个编程接口中组合图形,动画和UI控件。本文详细介绍了JavaFx的常见用法,相信读完本教程你一定有所收获!
Java最新图形化界面开发技术——JavaFx教程(含UI控件用法介绍、属性绑定、事件监听、FXML)
|
28天前
|
Java 数据库
java小工具util系列1:日期和字符串转换工具
java小工具util系列1:日期和字符串转换工具
55 26
|
20天前
|
JavaScript 安全 Java
java版药品不良反应智能监测系统源码,采用SpringBoot、Vue、MySQL技术开发
基于B/S架构,采用Java、SpringBoot、Vue、MySQL等技术自主研发的ADR智能监测系统,适用于三甲医院,支持二次开发。该系统能自动监测全院患者药物不良反应,通过移动端和PC端实时反馈,提升用药安全。系统涵盖规则管理、监测报告、系统管理三大模块,确保精准、高效地处理ADR事件。
|
1月前
|
存储 缓存 安全
java 中操作字符串都有哪些类,它们之间有什么区别
Java中操作字符串的类主要有String、StringBuilder和StringBuffer。String是不可变的,每次操作都会生成新对象;StringBuilder和StringBuffer都是可变的,但StringBuilder是非线程安全的,而StringBuffer是线程安全的,因此性能略低。
53 8
|
1月前
|
监控 前端开发 Java
【技术开发】接口管理平台要用什么技术栈?推荐:Java+Vue3+Docker+MySQL
该文档介绍了基于Java后端和Vue3前端构建的管理系统的技术栈及功能模块,涵盖管理后台的访问、登录、首页概览、API接口管理、接口权限设置、接口监控、计费管理、账号管理、应用管理、数据库配置、站点配置及管理员个人设置等内容,并提供了访问地址及操作指南。
|
1月前
|
缓存 算法 Java
本文聚焦于Java内存管理与调优,介绍Java内存模型、内存泄漏检测与预防、高效字符串拼接、数据结构优化及垃圾回收机制
在现代软件开发中,性能优化至关重要。本文聚焦于Java内存管理与调优,介绍Java内存模型、内存泄漏检测与预防、高效字符串拼接、数据结构优化及垃圾回收机制。通过调整垃圾回收器参数、优化堆大小与布局、使用对象池和缓存技术,开发者可显著提升应用性能和稳定性。
52 6
|
1天前
|
Java
Java—多线程实现生产消费者
本文介绍了多线程实现生产消费者模式的三个版本。Version1包含四个类:`Producer`(生产者)、`Consumer`(消费者)、`Resource`(公共资源)和`TestMain`(测试类)。通过`synchronized`和`wait/notify`机制控制线程同步,但存在多个生产者或消费者时可能出现多次生产和消费的问题。 Version2将`if`改为`while`,解决了多次生产和消费的问题,但仍可能因`notify()`随机唤醒线程而导致死锁。因此,引入了`notifyAll()`来唤醒所有等待线程,但这会带来性能问题。
Java—多线程实现生产消费者