Java报错系列——split

简介:

前言

在Java项目中,比如我们经常使用String的split方法对文本进行处理;在Map/Reduce中,我们也需要对HDFS文件读取后对line进行分割,也涉及到split。前几天,本来“好好的”程序,突然在split处报错,后来才知道由于有一条“脏数据”导致split“超出”了预期,才导致了“不可能发生的异常”就这样发生了~不过也说明了一些基础知识真的很重要,于是把String类的split源码阅读了下,发现一个“小小的”split也挺多内容的。


String中的split

在String中,split方法如下:


wKiom1V5V4vB-UifAABPIVl1KsA500.jpg


wKioL1V5WTKw1LVgAABipXk0ufk248.jpg

可见,split的核心在于Pattern.compile(regex).split(this, limit);


Java提供Pattern,Matcher用于支持正则,可以看一个例子:


wKiom1V5WHjQ18udAAEmAHAt7yY052.jpg


运行结果是:

0,1

||

3,4

|ab|

7,8

|cef|

8,9

||

11,12

|kk|

13,14

|a|


需要注意的是:


通过Pattern给定一个模式(regex),Matcher可以不断(find)匹配文本,并能找到每

一个匹配上的内容的开始(start),结束(end)索引【结束索引说白了,就是start+匹配

文本的长度】。


subSequence(begin,end)是一个“包头不包尾”的方法



问题:

在上面的while中,我们能到达的最大的索引处,就是最后一个end,而注意到很有可能

这个end之后还有内容,那么该如何处理呢?

如果一个正则将文本split成了几部分,我们只需要一部分呢?

如果分成的部分中有“”空字符串,split又是如何处理的?



我们可以带着这些问题来看看源码:


wKioL1V5XurQ1CqfAAJMp4wDURg874.jpg


wKioL1V5Yt3QNxZ5AAIHWzkZ2QE768.jpg


首先来看,limit对matchLimited的影响:


limit < 0 或者 split(regex)等价于split(regex,0)  ==>  matchLimited:false

limit > 0                           ==>  matchLimited:true



其实,while的意思就是说,如果limit>0的话,matchList只加入有限的内容。

如果整个文本没有匹配上,那么返回一个长度为1,内容为其本身的数组。

如果limit为0,那么会将最后匹配的那些空串删除掉直至非空串为止在返回结果。




结论

在实际应用中,我们一般使用这样的:

str.split(",")    此时limit=0,只需要注意会去掉最后的空串即可 

str.split(",",-1)  此时会保留最后的空串

str.split(",",2)   限制匹配的个数,同时保留最后的空串


本文转自zfz_linux_boy 51CTO博客,原文链接:http://blog.51cto.com/zhangfengzhe/1661091,如需转载请自行联系原作者


相关文章
|
22天前
|
Java
Java 字符串分割split空字符串丢失解决方案
Java 字符串分割split空字符串丢失解决方案
|
2月前
|
Java
Java String split()方法详细教程
Java String split()方法详细教程
25 0
|
2月前
启动报错:java.nio.charset.MalformedInputException: Input length = 1
启动报错:java.nio.charset.MalformedInputException: Input length = 1
16 0
|
2月前
|
Java 编译器
有关电脑中idea编译报错问题java: No implementation was created for AdminUserConverter due to having a problem in
有关电脑中idea编译报错问题java: No implementation was created for AdminUserConverter due to having a problem in
34 0
|
19天前
|
Java Maven
【Java报错】显示错误“Error:java: 程序包org.springframework.boot不存在“
【Java报错】显示错误“Error:java: 程序包org.springframework.boot不存在“
37 3
|
4月前
|
Linux Windows
FinalShell连接Linux虚拟机报错java.net.ConnectException: Connection timed out: connect(亲测有效)
FinalShell连接Linux虚拟机报错java.net.ConnectException: Connection timed out: connect(亲测有效)
179 0
|
1天前
|
Java 微服务
IDEA报错There is insufficient memory for the Java Runtime Environment to continue.
IDEA报错There is insufficient memory for the Java Runtime Environment to continue.
|
3天前
|
JavaScript Serverless API
Serverless 应用引擎操作报错合集之在Serverless 应用引擎中,FC3.0读取response body的时候出现错误提示"Caused by: java.io.IOException: closed"如何解决
Serverless 应用引擎(SAE)是阿里云提供的Serverless PaaS平台,支持Spring Cloud、Dubbo、HSF等主流微服务框架,简化应用的部署、运维和弹性伸缩。在使用SAE过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
17 3
|
7天前
|
Java Linux 应用服务中间件
Linux启动tomcat报错:Neither the JAVA_HOME nor the JRE_HOME environment variable is defined
Linux启动tomcat报错:Neither the JAVA_HOME nor the JRE_HOME environment variable is defined
7 0
|
12天前
|
Java Spring
java.lang.ClassNotFoundException: javax.xml.bind.DatatypeConverter 报错的解决办法
java.lang.ClassNotFoundException: javax.xml.bind.DatatypeConverter 报错的解决办法
15 0