String 既然能做性能调优,我直呼内行(一)

简介: 莫慌,今天给大家见识一下不一样的 String,从根上拿捏直达 G 点。并且码哥分享一个例子:通过性能调优我们能实现百兆内存轻松存储几十 G 数据。String对象是我们每天都「摸」的对象类型,但是她的性能问题我们却总是忽略。爱她,不能只会简单一起玩耍,要深入了解String 的内心深处,做一个「心有猛虎,细嗅蔷薇」的暖男。

通过以下几点分析,我们一步步揭开她的衣裳,直达内心深处,提升一个 Level,让 String 直接起飞:


  1. 字符串对象的特性;


  1. String 的不可变性;


  1. 大字符串构建技巧;


  1. String.intern 节省内存;


  1. 字符串分割技巧;


String 身体解密


想要深入了解,就先从基本组成开始……


「String 缔造者」对 String 对象做了大量优化来节省内存,从而提升 String 的性能:


image.png


Java 6 及之前


数据存储在 char[]数组中,String通过 offsetcount两个属性定位 char[] 数据获取字符串。


这样可以高效快速的定位并共享数组对象,并且节省内存,但是有可能导致内存泄漏。


共享 char 数组为啥可能会导致内存泄漏呢?


String(int offset, int count, char value[]) {
    this.value = value;
    this.offset = offset;
    this.count = count;
}
public String substring(int beginIndex, int endIndex) {
    //check boundary
    return  new String(offset + beginIndex, endIndex - beginIndex, value);
}


调用 substring() 的时候虽然创建了新的字符串,但字符串的值 value 仍然指向的是内存中的同一个数组,如下图所示:


image.png


如果我们仅仅是用 substring 获取一小段字符,而原始 string字符串非常大的情况下,substring 的对象如果一直被引用。


此时 String 字符串也无法回收,从而导致内存泄露。


如果有大量这种通过 substring 获取超大字符串中一小段字符串的操作,会因为内存泄露而导致内存溢出。


JDK7、8


去掉了 offsetcount两个变量,减少了 String 对象占用的内存。


substring 源码:


public String(char value[], int offset, int count) {
    this.value = Arrays.copyOfRange(value, offset, offset + count);
}
public String substring(int beginIndex, int endIndex) {
    int subLen = endIndex - beginIndex;
    return new String(value, beginIndex, subLen);
}


substring() 通过 new String() 返回了一个新的字符串对象,在创建新的对象时通过 Arrays.copyOfRange() 深度拷贝了一个新的字符数组。


如下图所示:


image.png


String.substring 方法不再共享 char[]数组的数据,解决了可能内存泄漏的问题。


Java 9


char[]字段改为 byte[],新增 coder属性。


码哥,为什么这么改呢?


一个 char 字符占 2 个字节,16 位。存储单字节编码内的字符(占一个字节的字符)就显得非常浪费。


为了节约内存空间,于是使用了 1 个字节占 8 位的 byte 数组来存放字符串。


勤俭节约的女神,谁不爱……


新属性 coder 的作用是:在计算字符串长度或者使用 indexOf()方法时,我们需要根据编码类型来计算字符串长度。


coder 的值分别表示不同编码类型:


  • 0:表示使用 Latin-1 (单字节编码);


  • 1:使用UTF-16


String 的不可变性


了解了String 的基本组成之后,发现 String 还有一个比外在更性感的特性,她被 final关键字修饰,char 数组也是。


image.png


我们知道类被 final 修饰代表该类不可继承,而 char[]final+private 修饰,代表了 String 对象不可被更改。


String 对象一旦创建成功,就不能再对它进行改变


final 修饰的好处


安全性


当你在调用其他方法时,比如调用一些系统级操作指令之前,可能会有一系列校验。


如果是可变类的话,可能在你校验过后,它的内部的值又被改变了,这样有可能会引起严重的系统崩溃问题。


高性能缓存


String不可变之后就能保证 hash值得唯一性,使得类似 HashMap容器才能实现相应的 key-value 缓存功能。


实现字符串常量池


由于不可变,才得以实现字符串常量池。


字符串常量池指的是在创建字符串的时候,先去「常量池」查找是否创建过该「字符串」;


如果有,则不会开辟新空间创建字符串,而是直接把常量池中该字符串的引用返回给此对象。


创建字符串的两种方式:


  • String str1 = “码哥字节”;


  • String str2 = new String(“码哥字节”);


当代码中使用第一种方式创建字符串对象时,JVM 首先会检查该对象是否在字符串常量池中,如果在,就返回该对象引用。


否则新的字符串将在常量池中被创建,并返回该引用。


这样可以减少同一个值的字符串对象的重复创建,节约内存


第二种方式创建,在编译类文件时,"码哥字节" 字符串将会放入到常量结构中,在类加载时,“码哥字节" 将会在常量池中创建;


在调用 new 时,JVM 命令将会调用 String 的构造函数,在堆内存中创建一个 String 对象,同时该对象指向「常量池」中的“码哥字节”字符串,str 指向刚刚在堆上创建的 String 对象;


如下图:


image.png


什么是对象和对象引用呀?


str 属于方法栈的字面量,它指向堆中的 String 对象,并不是对象本。


对象在内存中是一块内存地址,str 则是指向这个内存地址的引用。


也就是说 str 并不是对象,而只是一个对象引用。


码哥,字符串的不可变到底指的是什么呀?


String str = "Java";
str = "Java,yyds"


第一次赋值 「Java」,第二次赋值「Java,yyds」,str 值确实改变了,为什么我还说 String 对象不可变呢?


这是因为 str 只是 String 对象的引用,并不是对象本身。


真正的对象依然还在内存中,没有被改变。

相关文章
|
7月前
|
存储 缓存 安全
String 既然能这样性能调优,我直呼内行(文末送书)
String 既然能这样性能调优,我直呼内行(文末送书)
76 1
JAVA String.format的使用以及StringBuilder和String ‘+’的性能对比
JAVA String.format的使用以及StringBuilder和String ‘+’的性能对比
633 0
JAVA String.format的使用以及StringBuilder和String ‘+’的性能对比
|
C# C++ 索引
30天C#基础巩固------this,base,string中的方法,StringBuilder性能
30天C#基础巩固------this,base,string中的方法,StringBuilder性能
164 0
30天C#基础巩固------this,base,string中的方法,StringBuilder性能
JVM系列之:String.intern的性能
JVM系列之:String.intern的性能
JVM系列之:String.intern的性能
|
安全 Java API
浅谈 String StringBuilder StringBuffer 之性能和线程安全
浅谈 String StringBuilder StringBuffer 之性能和线程安全
浅谈 String StringBuilder StringBuffer 之性能和线程安全
|
存储 Java
String性能提升10倍的几个方法!(源码+原理分析)下
String性能提升10倍的几个方法!(源码+原理分析)
144 0
String性能提升10倍的几个方法!(源码+原理分析)下
|
存储 缓存 安全
String性能提升10倍的几个方法!(源码+原理分析)上
String性能提升10倍的几个方法!(源码+原理分析)
145 0
String性能提升10倍的几个方法!(源码+原理分析)上
|
测试技术
艾伟_转载:string类与StringBuilder类性能比较
我们都知道StringBuilder的性能要比string类,是否具体测试过呢,我这里就给出这个程序供测试,一个是Timing类,用来计算时间的。另外一个类就是分别建立string,和stringbuider 类建立100,1000,10000,100000字符连接进行比较。
832 0