String 既然能做性能调优,我直呼内行(二)

简介: 接上文。

优化实战


了解了 String 的对象实现原理和特性,是时候要深入女神内心,结合实际场景,如何更上一层楼优化 String 对象的使用。


大字符串如何构建


既然 String 对象是不可变,所以我们在频繁拼接字符串的时候是否意味着创建多个对象呢?


String str = "癞蛤蟆撩青蛙" + "长的丑" + "玩的花";


是不是以为先生成「癞蛤蟆撩青蛙」对象,再生成「癞蛤蟆撩青蛙长的丑」对象,最后生成「癞蛤蟆撩青蛙长得丑玩的花」对象。


实际运行中,只有一个对象生成。


这是为什么呢?


虽然代码写的丑陋,但是编译器自动优化了代码。


再看下面例子:


String str = "小青蛙";
for(int i=0; i<1000; i++) {
     str += i;
}


上面的代码编译后,你可以看到编译器同样对这段代码进行了优化。


Java 在进行字符串的拼接时,偏向使用 StringBuilder,这样可以提高程序的效率。


String str = "小青蛙";
for(int i=0; i<1000; i++) {
            str = (new StringBuilder(String.valueOf(str))).append(i).toString();
}


即使如此,还是循环内重复创建 StringBuilder对象。


敲黑板


所以做字符串拼接的时候,我建议你还是要显示地使用 String Builder 来提升系统性能。


如果在多线程编程中,String 对象的拼接涉及到线程安全,你可以使用 StringBuffer。


运用 intern 节省内存


直接看intern() 方法的定义与源码:


image.png


intern() 是一个本地方法,它的定义中说的是,当调用 intern 方法时,如果字符串常量池中已经包含此字符串,则直接返回此字符串的引用。


否则将此字符串添加到常量池中,并返回字符串的引用。


如果不包含此字符串,先将字符串添加到常量池中,再返回此对象的引用。


什么情况下适合使用 intern() 方法?


Twitter 工程师曾分享过一个 String.intern() 的使用示例,Twitter 每次发布消息状态的时候,都会产生一个地址信息,以当时 Twitter 用户的规模预估,服务器需要 20G 的内存来存储地址信息。


public class Location {
    private String city;
    private String region;
    private String countryCode;
    private double longitude;
    private double latitude;
}


考虑到其中有很多用户在地址信息上是有重合的,比如,国家、省份、城市等,这时就可以将这部分信息单独列出一个类,以减少重复,代码如下:


public class SharedLocation {
  private String city;
  private String region;
  private String countryCode;
}
public class Location {
  private SharedLocation sharedLocation;
  double longitude;
  double latitude;
}


通过优化,数据存储大小减到了 20G 左右。


但对于内存存储这个数据来说,依然很大,怎么办呢?


Twitter 工程师使用 String.intern() 使重复性非常高的地址信息存储大小从 20G 降到几百兆,从而优化了 String 对象的存储。


核心代码如下:


SharedLocation sharedLocation = new SharedLocation();
sharedLocation.setCity(messageInfo.getCity().intern());
sharedLocation.setCountryCode(messageInfo.getRegion().intern());
sharedLocation.setRegion(messageInfo.getCountryCode().intern());


弄个简单例子方便理解:


String a =new String("abc").intern();
String b = new String("abc").intern();
System.out.print(a==b);


输出结果:true


在加载类的时候会在常量池中创建一个字符串对象,内容是「abc」。


创建局部 a 变量时,调用 new Sting() 会在堆内存中创建一个 String 对象,String 对象中的 char 数组将会引用常量池中字符串。


在调用 intern 方法之后,会去常量池中查找是否有等于该字符串对象的引用,有就返回引用。


创建 b 变量时,调用 new Sting() 会在堆内存中创建一个 String 对象,String 对象中的 char 数组将会引用常量池中字符串。


在调用 intern 方法之后,会去常量池中查找是否有等于该字符串对象的引用,有就返回引用给局部变量。


而刚在堆内存中的两个对象,由于没有引用指向它,将会被垃圾回收。


所以 a 和 b 引用的是同一个对象。


字符串分割有妙招


Split() 方法使用了正则表达式实现了其强大的分割功能,而正则表达式的性能是非常不稳定的。


使用不恰当会引起回溯问题,很可能导致 CPU 居高不下。


Java 正则表达式使用的引擎实现是 NFA(Non deterministic Finite Automaton,确定型有穷自动机)自动机,这种正则表达式引擎在进行字符匹配时会发生回溯(backtracking),而一旦发生回溯,那其消耗的时间就会变得很长,有可能是几分钟,也有可能是几个小时,时间长短取决于回溯的次数和复杂度。


所以我们应该慎重使用 Split() 方法,我们可以用String.indexOf()方法代替 Split() 方法完成字符串的分割。


总结与思考


我们从 String 进化历程掌握了她的组成,不断的改变成员变量节约内存。


她的不可变性从而实现了字符串常量池,减少同一个字符串的重复创建,节约内存。


但也是因为这个特性,我们在做长字符串拼接时,需要显示使用 StringBuilder,以提高字符串的拼接性能。


最后,在优化方面,我们还可以使用 intern 方法,让变量字符串对象重复使用常量池中相同值的对象,进而节约内存。


最后,出一个问题给大家,欢迎在评论区留言,点赞对多的将获取码哥赠送的书籍。


通过三种不同的方式创建了三个对象,再依次两两匹配,每组被匹配的两个对象是否相等?代码如下:


String str1 = "abc";
String str2 = new String("abc");
String str3 = str2.intern();
assertSame(str1 == str2);
assertSame(str2 == str3);
assertSame(str1 == str3)
相关文章
|
7月前
|
存储 缓存 安全
String 既然能这样性能调优,我直呼内行(文末送书)
String 既然能这样性能调优,我直呼内行(文末送书)
76 1
JAVA String.format的使用以及StringBuilder和String ‘+’的性能对比
JAVA String.format的使用以及StringBuilder和String ‘+’的性能对比
633 0
JAVA String.format的使用以及StringBuilder和String ‘+’的性能对比
|
C# C++ 索引
30天C#基础巩固------this,base,string中的方法,StringBuilder性能
30天C#基础巩固------this,base,string中的方法,StringBuilder性能
164 0
30天C#基础巩固------this,base,string中的方法,StringBuilder性能
|
存储 缓存 Java
String 既然能做性能调优,我直呼内行(一)
莫慌,今天给大家见识一下不一样的 String,从根上拿捏直达 G 点。 并且码哥分享一个例子:通过性能调优我们能实现百兆内存轻松存储几十 G 数据。 String对象是我们每天都「摸」的对象类型,但是她的性能问题我们却总是忽略。 爱她,不能只会简单一起玩耍,要深入了解String 的内心深处,做一个「心有猛虎,细嗅蔷薇」的暖男。
117 0
String 既然能做性能调优,我直呼内行(一)
JVM系列之:String.intern的性能
JVM系列之:String.intern的性能
JVM系列之:String.intern的性能
|
安全 Java API
浅谈 String StringBuilder StringBuffer 之性能和线程安全
浅谈 String StringBuilder StringBuffer 之性能和线程安全
浅谈 String StringBuilder StringBuffer 之性能和线程安全
|
存储 Java
String性能提升10倍的几个方法!(源码+原理分析)下
String性能提升10倍的几个方法!(源码+原理分析)
144 0
String性能提升10倍的几个方法!(源码+原理分析)下
|
存储 缓存 安全
String性能提升10倍的几个方法!(源码+原理分析)上
String性能提升10倍的几个方法!(源码+原理分析)
145 0
String性能提升10倍的几个方法!(源码+原理分析)上
|
测试技术
艾伟_转载:string类与StringBuilder类性能比较
我们都知道StringBuilder的性能要比string类,是否具体测试过呢,我这里就给出这个程序供测试,一个是Timing类,用来计算时间的。另外一个类就是分别建立string,和stringbuider 类建立100,1000,10000,100000字符连接进行比较。
832 0