JVM - 深入剖析字符串常量池

简介: JVM - 深入剖析字符串常量池

20200708153417241.png

字符串常量池

位置的变更

  • Jdk1.6及之前: JVM存在永久代, 运行时常量池在永久代,运行时常量池包含字符串常量池
  • Jdk1.7:有永久代,但已经逐步“去永久代”,字符串常量池从永久代里的运行时常量池分离到堆里
  • Jdk1.8及之后: 无永久代,变成了元空间,运行时常量池在元空间,字符串常量池里依然在堆里


20200708180505584.png


看 1.8 , 疯狂的intern, 抛出了 heap oom ,由此可以推断出 1.8中的字符串常量池 是在堆中。


如果是1.6 ,会抛出 OutOfMemoryError: PermGen space ,因为1.6中 字符串常量池在永久代中。


JVM对字符串常量池的优化


字符串的分配,和其他对象的分配一样,同样也需要耗费时间和空间,作为最基础的数据类型,大量频繁的常讲字符串,极大程度上影响了程序的性能。


JVM为了提高性能和减少内存开销,在实例化字符串常量池的时候进行了一些优化,主要有一下几点


1. 为字符串开辟一个字符串常量池,用于缓存相同的字符串,类似于环村区域

2. 创建字符串常量时,首先要查询字符串常量池中是否存在该字符串

3. 如若存在该字符串,返回引用实例。 不存在时,实例化该字符串并放入缓存池中。


字符串的常见创建方式 (1.7+)


注意JDK的版本 ,这里讨论的是1.7+

直接赋值字符串

String s = "artisan";  // s指向常量池中的引用


这种方式创建的字符串对象,只会在常量池中 。

因为有"artisan"这个字面量,创建对象s的时候,JVM会先去常量池中通过 equals(key) 方法,判断是否有相同的对象


  • 若有,直接返回该对象在常量池中的引用
  • 若没有,则会在常量池中创建一个新对象,再返回引用


20200711144532618.png


new String()

String s1 = new String("artisan");  // s1指向内存中的对象引用


这种方式会保证字符串常量池和堆中都有这个对象,没有就创建,最后返回堆内存中的对象引用。

步骤大致如下

因为有"artisan"这个字面量,所以会先检查字符串常量池中是否存在字符串"artisan"


  • 不存在,先在字符串常量池里创建一个字符串对象;再去内存中创建一个字符串对象"artisan";
  • 存在的话,就直接去堆内存中创建一个字符串对象"zhuge";
  • 最后,将内存中的引用返回

2020071114474770.png

intern

String s1 = new String("artisan");
      String s2 = s1.intern();
      System.out.println(s1 == s2);  //false


String中的intern方法是一个 native 的方法,当调用 intern方法时,如果池已经包含一个等于此String对象的字符串(用equals(oject)方法确定),则返回池中的字符串, 否则,将intern返回的引用指向当前字符串 s1 。


jdk1.6版本需要将 s1 复制到字符串常量池里


20200711145228989.png

经典面试题

下列代码创建几个对象

    public static void main(String[] args) {
        String s1 = new String("he") + new String("llo");
        String s2 = s1.intern();
        System.out.println(s1 == s2);
    }

20200709001639877.png

对于JDK1.6 , 字符串常量池位于永久代 。

new String("he") + new String("llo")


毫无疑问,堆内存中有两个,但是JDK


JDK 1.6运行结果 false



20200709000639506.png

20200709001709461.png

20200709001955555.png


案例

    String s0="artisan";
        String s1="artisan";
        String s2="arti" + "san";
        System.out.println( s0==s1 ); //true
        System.out.println( s0==s2 ); //true


s0和s1中的”artisan”都是字符串常量,它们在编译期就被确定了,所以s0==s1为true;


而”arti”和”san”也都是字符串常量,当一个字 符串由多个字符串常量连接而成时,它自己肯定也是字符串常量,所以s2也同样在编译期就被优化为一个字符串常量"artisan",所以s2也是常量池中” artisan”的一个引用。


所以我们得出s0==s1==s2


案例

再看看这个

String  s  =  "a" + "b" + "c";  //就等价于String s = "abc";
String  a  =  "a";
String  b  =  "b";
String  c  =  "c";
String  s1  =   a  +  b  +  c;


s1 这个就不一样了,可以通过观察其JVM指令码发现s1的"+"操作会变成如下操作:


20200711151954208.png


StringBuilder temp = new StringBuilder();
temp.append(a).append(b).append(c);
String s = temp.toString();


看看StringBuilder#toString ,其实就是new String , 堆中分配内存地址


20200711152620645.png


案例

        String s0="artisan";
        String s1=new String("artisan");
        String s2="arti" + new String("san");
        System.out.println( s0==s1 );// false
        System.out.println( s0==s2 );// false
        System.out.println( s1==s2 );// false


用new String() 创建的字符串不是常量,不能在编译期就确定,所以new String() 创建的字符串不放入常量池中,它们有自己的地址空间。


s0还是常量池 中"artisan”的引用,s1因为无法在编译期确定,所以是运行时创建的新对象”artisan”的引用,s2因为有后半部分 new String(”san”)所以也无法在编译期确定,所以也是一个新创建对象”artisan”的引用;


明白了这些也就知道为何都是false了


案例

        String a = "a1";
        String b = "a" + 1;
        System.out.println(a == b); // true
        String a = "atrue";
        String b = "a" + "true";
        System.out.println(a == b); // true
        String a = "a3.4";
        String b = "a" + 3.4;
        System.out.println(a == b); // true


JVM对于字符串常量的"+“号连接,将在程序编译期,JVM就将常量字符串的”+“连接优化为连接后的值,拿"a” + 1来说,经编译器优化后在class中就已经是a1。

在编译期其字符串常量的值就确定下来,故上面程序最终的结果都为true。


案例


String a = "ab";
        String bb = "b";
        String b = "a" + bb;
        System.out.println(a == b); // false



JVM对于字符串引用,由于在字符串的"+"连接中,有字符串引用存在,而引用的值在程序编译期是无法确定的,即"a" + bb无法被编译器优化,只有在程序运行期来动态分配并将连接后的新地址赋给b。所以上面程序的结果也就为false。


案例

String a = "ab";
        final String bb = "b";
        String b = "a" + bb;
        System.out.println(a == b); // true


和示例4中唯一不同的是bb字符串加了final修饰,对于final修饰的变量,它在编译时被解析为常量值的一个本地拷贝存储到自己的常量池中或嵌入到它的字节码流中。所以此时的"a" + bb和"a" + "b"效果是一样的。故上面程序的结果为true。


案例

       String a = "ab";
        final String bb = getBB();
        String b = "a" + bb;
        System.out.println(a == b); // false
    private static String getBB()
    {
        return "b";
    }


JVM对于字符串引用bb,它的值在编译期无法确定,只有在程序运行期调用方法后,将方法的返回值和"a"来动态连接并分配地址为b,故上面 程序的结果为false。


案例

//字符串常量池:"计算机"和"技术"     堆内存:str1引用的对象"计算机技术"
//堆内存中还有个StringBuilder的对象,但是会被gc回收,StringBuilder的toString方法会new String(),这个String才是真正返回的对象引用 
String str1 = new StringBuilder("计算机").append("技术").toString();   //没有出现"计算机技术"字面量,所以不会在常量池里生成"计算机技术"对象
 System.out.println(str1 == str1.intern());  //true
//"计算机技术" 在池中没有,但是在heap中存在,则intern时,会直接返回该heap中的引用
//字符串常量池:"ja"和"va"     堆内存:str1引用的对象"java"
//堆内存中还有个StringBuilder的对象,但是会被gc回收,StringBuilder的toString方法会new String(),这个String才是真正返回的对象引用
        String str1 = new StringBuilder("ja").append("va").toString();    //没有出现"java"字面量,所以不会在常量池里生成"java"对象
        System.out.println(str1 == str1.intern());  //false
//java是关键字,在JVM初始化的相关类里肯定早就放进字符串常量池了
        String s1 = new String("test");
        System.out.println(s1 == s1.intern());   //false
//"test"作为字面量,放入了池中,而new时s1指向的是heap中新生成的string对象,s1.intern()指向的是"test"字面量之前在池中生成的字符串对象
        String s2 = new StringBuilder("abc").toString();
        System.out.println(s2 == s2.intern());  //false
//同上


相关文章
|
存储 Java
【面试题精讲】JVM-方法区-字符串常量池
【面试题精讲】JVM-方法区-字符串常量池
|
存储 Java
面试题系列第6篇:JVM字符串常量池及String的intern方法详解?
面试题系列第6篇:JVM字符串常量池及String的intern方法详解?
119 0
面试题系列第6篇:JVM字符串常量池及String的intern方法详解?
|
18天前
|
缓存 Prometheus 监控
Elasticsearch集群JVM调优设置合适的堆内存大小
Elasticsearch集群JVM调优设置合适的堆内存大小
151 1
|
2月前
|
存储 安全 Java
jvm 锁的 膨胀过程?锁内存怎么变化的
【10月更文挑战第3天】在Java虚拟机(JVM)中,`synchronized`关键字用于实现同步,确保多个线程在访问共享资源时的一致性和线程安全。JVM对`synchronized`进行了优化,以适应不同的竞争场景,这种优化主要体现在锁的膨胀过程,即从偏向锁到轻量级锁,再到重量级锁的转变。下面我们将详细介绍这一过程以及锁在内存中的变化。
40 4
|
7天前
|
存储 监控 算法
深入探索Java虚拟机(JVM)的内存管理机制
本文旨在为读者提供对Java虚拟机(JVM)内存管理机制的深入理解。通过详细解析JVM的内存结构、垃圾回收算法以及性能优化策略,本文不仅揭示了Java程序高效运行背后的原理,还为开发者提供了优化应用程序性能的实用技巧。不同于常规摘要仅概述文章大意,本文摘要将简要介绍JVM内存管理的关键点,为读者提供一个清晰的学习路线图。
|
16天前
|
Java
JVM内存参数
-Xmx[]:堆空间最大内存 -Xms[]:堆空间最小内存,一般设置成跟堆空间最大内存一样的 -Xmn[]:新生代的最大内存 -xx[use 垃圾回收器名称]:指定垃圾回收器 -xss:设置单个线程栈大小 一般设堆空间为最大可用物理地址的百分之80
|
17天前
|
Java
JVM运行时数据区(内存结构)
1)虚拟机栈:每次调用方法都会在虚拟机栈中产生一个栈帧,每个栈帧中都有方法的参数、局部变量、方法出口等信息,方法执行完毕后释放栈帧 (2)本地方法栈:为native修饰的本地方法提供的空间,在HotSpot中与虚拟机合二为一 (3)程序计数器:保存指令执行的地址,方便线程切回后能继续执行代码
18 3
|
18天前
|
存储 缓存 监控
Elasticsearch集群JVM调优堆外内存
Elasticsearch集群JVM调优堆外内存
42 1
|
27天前
|
Arthas 监控 Java
JVM进阶调优系列(9)大厂面试官:内存溢出几种?能否现场演示一下?| 面试就那点事
本文介绍了JVM内存溢出(OOM)的四种类型:堆内存、栈内存、元数据区和直接内存溢出。每种类型通过示例代码演示了如何触发OOM,并分析了其原因。文章还提供了如何使用JVM命令工具(如jmap、jhat、GCeasy、Arthas等)分析和定位内存溢出问题的方法。最后,强调了合理设置JVM参数和及时回收内存的重要性。
|
25天前
|
Java Linux Windows
JVM内存
首先JVM内存限制于实际的最大物理内存,假设物理内存无限大的话,JVM内存的最大值跟操作系统有很大的关系。简单的说就32位处理器虽然可控内存空间有4GB,但是具体的操作系统会给一个限制,这个限制一般是2GB-3GB(一般来说Windows系统下为1.5G-2G,Linux系统下为2G-3G),而64bit以上的处理器就不会有限制。
19 1