String intern()方法

简介: 美团点评

Q1:String s = new String("cyou");定义了几个对象。

Q2:如何理解 String.intern()方法?


A1:若常量池中已经存在 “cyou”,则直接引用,也就是此时只会创建一个对象,如果常量池中不存在 “cyou”,则先创建后引用,也就是有两个。


A2:当一个 String 实例调用intern()方法时,JVM 会查找常量池中是否有相同 Unicode 的字符串常量,如果有,则返回其的引用,如果没有,则在常量池中增加一个 Unicode 等于 s 的字符串并返回它的引用;

两个答案看上去没有任何问题,但是,仔细想想好像哪里不对呀。


按照上面的回答,就是说 new String 会检查常量池,如果有的话就直接引用,如果不存在就要在常量池创建一个,那么还要 intern 干啥?难道以下代码是没有意义的吗?


String s = new String("cyou").intern();


如果,每当我们使用 new 创建字符串的时候,都会到字符串池检查,然后返回。那么以下代码也应该输出结果都是 true?

String s1 = "cyou”
String s2 = new String("cyou"); 
String s3 = new String("cyou").intern(); 
System.out.println(s1 == s2); //false 
System.out.println(s1 == s3); // true
以上代码输出结果为(base jdk1.8):
我们用另一种方式在验证一边
System.identityHashCode();//返回与默认方法hashCode返回的相同的哈希码,无论给定对象的类是否被覆盖
也就是说你可以理解这个方法返回的就是“内存地址“
System.out.println(System.identityHashCode(s1)); //2016447921
System.out.println(System.identityHashCode(s2)); //666988784
System.out.println(System.identityHashCode(s3)); //2016447921
经过打印我们发现到  s1的内存地址和s2的内存地址确实不一样   s1的内存地址和s3的内存地址是一样的。


字面量和运行时常量池

JVM 为了提高性能和减少内存开销,在实例化字符串常量的时候进行了一些优化。为了减少在 JVM 中创建的字符串的数量,字符串类维护了一个字符串常量池。


在 JVM 运行时区域的方法区中,有一块区域是运行时常量池,主要用来存储编译期生成的各种字面量符号引用


在 java 代码被 javac 编译之后,文件结构中是包含一部分 Constant pool(常量池)的。比如以下代码:


image.pngimage.gif

image.png

s就是符号引用,cyou就是字面量。class文件中的常量池部分的内容,会在运行期被运行时常量池加载进去。


new String创建了几个对象

String s = new String("cyou");

这段代码中,我们可以知道的是,在编译期,符号引用 s 和字面量 cyou会被加入到 Class 文件的常量池中,然后在类加载阶段,这两个常量会进入常量池。


但是,这个“进入”过程,并不会直接把所有类中定义的常量全部都加载进来,而是会做个比较,如果需要加到字符串常量池中的字符串已经存在,那么就不需要再把字符串字面量加载进来了。


所以,当我们说<若常量池中已经存在 “cyou”,则直接引用,也就是此时只会创建一个对象>说的就是这个字符串字面量在字符串池中被创建的过程。


说完了编译期的事儿了,该到运行期了,在运行期,new String(“cyou”);执行到的时候,是要在 Java 堆中创建一个字符串对象的,而这个对象所对应的字符串字面量是保存在字符串常量池中的。


但是,String s = new String(“cyou”);,对象的符号引用 s 是保存在Java虚拟机栈上的,他保存的是堆中刚刚创建出来的的字符串对象的引用。


所以String s1 = new String("cyou");  String s2 = new String("cyou");


System.out.println(s1 == s2); 为false   == 比较的是 s1 和 s2 在堆中创建的对象的地址

image.png

运行时常量池的动态扩展

当一个String实例调用intern()方法时,JVM 会查找常量池中是否有相同 Unicode 的字符串常量,如果有,则返回其的引用,如果没有,则在常量池中增加一个 Unicode 等于 str 的字符串并返回它的引用;


intern()有两个作用,第一个是将字符串字面量放入常量池(如果池没有的话),第二个是返回这个常量的引用。


String s1 = "cyou";


String s2 = new String("cyou");


String s3 = new String("cyou").intern();


System.out.println(s1 == s2); //false


System.out.println(s1 == s3);  //true

image.png

对于String s3 = new String("cyou").intern();,在不调intern情况,s3 指向的是 JVM 在堆中创建的那个对象的引用的。但是当执行了 intern 方法时,s3 将指向字符串常量池中的那个字符串常量。


intern 的正确用法

有没有发现,在String s3 = new String("cyou").intern();中,其实 intern 是多余的?


因为就算不用 intern,cyou作为一个字面量也会被加载到 Class 文件的常量池,进而加入到运行时常量池中,为啥还要多此一举呢?到底什么场景下才会用到 intern 呢?

在解释这个之前,我们先来看下以下代码:

image.png

通过idea查看class文件

image.png

可以发现,同样是字符串拼接,s3 和s4 在经过编译器编译后的实现方式并不一样。s3 被转化成 StringBuilder 及 append,而 s4 被直接拼接成新的字符串。


String s4 = s1 + s2; 经过编译之后,常量池中是有两个字符串常量的分别是 chang、you(其实 chang和 you是String s1 = “chang”;和String s2 = “you”;定义出来的),拼接结果changyou并不在常量池中。

image.png

image.png

如果代码只有String s4 = “chang” + “you”;,那么常量池中将只有 changyou而没有 chang和 you。

image.png

image.png

究其原因,是因为常量池要保存的是已确定的字面量值。也就是说,对于字符串的拼接,纯字面量和字面量的拼接,会把拼接结果作为常量保存到字符串。


如果在字符串拼接中,有一个参数是非字面量,而是一个变量的话,整个拼接操作会被编译成StringBuilder.append,这种情况编译器是无法知道其确定值的。只有在运行期才能确定。


那么,有了这个特性了,intern 就有用武之地了。那就是很多时候,我们在程序中用到的字符串是只有在运行期才能确定的,在编译期是无法确定的,那么也就没办法在编译期被加入到常量池中。


这时候,对于那种可能经常使用的字符串,使用 intern 进行定义,每次 JVM 运行到这段代码的时候,就会直接把常量池中该字面值的引用返回,这样就可以减少大量字符串对象的创建了。


如一美团点评团队的《深入解析String#intern》文中举的一个例子:

static final int MAX = 1000 * 10000;
static final String[] arr = new String[MAX];
public static void main(String[] args) throws Exception {
    Integer[] DB_DATA = new Integer[10];
    Random random = new Random(10 * 10000);
    for (int i = 0; i < DB_DATA.length; i++) {
        DB_DATA[i] = random.nextInt();
    }
    for (int i = 0; i < MAX; i++) {
         arr[i] = new String(String.valueOf(DB_DATA[i % DB_DATA.length])).intern();
    }
}

在以上代码中,我们明确的知道,会有很多重复的相同的字符串产生,但是这些字符串的值都是只有在运行期才能确定的。所以,只能我们通过intern显示的将其加入常量池,这样可以减少很多字符串的重复创建。


总结

我们再回到文章开头那个疑惑:按照上面的两题的回答,就是说new String也会检查常量池,如果有的话就直接引用,如果不存在就要在常量池创建一个,那么还要intern干啥?难道以下代码是没有意义的吗?

String s = new String("cyou").intern();

new String 所谓的“如果有的话就直接引用”,指的是Java堆中创建的String对象中包含的字符串字面量直接引用字符串池中的字面量对象。也就是说,还是要在堆里面创建对象的。


而intern中说的“如果有的话就直接返回其引用”,指的是会把字面量对象的引用直接返回给定义的对象。这个过程是不会在 Java 堆中再创建一个 String 对象的。


所以上面的代码是无意义的。

相关文章
|
3月前
for循环和String类下方法的一个练习题
for循环和String类下方法的一个练习题
54 1
|
1月前
|
Java
【编程基础知识】(讲解+示例实战)方法参数的传递机制(值传递及地址传递)以及String类的对象的不可变性
本文深入探讨了Java中方法参数的传递机制,包括值传递和引用传递的区别,以及String类对象的不可变性。通过详细讲解和示例代码,帮助读者理解参数传递的内部原理,并掌握在实际编程中正确处理参数传递的方法。关键词:Java, 方法参数传递, 值传递, 引用传递, String不可变性。
57 1
【编程基础知识】(讲解+示例实战)方法参数的传递机制(值传递及地址传递)以及String类的对象的不可变性
|
5月前
正则表达式(有关String当中,有关正则的方法)
正则表达式(有关String当中,有关正则的方法)
|
18天前
|
JavaScript 前端开发 开发者
|
2月前
|
JavaScript 前端开发 API
javaScript中常用的String方法以及注意点总结
本文总结了JavaScript中常用的String对象的方法及其注意事项,包括大小写转换、字符获取、子字符串截取、字符串拼接、去除空格、替换、分割以及查找字符串中字符的索引等操作。提供了每种方法的使用示例代码,帮助理解它们的具体用法和差异。
38 2
|
3月前
|
JavaScript 算法 前端开发
JS算法必备之String常用操作方法
这篇文章详细介绍了JavaScript中字符串的基本操作,包括创建字符串、访问特定字符、字符串的拼接、位置查找、大小写转换、模式匹配、以及字符串的迭代和格式化等方法。
JS算法必备之String常用操作方法
|
3月前
|
XML Java API
List与String相互转化方法汇总
本文汇总了List与String相互转化的多种方法,包括使用`String.join()`、`StringBuilder`、Java 8的Stream API、Apache Commons Lang3的`StringUtils.join()`以及Guava的`Joiner.on()`方法实现List转String;同时介绍了使用`split()`方法、正则表达式、Apache Commons Lang3的`StringUtils.split()`及Guava的`Splitter.on()`方法实现String转List。
105 1
List与String相互转化方法汇总
|
3月前
|
Java API 索引
【Java基础面试二十四】、String类有哪些方法?
这篇文章列举了Java中String类的常用方法,如`charAt()`、`substring()`、`split()`、`trim()`、`indexOf()`、`lastIndexOf()`、`startsWith()`、`endsWith()`、`toUpperCase()`、`toLowerCase()`、`replaceFirst()`和`replaceAll()`,并建议面试时展示对这些方法的熟悉度,同时深入理解部分方法的源码实现。
【Java基础面试二十四】、String类有哪些方法?
|
3月前
|
数据安全/隐私保护
作用域通信对象:session用户在登录时通过`void setAttribute(String name,Object value)`方法设置用户名和密码。点击登录按钮后,跳转到另外一个页面显示用户
该博客文章通过示例演示了如何使用session对象的`setAttribute`和`getAttribute`方法在不同页面间传递和显示用户的用户名和密码信息,并说明了如何设置会话的有效期。
作用域通信对象:session用户在登录时通过`void setAttribute(String name,Object value)`方法设置用户名和密码。点击登录按钮后,跳转到另外一个页面显示用户
|
2月前
|
Java 索引
java基础扫盲-String类常用的方法
java基础扫盲-String类常用的方法
下一篇
无影云桌面