Java 中的 String Pool 简介

简介: 本文介绍了 Java 中 String 对象及其存储机制 String Pool 的基本概念,包括字符串引用、构造方法中的内存分配、字符串文字与对象的区别、手工引用、垃圾清理、性能优化,以及 Java 9 中的压缩字符串特性。文章详细解析了 String 对象的初始化、内存使用及优化方法,帮助开发者更好地理解和使用 Java 中的字符串。

在 Java 中

String

对象是我们最常用的对象。

在本文章中,我们主要对 String 对象使用的 String Pool 进行一些简单的介绍。

Java 定义 String 后,String 是存储在 String Pool 中的,以便于加快字符串的访问和处理。

正是有这个方面的访问需求,JVM 为 String 对象在内存中特地开辟了一个存储区域来加快对 String 对象的访问,这个特定的内存区域就是我们说的

String Pool

了。

字符串引用(String Interning)

我们都知道

Strings

在 Java 中是不可变的( immutable),因此 JVM 可以通过访问这个字符串的引用,或者我们可以借用指针的这个概念来访问 String 字符串。

通过指针访问字符串值的这个过程就可以称为引用(interning)。

当我们在内存中创建一个字符串的时候,JVM 将会根据你创建字符串的值在内存中进行查找有没有和你创建值相同的 String 对象已经被创建了。

如果,JVM 找到了这个对象的话,JVM 就将会为你创建的对象返回已经存在 String 的地址的引用,而不会继续申请新的内存空间,以便于提高内存的利用率。

如果,JVM 没有找到与创建对象相同的值的话,JVM 将会申请内存空间并且创建这个 String 对象,然后将新创建的这个 String 的对象进行返回,这个过程就称为引用(interned)。

让我们使用下面的方法进行验证:

ini

代码解读

复制代码

    @Test
    public void whenCreatingConstantStrings_thenTheirAddressesAreEqual() {
        String constantString1 = "HoneyMoose";
        String constantString2 = "HoneyMoose";

        assertThat(constantString1).isSameAs(constantString2);
    }

上面的方法将会通过,原因是 constantString2 在创建的时候,将会得到的是 constantString1 内存地址的引用。

因此上面 2 个字符串是完全相同的。

String 构造方法中的内存分配

因为构造 String 对象有几种不同的方法,我们可以通过直接赋值的方式构造 String 对象,我们也可以通过 new 的方式来构造一个 String 对象。

在这里我们需要说如果使用

new

这个关键字来构造的 String对象。

简单来说,如果你使用了 new 这个关键字来构造 String 对象的话,不管 String 对象中的值是不是相同,JVM 都会为构造的对象开辟存储空间,这个存储空间在 JVM 的 heap 中。

因此每个使用 new 构造的 String 对象都会有自己的内存地址。

让我们来看看下面的代码:

typescript

代码解读

复制代码

    @Test
    public void whenCreatingStringsWithTheNewOperator_thenTheirAddressesAreDifferent() {
        String newString1 = new String("HoneyMoose");
        String newString2 = new String("HoneyMoose");

        assertThat(newString1).isNotSameAs(newString2);

        logger.info("newString1 Address: {}", System.identityHashCode(newString1));
        logger.info("newString2 Address: {}", System.identityHashCode(newString2));
    }

上面的代码将会输出:

ini

代码解读

复制代码

16:03:38.916 [main] INFO  c.o.stringpool.StringPoolUnitTest - newString1 Address: 429075478
16:03:38.919 [main] INFO  c.o.stringpool.StringPoolUnitTest - newString2 Address: 1802066694

我们可以看到使用 new 以后的 String 的地址空间是不一样的。

String 文字(Literal)和 对象(Object)

当我们创建 String 对象的时候,如果使用

new()

的方式来创建一个 String 对象,JVM 将会每次都会在 heap 内存中为我们创建的 String 对象开辟一个存储空间来进行存储。

但是,如果我们使用赋值方式创建 String 对象的话,JVM 首先将会对我们赋的值到 String Pool 中进行查找,如果找到的话,就返回已经存在这个值的引用。

如果没有找到,就创建一个新的 String 对象并且返回这个创建对象的引用。

例如,我们如果使用赋值方式将值 “HoneyMoose” 创建的话,我们有可能会得到的是已经存在值的内存地址让我们能够来重新利用已经划分的内存,也有可能是一个全新的内存地址。

简单来说,这 2 种方式创建的 String 字符串都是 String 对象,唯一不同的是

new

操作每次都会给出新的地址,另外的操作则不能每次都是新的内存地址。

要解释这种情况,我们可以用一个数据基本面试问题的题目来进行解释,就是为什么使用 == 进行字符串比较的时候有时候会得到 False 的值。

因为,我们都知道 == 比较的是地址,而不是 String 中存储的值。

考察下面的代码:

ini

代码解读

复制代码

String first = "HoneyMoose"; 
String second = "HoneyMoose"; 
System.out.println(first == second); // True

在上面的初始化后比较中,我们会得到 True 的值,因为上面 2 个 String 的地址是相同的。

下面,我们再使用

new

关键字来创建 2 个新的 String 对象,然后再来比较 String 对象的引用:

ini

代码解读

复制代码

String third = new String("HoneyMoose");
String fourth = new String("HoneyMoose"); 
System.out.println(third == fourth); // False

相同的,我们使用 new 的方式来创建对象,我们可以看到上面创建的 String 的地址是不相同的。

因此使用 == 计算的结果是

False

ini

代码解读

复制代码

String fifth = "HoneyMoose";
String sixth = new String("HoneyMoose");
System.out.println(fifth == sixth); // False

通常来说,我们建议对 String 对象初始化的时候,使用文字方式对 String 对象初始化,这样的话我们能够让 JVM 有机会对 String 初始化之前进行判断来完成内存优化而不需要重复创建相同的对象。

手工引用

手工修改引用的意思就是通过程序来手工修改 String 字符串使用的指针来获得我们需要的值。

手工修改指针的方法为

intern()

手工修改 String 在 String 存储池中的引用,JVM 将会在我们需要的时候返回这个引用。

让我们来创建一个测试用例:

ini

代码解读

复制代码

String constantString = "interned HoneyMoose";
String newString = new String("interned HoneyMoose");

assertThat(constantString).isNotSameAs(newString);

String internedString = newString.intern();

assertThat(constantString)
  .isSameAs(internedString);

上面代码中的第一次判断是不相同的,后来我们在创建一个新的 String 的对象的时候,使用了一个已经创建的 String 字符串的引用,那么我们的后面再进行判断的时候就是相同的了。

垃圾清理

在 Java 7 之前,JVM 是将 String Pool 存储在

PermGen

存储空间的,这个存储空间的大小是固定的。

因此我们没有办法通过 JVM 的垃圾清理程序来扩展运行时候的内存。

相对将 String Pool 设置到

Heap

内存空间,如果我们将 String 放置到

PermGen

中,但是我们又创建了很多 String 对象的话,我们可能会遇到

OutOfMemory

错误。

从 Java 7 开始,String Pool 将会放置到

Heap

内存空间了,因为

Heap

内存空间是可以使用 JVM 的垃圾清理程序来进行清理的。

这样的话能够降低我们遇到

OutOfMemory

错误的风险,因为对不使用的 String 对象,将会从内存中删除,内存将会被释放以便于后续创建 String 对象。

性能和优化

在 Java 6 中,我们唯一可以做的优化就是通过增加

PermGen

内存空间来提供更多的存储。

可以通过在 JVM 中使用参数来实现:

ini

代码解读

复制代码

-XX:MaxPermSize=1G

从 Java 7 开始,我们可以为 String Pool 指定更多的参数来扩展和减少 String Pool 的大小。

让我们来看看下面使用的 2 个参数:

ruby

代码解读

复制代码

-XX:+PrintFlagsFinal


-XX:+PrintStringTableStatistics

如果我们希望增加 String Pool 的 buckets 大小,我们可以使用 JVM 提供的

StringTableSize

参数选项:

ini

代码解读

复制代码

-XX:StringTableSize=4901

在 Java 7u40,默认的 String Pool 大小为 1009 buckets。

但是这个值在最近的一些 Java 版本更新中有了改变,从 7u40 到 Java 11 String Pool 的大小为 60013 buckets,在 Java 11 的后续版本中,这个值增加到了 65536 buckets。

需要注意的是,增加 String Pool 的大小将会增加 JVM 的内存消耗,但是也会降低在我们对 String 进行赋值的时候 JVM 对 String 表的处理时间。

有关 Java 9 的 String

一直到 Java 8,

Strings

在 Java 中使用字符数组进行存储的,同时使用的是

UTF-16

字符集,因此每一个字符将会使用 2 字节的内存。

从 Java 9 开始,Java 提供了一个叫做压缩字符(Compact Strings)的存储概念。

这个存储将会针对字符串使用

char[]

byte[]

中字符编码,这个将会与你需要存储的内容有关。

简单来说就是从 Java 9 开始,String 将会根据存储内容的不同来使用不同的存储格式,只会在必要的时候才会使用

UTF-16

编码,这种设计将会显著降低 String 对内存的使用,并且能够让来让垃圾清理程序(Garbage Collector)更有效率的工作。

结论

在本文章中,我们对 JVM 中的 String 是如何存储的和 String Pool 的概念进行一些简单的说明。

同时,我们对如何对 String 是如何初始化和内存中的使用情况,以及如何进行 String 的优化进行了一些说明。


转载来源:https://juejin.cn/post/7113880328309047333

相关文章
|
2月前
|
人工智能 安全 Java
Go与Java泛型原理简介
本文介绍了Go与Java泛型的实现原理。Go通过单态化为不同类型生成函数副本,提升运行效率;而Java则采用类型擦除,将泛型转为Object类型处理,保持兼容性但牺牲部分类型安全。两种机制各有优劣,适用于不同场景。
88 24
|
2月前
|
自然语言处理 Java Apache
在Java中将String字符串转换为算术表达式并计算
具体的实现逻辑需要填写在 `Tokenizer`和 `ExpressionParser`类中,这里只提供了大概的框架。在实际实现时 `Tokenizer`应该提供分词逻辑,把输入的字符串转换成Token序列。而 `ExpressionParser`应当通过递归下降的方式依次解析
184 14
|
2月前
|
人工智能 Java
java中static关键字简介
`static`关键字用于修饰类的成员变量和方法,使其属于类而非对象。静态成员可通过类名直接访问,无需实例化对象。静态方法只能访问静态成员,不能直接访问非静态成员或使用`this`关键字。此外,静态代码块在类首次加载时执行且仅执行一次,适用于初始化操作。
|
6月前
|
存储 缓存 算法
JVM简介—1.Java内存区域
本文详细介绍了Java虚拟机运行时数据区的各个方面,包括其定义、类型(如程序计数器、Java虚拟机栈、本地方法栈、Java堆、方法区和直接内存)及其作用。文中还探讨了各版本内存区域的变化、直接内存的使用、从线程角度分析Java内存区域、堆与栈的区别、对象创建步骤、对象内存布局及访问定位,并通过实例说明了常见内存溢出问题的原因和表现形式。这些内容帮助开发者深入理解Java内存管理机制,优化应用程序性能并解决潜在的内存问题。
307 29
JVM简介—1.Java内存区域
|
6月前
|
缓存 安全 Java
《从头开始学java,一天一个知识点》之:字符串处理:String类的核心API
🌱 **《字符串处理:String类的核心API》一分钟速通!** 本文快速介绍Java中String类的3个高频API:`substring`、`indexOf`和`split`,并通过代码示例展示其用法。重点提示:`substring`的结束索引不包含该位置,`split`支持正则表达式。进一步探讨了String不可变性的高效设计原理及企业级编码规范,如避免使用`new String()`、拼接时使用`StringBuilder`等。最后通过互动解密游戏帮助读者巩固知识。 (上一篇:《多维数组与常见操作》 | 下一篇预告:《输入与输出:Scanner与System类》)
140 11
|
6月前
|
Java
课时14:Java数据类型划分(初见String类)
课时14介绍Java数据类型,重点初见String类。通过三个范例讲解:观察String型变量、"+"操作符的使用问题及转义字符的应用。String不是基本数据类型而是引用类型,但使用方式类似基本类型。课程涵盖字符串连接、数学运算与字符串混合使用时的注意事项以及常用转义字符的用法。
144 9
|
6月前
|
Java Linux API
课时3:Java简介(Java主要特点)
本文介绍了Java的主要特点及其运行机制。Java结合了编译型和解释型语言的优点,通过Java虚拟机(JVM)实现跨平台移植,简化了不同操作系统间的开发流程。Java的特点包括可移植性、简单易用、支持多线程编程、自动垃圾收集和面向对象编程。随着硬件技术的发展,Java的性能问题已大大改善,成为行业标准之一,广泛应用于各种商用平台开发。
228 1
|
6月前
|
开发框架 移动开发 Java
课时2:Java简介(Java发展概述)
课时2:Java简介(Java发展概述) 摘要: 1. Java基础知识:介绍Java作为编程语言及其思想。 2. Java的发展历史:从1991年GREEN项目到1995年正式推出,历经网景公司、HotJava浏览器等关键节点。 3. Java的版本信息:涵盖从JDK 1.0到JDK 1.8的主要版本及特性,如Lambda表达式和模块化支持。
|
6月前
|
存储 Java C语言
课时11:Java数据类型简介
本文介绍了Java中的数据类型划分,主要分为基本数据类型和引用数据类型。基本数据类型包括数值型(整型、浮点型)、布尔型和字符型,每种类型有固定的默认值和存储范围。引用数据类型涉及内存使用,如数组、类和接口,默认值为Null。文中还提供了不同类型的选择原则,帮助开发者在实际编程中合理选用数据类型。

热门文章

最新文章