源码解释:
先贴一下String类的申明代码:
public final class String implements java.io.Serializable, Comparable<String>, CharSequence {}
它最大的一个特点是被final修饰了。我们先看看官方怎么解释:
Strings are constant; their values cannot be changed after they are created. String buffers support mutable strings. Because String objects are immutable they can be shared.
翻译如下:
字符串是恒定的,创建之后它们的值不能被改变。StringBuffer是可变的strings.字符串对象不可变让它们可以被共享。
先认识final类
要了解为什么,首先我们得分析一下final修饰类,这个类有什么特点呢?
从安全上讲:
final的出现就是为了为了不想改变
final 修饰的类是不被能继承的,所以 final 修饰的类是不能被篡改的(因为不可能有子类了嘛)
从效率上讲:
设计成final,JVM才不用对相关方法在虚函数表中查询,而直接定位到String类的相关方法上,提高了执行效率 这点对提高效率特别重要
Java设计者认为共享带来的效率更高(比如常量池、线程池都是这个概念)
设计者为什么让String被final修饰
首先我们有个共识,String类绝对是被我们使用得最多的一个类,没有之一。所以它是Java非常底层的一个类,一个数据结构。由于使用得实在太多,所以在设计上做了安全性和效率性的考虑。(Java9在底层存储结构上都进行了优化,旨在提高效率)
要理解这个问题,需要先了解以下几点:
immutable ——不可改变
不可改变类——是指类的状态不变,一旦创建,状态就是固定不变的
字符串池——String pool(常量池,实际上分为两种形态:静态常量池和运行时常量池)
public static void main(String[] args) { String a = "HELLO"; String b = "HELLO"; String c = new String("HELLO"); String d = new String("HELLO"); System.out.println(a == b); //true 这里true,字符池的效果体现出来了 System.out.println(b == c); //false System.out.println(c == d); //false System.out.println(a.equals(b)); //true equals都会返回true //intern()方法试用一把 c = c.intern(); System.out.println(b == c); //true 这里直接也返回true了 }
String pools是为了提高JAVA内存利用率而采用的措施,当遇到String a = “HELLO”时,JAVA会先在字符串池中查找是否存在“HELLO”这个字符串,如果没有,则新创建一个对象,然后变量a指向这个地址,然后再遇到String b = “HELLO”时,由于字符串池中以及有了“HELLO”这个对象,所以直接将变量b的地址指向“HELLO”,省去了重新分配的麻烦,如图:
在JAVA中,“==”对于两个基本类型,判断内容是否相等,对于对象判断两个对象的地址值是否相等
那么String c = new String(“Hello”)又如何处理呢?
如果是这种写法,则不会去访问字符串池,而是先为变量 c 开辟空间,然后将值写入空间。所以b == c返回false,c == d同样返回false。至于String的equals方法,因为它比较的不是对象的地址,而是对象的值,所以都返回true就不奇怪了。
Java虚拟机有一个字符串池,保存着几乎所有的字符串对象。字符串表达式总是指向字符串池中的一个对象。使用new操作创建的字符串对象不指向字符串池中的对象
最后一句我们看到,当我们使用intern()方法后,会和池子的对象一样的效果了。
简单介绍下intern()方法的原理:如果池中已经有相同的 字符串。有则直接返回池中的字符串,否则先将字符串添加到池中,再返回。这步操作相当于手动向常量池里扔东西
另外,因为String是底层的类,且是使用最为广泛的类。所以用final修饰,自然而然的方法也会被final修饰。因此在调用String的任何方法的时候,都采用JVM的内嵌机制,效率会有较大的提升
阐述设计成final类的优点
只有当字符串是不可变的,字符串池才有可能实现
字符串池的实现可以在运行时节约很多heap空间,因为不同的字符串变量都指向池中的同一个字符串。但如果字符串是可变的,那么String interning将不能实现(注:String interning是指对不同的字符串仅仅只保存一个,即不会保存多个相同的字符串。),因为这样的话,如果变量改变了它的值,那么其它指向这个值的变量的值也会一起改变。
如果字符串是可变的,那么会引起很严重的安全问题
譬如,数据库的用户名、密码都是以字符串的形式传入来获得数据库的连接,或者在socket编程中,主机名和端口都是以字符串的形式传入。因为字符串是不可变的,所以它的值是不可改变的,否则黑客们可以钻到空子,改变字符串指向的对象的值,造成安全漏洞。
因为字符串是不可变的,所以是多线程安全的
同一个字符串实例可以被多个线程共享。这样便不用因为线程安全问题而使用同步。字符串自己便是线程安全的。
类加载器要用到字符串,不可变性提供了安全性,以便正确的类被加载
譬如你想加载java.sql.Connection类,而这个值被改成了myhacked.Connection,那么会对你的数据库造成不可知的破坏。
作为Map的key,提高了访问效率
因为字符串是不可变的,所以在它创建的时候hashcode就被缓存了,不需要重新计算。这就使得字符串很适合作为Map中的键,字符串的处理速度要快过其它的键对象。这就是HashMap中的键往往都使用字符串。因为Map使用得也是非常之多,所以一举两得