金九银十,收下这份 Java String 面试题

简介: 金九银十,收下这份 Java String 面试题


学习路线图:


image.png

1. C 和 Java 中字符串和字符数组的对比


1.1 内存表示不同


  • 在 C 语言中,字符串和字符数组相同。字符串本质上是以 \0 为结束符的字符数组字符数组,因此字符串和字符数组在本质上相同,都是一块连续的内存空间,以需要转义 \0 为结束符。C 语言是不关心 char[] 里存储字符的编码方式的,只有通过程序的上下文确定;
  • 在 Java 中,字符串和字符数组不同。字符串是 String 对象,而字符数组是数组对象,均不需要结束符。如果是数组对象,对象内存区域中有一个字段表示数组的长度,而 String 相当于字符数组的包装类。内部包装了一个基于 UTF-16 BE 编码的字符数组(从 Java 9 开始变为字节数组)。其他字符编码输入的字节流在进入 String 时都会被转换为 UTF-16 BE 编码。


java.lang.String

public final class String {
    private final char value[];
    private int hash;
    ...
}
复制代码


1.2 char 类型的数据长度


  • 在 C 语言中,char 类型占 1 字节,分为有符号与无符号两种;
  • 在 Java 中,char 类型占 2 字节,只有无符号类型。


语言 类型 存储空间(字节) 最小值 最大值
Java char 2 0 65535
C char(相当于signed char) 1 -128 127
C signed char 1 -128 127
C unsigned char 1 0 255



2. 为什么 Java 9 String 内部将 char 数组改为 byte 数组?


Java String 的内存表示本质上是基于 UTF-16 BE 编码的字符数组。UTF-16 是 2 个字节或 4 个字节的变长编码,这意味着即使是 UniCode 字符集的拉丁字母,使用 ASCII 编码只需要一个字节,但是在 String 中需要两个字节的存储空间。


为了优化存储空间,从 Java 9 开始,String 内部将 char 数组改为 byte 数组,String 会判断字符串中是否只包含拉丁字母。如果是的话则采用单字节编码(Latin-1),否则使用 UTF-16 编码。


String.java (since Java 9)


private final byte coder;
static final boolean COMPACT_STRINGS;
static {
    COMPACT_STRINGS = true;
}
byte coder() {
    return COMPACT_STRINGS ? coder : UTF16;
}
@Native static final byte LATIN1 = 0;
@Native static final byte UTF16  = 1;
复制代码


不同编码实现的简单区别如下:


编码格式 编码单元长度 BOM 字节序
UTF-8-无BOM 1 ~ 4 字节 大端序
UTF-8 1 ~ 4 字节 EF BB BF 大端序
UTF-16-无BOM 2 / 4 字节 大端序
UTF-16BE(默认) 2 / 4 字节 FE FF 大端序
UTF-16LE 2 / 4 字节 FF FE 小端序
UTF-32-无BOM 4 字节 大端序
UTF-32BE(默认) 4 字节 00 00 FE FF 大端序
UTF-32LE 4 字节 FF EE 00 00 小端序


关于字符编码的更多内容,见: 计算机基础:今天一次把 Unicode 和 UTF-8 说清楚


3. String & StringBuilder & StringBuffer 的区别


3.1 效率


String 是不可变的,每次操作都会创建新的变量,而另外两个是可变的,不需要创建新的变量;另外,StringBuffer 的每个操作方法都使用 synchronized 关键字保证线程安全,增加了更多加锁 & 释放锁的时间。因此,操作效率的简单排序为:StringBuilder > StringBuffer > String。


3.2 线程安全


String 不可变,所以 String 和 StringBuffer 都是线程安全的,而 StringBuilder 是非线程安全的。


类型 操作效率 线程安全
String 安全(final)
StringBuffer 安全(synchronized)
StringBuilder 非安全



4. 为什么 String 设计为不可变类?


4.1 如何让 String 不可变?


《Effective Java》中 可变性最小化原则,阐述了不可变类的规则:


  • 1、不对外提供修改对象状态的任何方法;
  • 2、保证类不会被扩展(声明为 final 类或 private 构造器);
  • 3、声明所有域为 final;
  • 4、声明所有域为 private;
  • 5、确保对于任何可变性组件的互斥访问。


以上规则 String 均满足。


4.2 为什么 String 要设计为不可变**?**


  • 1、不可变类 String 可以避免修改后无法定位散列表键值对: 假设 String 是可变类,当我们在 HashMap 中构建起一个以 String 为 Key 的键值对时,此时对 String 进行修改,那么通过修改后的 String 是无法匹配到刚才构建过的键值对的,因为修改后的 hashCode 可能是变化的。而不可变类可以规避这个问题。


  • 2、线程安全: 不可变对象本质是线程安全,不需要同步;


提示: 反射可以破坏 String 的不可变性。


5. String + 的实现原理


String + 操作符是编译器语法糖,编译后会被替换为 StringBuilder#append(...)  语句,例如:

示例程序


// 源码:
String string = null;
for (String str : strings) {
    string += str;
}
return string;
// 编译产物:
String string = null;
for(String str : strings) {
    StringBuilder builder = new StringBuilder();
    builder.append(string);
    builder.append(str);
    string = builder.toString();
}
// 字节码:
 0 aconst_null
 1 astore_1
 2 aload_0
 3 astore_2
 4 aload_2
 5 arraylength
 6 istore_3
 7 iconst_0
 8 istore 4
10 iload 4
12 iload_3
13 if_icmpge 48 (+35)
16 aload_2
17 iload 4
19 aaload
20 astore 5
22 new #7 <java/lang/StringBuilder>
25 dup
26 invokespecial #8 <java/lang/StringBuilder.<init>>
29 aload_1
30 invokevirtual #9 <java/lang/StringBuilder.append>
33 aload 5
35 invokevirtual #9 <java/lang/StringBuilder.append>
38 invokevirtual #10 <java/lang/StringBuilder.toString>
41 astore_1
42 iinc 4 by 1
45 goto 10 (-35)
48 aload_1
49 areturn
复制代码


可以看到,如果在循环里直接使用字符串 +,会生成非常多中间变量,性能非常差。应该在循环外新建一个 StringBuilder,在循环内统一操作这个对象。


6. String 对象的内存分配


6.1 "abc" 与 new String("abc") 的区别


  • "abc" => 虚拟机首先检查 运行时常量池 中是否存在 "abc",如果存在则直接返回,否则在字符串常量池中创建 "abc" 对象并返回。因此,多次声明使用的是同一个对象;
  • new String("abc") => 在编译过程中,Javac 会将 "abc" 加入到 Class 文件常量池 中。在类加载时期,Class 文件常量池会被加载进运行时常量池。在调用 new 字节码指令时,虚拟机会在堆中新建一个对象,并且引用常量池中的 "abc" 对象。


6.2 String#intern() 的实现原理


如果字符串常量池中已经包含一个等于此 String 对象的字符串,则返回常量池中的这个字符串;否则,先将此 String 对象包含的字符串拷贝到常量池中,在常量池中的这个字符串。


从 JDK 1.7 开始,String#intern() 不再拷贝字符串到常量池中,而是在常量池中生成一个对原 String 对象的引用,并返回。


// 举例:
String s = new String("1");
s.intern();
String s2 = "1";
System.out.println(s == s2);
String s3 = new String("1") + new String("1");
s3.intern();
String s4 = "11";
System.out.println(s3 == s4);
// 输出结果为:
JDK1.6以及以下:false false
JDK1.7以及以上:false true
复制代码



7. 为什么 String#haseCode() 要使用 31 作为因子?


public int hashCode() {
    int h = hash;
    if (h == 0 && value.length > 0) {
        char val[] = value;
        for (int i = 0; i < value.length; i++) {
            h = 31 * h + val[i];
        }
        hash = h;
    }
    return h;
}
复制代码


  • 原因 1 - 31 可以被编译器优化31∗i=(i<<5)−i31 * i = (i << 5) - i31i=(i<<5)i,位运算和减法运算的效率比乘法运算高。
  • 原因 2 - 31 是一个质数: 质数是只能被 1 和自身整除的数,使用质数作为乘法因子获得的散列值,在将来进行取模时,得到相同 index 的概率会降低,即降低了哈希冲突的概率。
  • 原因 3 - 31 是一个不大不小的质数: 质数太小容易造成散列值聚集在一个小区间,提供散列冲突概率;质数过大容易造成散列值超出 int 的取值范围(上溢),丢失部分数值信息,散列冲突概率不稳定。
目录
相关文章
|
4月前
|
算法 Java
50道java集合面试题
50道 java 集合面试题
|
7月前
|
缓存 Java 关系型数据库
2025 年最新华为 Java 面试题及答案,全方位打造面试宝典
Java面试高频考点与实践指南(150字摘要) 本文系统梳理了Java面试核心考点,包括Java基础(数据类型、面向对象特性、常用类使用)、并发编程(线程机制、锁原理、并发容器)、JVM(内存模型、GC算法、类加载机制)、Spring框架(IoC/AOP、Bean生命周期、事务管理)、数据库(MySQL引擎、事务隔离、索引优化)及分布式(CAP理论、ID生成、Redis缓存)。同时提供华为级实战代码,涵盖Spring Cloud Alibaba微服务、Sentinel限流、Seata分布式事务,以及完整的D
402 1
|
6月前
|
缓存 Java API
Java 面试实操指南与最新技术结合的实战攻略
本指南涵盖Java 17+新特性、Spring Boot 3微服务、响应式编程、容器化部署与数据缓存实操,结合代码案例解析高频面试技术点,助你掌握最新Java技术栈,提升实战能力,轻松应对Java中高级岗位面试。
524 0
|
3月前
|
编解码 Java 开发者
Java String类的关键方法总结
以上总结了Java `String` 类最常见和重要功能性方法。每种操作都对应着日常编程任务,并且理解每种操作如何影响及处理 `Strings` 对于任何使用 Java 的开发者来说都至关重要。
327 5
|
6月前
|
Java 数据库连接 数据库
Java 相关知识点总结含基础语法进阶技巧及面试重点知识
本文全面总结了Java核心知识点,涵盖基础语法、面向对象、集合框架、并发编程、网络编程及主流框架如Spring生态、MyBatis等,结合JVM原理与性能优化技巧,并通过一个学生信息管理系统的实战案例,帮助你快速掌握Java开发技能,适合Java学习与面试准备。
291 2
Java 相关知识点总结含基础语法进阶技巧及面试重点知识
|
5月前
|
存储 SQL 缓存
Java字符串处理:String、StringBuilder与StringBuffer
本文深入解析Java中String、StringBuilder和StringBuffer的核心区别与使用场景。涵盖字符串不可变性、常量池、intern方法、可变字符串构建器的扩容机制及线程安全实现。通过性能测试对比三者差异,并提供最佳实践与高频面试问题解析,助你掌握Java字符串处理精髓。
|
4月前
|
算法 Java
50道java基础面试题
50道java基础面试题
|
6月前
|
自然语言处理 Java Apache
在Java中将String字符串转换为算术表达式并计算
具体的实现逻辑需要填写在 `Tokenizer`和 `ExpressionParser`类中,这里只提供了大概的框架。在实际实现时 `Tokenizer`应该提供分词逻辑,把输入的字符串转换成Token序列。而 `ExpressionParser`应当通过递归下降的方式依次解析
384 14
|
7月前
|
算法 架构师 Java
Java 开发岗及 java 架构师百度校招历年经典面试题汇总
以下是百度校招Java岗位面试题精选摘要(150字): Java开发岗重点关注集合类、并发和系统设计。HashMap线程安全可通过Collections.synchronizedMap()或ConcurrentHashMap实现,后者采用分段锁提升并发性能。负载均衡算法包括轮询、加权轮询和最少连接数,一致性哈希可均匀分布请求。Redis持久化有RDB(快照恢复快)和AOF(日志更安全)两种方式。架构师岗涉及JMM内存模型、happens-before原则和无锁数据结构(基于CAS)。
210 5