Java - String源码解析及常见面试问题

简介: Java - String源码解析及常见面试问题

2020070719363976.png


Pre

Java Version : 主流版本JDK 8


Q1: String 是如何实现的?



2020070720173633.png


看到了吧 , 底层存储是 char 数组

public final class String  implements java.io.Serializable, Comparable<String>, CharSequence {
    // the value is used for character storage    存储字符串的值
    private final char value[];
    // Cache the hash code for the string  缓存字符串的 hash code
    private int hash; // Default to 0
    // ...... 
}


Q2: String 有哪些重要的方法?

构造函数

20200707202309855.png


挑几个比较重要的

// String 为参数的构造方法
public String(String original) {
    this.value = original.value;
    this.hash = original.hash;
}
// char[] 为参数构造方法
public String(char value[]) {
    this.value = Arrays.copyOf(value, value.length);
}
// StringBuffer 为参数的构造方法
public String(StringBuffer buffer) {
    synchronized(buffer) {
        this.value = Arrays.copyOf(buffer.getValue(), buffer.length());
    }
}
// StringBuilder 为参数的构造方法
public String(StringBuilder builder) {
    this.value = Arrays.copyOf(builder.getValue(), builder.length());
}


这里需要提一下的是: 以 StringBuffer 和 StringBuilder 为参数的构造函数容易被忽略,因为String 、 StringBuffer、StringBuilder 这三种数据类型, 通常都是单独使用的哇。 知道就行,反正平常也不这么写


还有其他构造函数 ,大家可以自行看一下


equals()

比较两个字符串是否相等

来看下源码

    public boolean equals(Object anObject) {
      // 如果是对象引用,直接返回true 
        if (this == anObject) {
            return true;
        }
       // 类型判断  如果不是String类型则直接返回 false
        if (anObject instanceof String) {
            String anotherString = (String)anObject;
            int n = value.length;
            if (n == anotherString.value.length) {
               // 把两个字符串都转换为 char 数组对比
                char v1[] = value;
                char v2[] = anotherString.value;
                int i = 0;
                while (n-- != 0) { // 循环比对两个字符串的每一个字符
                    if (v1[i] != v2[i])  // 如果其中有一个字符不相等就直接返回false,否则继续对比,直接到结束
                        return false;
                    i++;
                }
                return true;
            }
        }
        return false;
    }


equals() 是String 类型重写的 Object 中的 方法,Object#equals() 方法需要传递一个 Object 类型的参数值所以才有了上面的instanceof 类型判断 。 当判断参数为 String 类型之后,会循环对比两个字符串中的每一个字符,当所有字符都相等时返回 true,否则则返回 false。


【Object#equals()】

 public boolean equals(Object obj) {
        return (this == obj);  // 仅判断的对象引用,即比较的是对象在内存中的地址
    }


【instanceof 用法】

Object a= "123";
Object b= 123;
System.out.println(a instanceof String); //  true
System.out.println(b instanceof String); //  false


另外还有一个 equalsIgnoreCase(), 忽略字符串的大小写之后进行字符串对比。


compareTo()

比较两个字符串

   public int compareTo(String anotherString) {
        int len1 = value.length;
        int len2 = anotherString.value.length;
        int lim = Math.min(len1, len2); // 取两个字符串中长度最短的那个字符串的长度  
        char v1[] = value;
        char v2[] = anotherString.value;
        int k = 0;
        while (k < lim) {  // 对比每一个字符
            char c1 = v1[k];
            char c2 = v2[k];
            if (c1 != c2) {// 有字符不相等时返回差值 
                return c1 - c2;  
            }
            k++;
        }
        return len1 - len2;
    }

从源码总可以看到compareTo() 方法会循环对比所有的字符,当两个字符串中有任意一个字符不相同时,则 return c1 - c2。


举个例子


“53334433”.compareTo(“3”) ----> 2 【取最小长度,第一个字符 5 和 3 比,转成char 比较, 不相等 返回 5 - 3 = 2】


再来个例子: 两个字符串分别存储的是 1 和 2,返回的值是 -1;如果存储的是 1 和 1,则返回的值是 0 ,如果存储的是 2 和 1,则返回的值是 1。


还有个compareToIgnoreCase 忽略大小写后比较两个字符串。


【equals() vs compareTo() 】


可以看出 compareTo() 方法和 equals() 方法都是用于比较两个字符串的,但它们有两点不同:


equals() 可以接收一个 Object 类型的参数,而 compareTo() 只能接收一个 String 类型的参数

equals() 返回值为 Boolean,而 compareTo() 的返回值则为 int


它们都可以用于两个字符串的比较,当 equals() 方法返回 true 时,或者是 compareTo() 方法返回 0 时,则表示两个字符串完全相同


其他重要方法


indexOf():查询字符串首次出现的下标位置

lastIndexOf():查询字符串最后出现的下标位置

contains():查询字符串中是否包含另一个字符串

toLowerCase():把字符串全部转换成小写

toUpperCase():把字符串全部转换成大写

length():查询字符串的长度

trim():去掉字符串首尾空格

replace():替换字符串中的某些字符

split():把字符串分割并返回字符串数组

join():把字符串数组转为字符串


Q3: 为什么 String 类型要用 final 修饰


从源码中可以知道String是final修饰的?

为啥子嘞?


高司令以前回答过: 他会更倾向于使用 final,因为它能够缓存结果,当你在传参时不需要考虑谁会修改它的值;如果是可变类的话,则有可能需要重新拷贝出来一个新值进行传参,这样在性能上就会有一定的损失。


String 类设计成不可变的另一个原因是安全,当你在调用其他方法时,比如调用一些系统级操作指令之前,可能会有一系列校验,如果是可变类的话,可能在你校验过后,它的内部的值又被改变了,这样有可能会引起严重的系统崩溃问题,这是迫使 String 类设计成不可变类的一个重要原因。


总之,使用 final 修饰的第一个好处是安全;第二个好处是高效


我们以JVM中的常量池来举个例子

String s1 = "java";
String s2 = "java";


只有字符串是不可变时,我们才能实现字符串常量池。

字符串常量池可以为我们缓存字符串,这样的话不用每次都去开辟一块内存地址存放,自然就提高了运行效率。

20200707232917645.png




如果String是可变的,那字符串常量池就歇菜了。。。。。


Q4: == 和 equals 的区别是什么

【==】


  • 对于基本数据类型来说, 比较 “值”是否相等的
  • 对于引用类型来说, 比较引用地址是否相同的

Object#equals() 其实就是 ==

public boolean equals(Object obj) {
    return (this == obj);
}


String#equal这是重写了父类Object的equals方法,把它修改成了比较两个字符串的值是否相等,分析如上。


Q5: String 和 StringBuilder、StringBuffer 有什么区别


简单来说:

  • String 不可变 ,正是因为不可变,所以字符串在拼接时,效率低,所以才有了下面两个
  • StringBuffer 线程安全
  • StringBuilder 线程不安全


String 类型是不可变的,所以在字符串拼接的时候如果使用 String 的话性能会很低。

因此我们就需要使用另一个数据类型 StringBuffer,它提供了 append 和 insert 方法可用于字符串的拼接,它使用 synchronized 来保证线程安全

@Override
public synchronized StringBuffer append(Object obj) {
    toStringCache = null;
    super.append(String.valueOf(obj));
    return this;
}
@Override
public synchronized StringBuffer insert(int offset, String str) {
    toStringCache = null;
    super.insert(offset, str);
    return this;
}  

因为它使用了 synchronized 来保证线程安全,所以性能不是很高。


于是在 JDK 1.5 就有了 StringBuilder,它同样提供了 append 和 insert 的拼接方法,但它没有使用 synchronized 来修饰,因此在性能上要优于 StringBuffer,所以在非并发操作的环境下可使用 StringBuilder 来进行字符串拼接。

      @Override
    public StringBuilder append(String str) {
        super.append(str);
        return this;
    }
    @Override
    public StringBuilder insert(int offset, String str) {
        super.insert(offset, str);
        return this;
    }

当然了,append 和 insert的方法入参有很多,这里仅仅列举出了一个,主要是让你看下 synchronized实现上的区别。


Q6: String 类型在 JVM中是如何存储的?编译器对 String 做了哪些优化


String 常见的创建方式有两种

  • new String()
  • 直接赋值


直接赋值的方式会先去字符串常量池中查找是否已经有此值,如果有则把引用地址直接指向此值,否则会先在常量池中创建,然后再把引用指向此值;


new String() 一定会先在堆上创建一个字符串对象,然后再去常量池中查询此字符串的值是否已经存在,如果不存在会先在常量池中创建此字符串,然后把引用的值指向此字符串


举个例子

String s1 = new String("Java");
String s2 = s1.intern();
String s3 = "Java";
System.out.println(s1 == s2); //  ------> false
System.out.println(s2 == s3); //  ------>  true

20200707234207746.png

除此之外编译器还会对 String 字符串做一些优化,例如以下代码

String s1 = "Ja" + "va";
String s2 = "Java";
System.out.println(s1 == s2);

输出 true

javap -c 反汇编看一下


20200707235100600.png


从编译代码 #2 可以看出,代码 “Ja”+“va” 被直接编译成了 “Java” ,因此 s1==s2 的结果才是 true,这就是编译器对字符串优化的结果

相关文章
|
7月前
|
存储 缓存 NoSQL
Redis常见面试题全解析
Redis面试高频考点全解析:从过期删除、内存淘汰策略,到缓存雪崩、击穿、穿透及BigKey问题,深入原理与实战解决方案,助你轻松应对技术挑战,提升系统性能与稳定性。(238字)
|
8月前
|
机器学习/深度学习 JSON Java
Java调用Python的5种实用方案:从简单到进阶的全场景解析
在机器学习与大数据融合背景下,Java与Python协同开发成为企业常见需求。本文通过真实案例解析5种主流调用方案,涵盖脚本调用到微服务架构,助力开发者根据业务场景选择最优方案,提升开发效率与系统性能。
1924 0
|
8月前
|
Java
Java的CAS机制深度解析
CAS(Compare-And-Swap)是并发编程中的原子操作,用于实现多线程环境下的无锁数据同步。它通过比较内存值与预期值,决定是否更新值,从而避免锁的使用。CAS广泛应用于Java的原子类和并发包中,如AtomicInteger和ConcurrentHashMap,提升了并发性能。尽管CAS具有高性能、无死锁等优点,但也存在ABA问题、循环开销大及仅支持单变量原子操作等缺点。合理使用CAS,结合实际场景选择同步机制,能有效提升程序性能。
|
8月前
|
Java 开发者
Java并发编程:CountDownLatch实战解析
Java并发编程:CountDownLatch实战解析
583 100
|
9月前
|
存储 缓存 Java
Java数组全解析:一维、多维与内存模型
本文深入解析Java数组的内存布局与操作技巧,涵盖一维及多维数组的声明、初始化、内存模型,以及数组常见陷阱和性能优化。通过图文结合的方式帮助开发者彻底理解数组本质,并提供Arrays工具类的实用方法与面试高频问题解析,助你掌握数组核心知识,避免常见错误。
|
7月前
|
监控 Java 关系型数据库
面试性能测试总被刷?学员真实遇到的高频问题全解析!
面试常被性能测试题难住?其实考的不是工具,而是分析思维。从脚本编写到瓶颈定位,企业更看重系统理解与实战能力。本文拆解高频面试题,揭示背后考察逻辑,并通过真实项目训练,帮你构建性能测试完整知识体系,实现从“会操作”到“能解决问题”的跨越。
|
7月前
|
存储 安全 Java
《数据之美》:Java集合框架全景解析
Java集合框架是数据管理的核心工具,涵盖List、Set、Map等体系,提供丰富接口与实现类,支持高效的数据操作与算法处理。
|
8月前
|
Java 开发者
Java 函数式编程全解析:静态方法引用、实例方法引用、特定类型方法引用与构造器引用实战教程
本文介绍Java 8函数式编程中的四种方法引用:静态、实例、特定类型及构造器引用,通过简洁示例演示其用法,帮助开发者提升代码可读性与简洁性。
|
7月前
|
存储 人工智能 算法
从零掌握贪心算法Java版:LeetCode 10题实战解析(上)
在算法世界里,有一种思想如同生活中的"见好就收"——每次做出当前看来最优的选择,寄希望于通过局部最优达成全局最优。这种思想就是贪心算法,它以其简洁高效的特点,成为解决最优问题的利器。今天我们就来系统学习贪心算法的核心思想,并通过10道LeetCode经典题目实战演练,带你掌握这种"步步为营"的解题思维。
|
8月前
|
安全 Java API
Java SE 与 Java EE 区别解析及应用场景对比
在Java编程世界中,Java SE(Java Standard Edition)和Java EE(Java Enterprise Edition)是两个重要的平台版本,它们各自有着独特的定位和应用场景。理解它们之间的差异,对于开发者选择合适的技术栈进行项目开发至关重要。
1400 1

推荐镜像

更多
  • DNS