JDK源码精读汇总帖

类声明

public final class Integer extends Number implements Comparable<Integer> {}

public abstract class Number implements java.io.Serializable {}

抽象类 Number 是 BigDecimal、BigInteger、Byte、Double、Float、Integer、Long 和 Short 类的超类。
Number 的子类必须提供将表示的数值转换为 byte、double、float、int、long 和 short 的方法。
Integer中对应的方法就是类型转换，将int转换成byte、double、float、long 和 short 类型。

compareTo

实现了Comparable，看看对应的方法，很好理解

public int compareTo(Integer anotherInteger) {
    return compare(this.value, anotherInteger.value);
}

/**
 * jdk1.7之后单独抽取出来的static方法，可以作为工具方法用于比较两个整数
 */
public static int compare(int x, int y) {
    return (x < y) ? -1 : ((x == y) ? 0 : 1);
}

toString(int)

看看非常常用的toString方法

public static String toString(int i) {
    // 如果是Integer的最小值，直接返回字符串"-2147483648"
    if (i == Integer.MIN_VALUE)
        return "-2147483648";
    // 计算形参i的位数，负数的话，size要比数字本身多1，用来存储负号(-)
    int size = (i < 0) ? stringSize(-i) + 1 : stringSize(i);
    // 构造一个用于存储数字的字符数组
    char[] buf = new char[size];
    // 填充字符数组
    getChars(i, size, buf);
    return new String(buf, true);
}

先看看stringSize方法，这个方法返回的是形参i的位数

final static int [] sizeTable = { 9, 99, 999, 9999, 99999, 999999, 9999999, 99999999, 999999999, Integer.MAX_VALUE };

// 要求形参x为正数
static int stringSize(int x) {
    // 一个个和sizeTable比较，到第i个数代表x由(i+1)个数字组成
    for (int i=0; ; i++)
        if (x <= sizeTable[i])
            return i+1;
}

再看看getChars方法，这个方法就是将组成形成i的每一个数字，填充到buf数组里。在看getChars这个方法之前可以先思考一下，怎么样获取形参i的每个位置上的数字呢？其实就是循环：①每次除以10求余(%)，得到的就是个位上的数字；②然后再将形参i除以10，整数相除，尾数(即前面的余数)就会被丢弃；③重复①②直到形参i变成0。如12，第一次循环：除以10求余得到2，就是个位数上的数字是2，然后除以10，得到1，个位数上的2就被丢弃了，第二次循环：除10求余得到1，然后除以10得到0，于是分别得到了2和1，循环结束了。用代码来看的话就是：

while (true) {
    r = i % 10;
    i /= 10;
    // 伪代码↓
    // 第n次循环，将r加入到buf的倒数第n位上
    if (i == 0) break;

以上只考虑了正数的情况，对于负数的情况，只要再循环结束后，在buf的第0个位置加上一个'-'即可，完整代码如下：

static void myGetChars(int i, int index, char[] buf) {
    int charPos = index;// 用来记录buf每次可插入的尾部
    char sign = 0;// 是否为负数的标记
    if (i < 0) {
        sign = '-';
        i = -i;// 当成正数处理
    }        
    while (true) {
        int r = i % 10;
        i /= 10;
        buf [--charPos] = digits [r];// 将数字r转成字符'r'，然后添加到buf的可插入尾部
        if (i == 0) break;
    }
    if (sign != 0) {
        buf [--charPos] = sign;
    }
}

看样子好像实现了getChars的功能，但是jdk里面是不是这么做的呢？答案是：no!看看源码：

static void getChars(int i, int index, char[] buf) {
    int q, r;// r为余数，就是每次被插入到buf的数
    int charPos = index;// buf可插入尾部
    char sign = 0;

    if (i < 0) {
        sign = '-';
        i = -i;
    }

    // i >= 65536时
    // 每次迭代向buf插入2个数字，即i的最后两位，目的应该是加快迭代速度
    while (i >= 65536) {
        q = i / 100;
        // really: r = i - (q * 100);
        // 本质就是r = i - (q * 100)
        // q << 6 = 2^6 = 64
        // q << 5 = 2^5 = 32
        // q << 2 = 2^2 = 4
        // i - q * 100 得到的r就是i的末尾2位数，本质是i%100，应该是乘法运算速度大于除法，大于求余，但是减法的速度应该也不算快
        r = i - ((q << 6) + (q << 5) + (q << 2));
        i = q;
        // 插入r的个位数
        buf [--charPos] = DigitOnes[r];
        // 插入r的十位数
        buf [--charPos] = DigitTens[r];
    }

    // Fall thru to fast mode for smaller numbers
    // assert(i <= 65536, i);
    for (;;) {
        // 这里本质就是i/10，
        q = (i * 52429) >>> (16+3);
        r = i - ((q << 3) + (q << 1));  // 本质就是 r = i-(q*10)
        buf [--charPos] = digits [r];// 将数字r转成字符'r'，然后添加到buf的可插入尾部
        i = q;
        if (i == 0) break;
    }
    if (sign != 0) {// 如果是负数，再插入'-'
        buf [--charPos] = sign;
    }
}

这里有几个比较有意思的地方：

首先是分段来获取字符，分成>=65535和<65535两段，大于等于65535的部分，每次迭代获取两个字符，这里有个疑问的地方是，为什么不分成>=10和<10两部分呢，难道是后面这一小段代码的执行速度比较快？
其次是<65535这部分，对于q = (i * 52429) >>> (16+3);,这个代码等价于q = i / 10;，应该是ALU执行乘法和移位运算的速度快过除法的运算速度。但是为什么是52429和2^19 (2的19次方，无符号右移19位相当于除以2的19次方)，这是出于精度同时不会溢出这两方面考虑的。首先说精度方面，(double)52429/524288=0.100000381469，这个精度完全可以保证求出i的十分之一，比如选了一个精度不够的，求出值为0.103，那么如果i是999，999*0.103=102,并不是999的十分之一99；另外一方面，65536=2^16，52429<65536，所以i * 52429 < 2^32，不会溢出，至于i * 52429 会导致结果变成负数的问题，这只是中间结果，无符号右移19位之后，高位全部补0，结果q还是正数。
以上可以看出，jdk还是蛮严谨的，为了效率也是拼了。
但实际测试的结果感觉运算效率并没有很大提高，可能是以前的ALU没有现在的先进。

toString(int, int)

接下来看看toString(int i, int radix)，这个方法主要是将形参i转成radix进制的数

public static String toString(int i, int radix) {
    // 如果小于2进制或大于36进制，当成10进制处理
    if (radix < Character.MIN_RADIX || radix > Character.MAX_RADIX)
        radix = 10;

    /* Use the faster version */
    // 10进制数，直接使用更快的版本
    if (radix == 10) {
        return toString(i);
    }

    // Integer最多占用33位，数字32位，符号1位
    char buf[] = new char[33];
    boolean negative = (i < 0);// 判断是否为负数，后面i被当成负数来统一处理
    int charPos = 32;// buf最末尾的索引，从32开始

    // 如果i是正数，取反，当成负数处理
    if (!negative) {
        i = -i;
    }

    // i%radix的余数的绝对值放到buf当前尾部(charPos)位置
    while (i <= -radix) {
        buf[charPos--] = digits[-(i % radix)];
        i = i / radix;
    }
    buf[charPos] = digits[-i];

    // 如果i是负数，加上'-'
    if (negative) {
        buf[--charPos] = '-';
    }
    // 返回字符串，从buf的charPos位置开始截取，长度33-charPos，正好是最后一个位置，索引下标为32
    return new String(buf, charPos, (33 - charPos));
}

toString()

无参的toString就没什么难度了，就是把Integer封装的value转成字符串

public String toString() {
    return toString(value);
}

toHexString(int)

接下来看看几个无符号进制的转换

public static String toHexString(int i) {
    return toUnsignedString(i, 4);
}
public static String toOctalString(int i) {
    return toUnsignedString(i, 3);
}
public static String toBinaryString(int i) {
    return toUnsignedString(i, 1);
}
/**
 * 本质上就是理解这个方法
 * 因为是无符号，所以所有数字其实都可以想象成二进制的情况，如17则是0000 0000 0000 0000 0000 0001 0001 0001,-17则是1111 1111 1111 1111 1111 1111 1110 1111
 */
private static String toUnsignedString(int i, int shift) {
    // 无符号数，只需存32位即可
    char[] buf = new char[32];
    // 可插入的尾部位置
    int charPos = 32;
    // 进制
    int radix = 1 << shift;
    // 类似掩码的作用，二进制是对应的是0001,八进制对应0111，十六进制对应1111
    int mask = radix - 1;
    do {
        // 关键理解i & mask，整个过程就像手工转换进制一样，先得到二进制，然后每几位一组转换，如0001 0001转成8进制，每3位一组：00 010 001，然后得到0 2 1，所以17的8进制表示就是21，i & mask的过程就像分组，每次迭代将mask对应的位数得到，再利用digits转换成对应的字符
        buf[--charPos] = digits[i & mask];
        i >>>= shift;
    } while (i != 0);

    return new String(buf, charPos, (32 - charPos));
}

演示一下i & mask的过程：

i=17,mask=7，则相当于0001 0001 & 0111 得到001,digit[1]
=1,第二次迭代i=000 010,000 010 & 0111得到010,digit[2]=2,迭代结束，buf=21。
i=17,mask-15，则相当于0001 0001 & 1111 得到0001,digit[1]
=1,第二次迭代i=0001,0001 & 1111得到0001,digit[1]=1,迭代结束,buf=11。

parseInt(String, int)

接着看parseInt方法，进制转换的公式：a * radix^0 + b * radix^1 + c * radix^2 + ... + xx * radix^(n-1)

/**
 * 整个过程的关键点都在判断下一次迭代会不会导致溢出
 * 
 */
public static int parseInt(String s, int radix)
            throws NumberFormatException
{
    /*
     * WARNING: This method may be invoked early during VM initialization
     * before IntegerCache is initialized. Care must be taken to not use
     * the valueOf method.
     */

    // 下面都是判断s不能为空，进制必须在[2, 36]，可以看到jdk的源码处理也有问题，之前进制转换的，不在[2, 36]之间就当成10进制处理，现在是抛异常，规则不一样
    if (s == null) {
        throw new NumberFormatException("null");
    }

    if (radix < Character.MIN_RADIX) {
        throw new NumberFormatException("radix " + radix +
                                        " less than Character.MIN_RADIX");
    }

    if (radix > Character.MAX_RADIX) {
        throw new NumberFormatException("radix " + radix +
                                        " greater than Character.MAX_RADIX");
    }

    // 当前的转换结果
    int result = 0;
    // 后面的处理都基于负数处理，一方面是统一规则，另外Integer.MIN_VALUE的绝对值比较大
    boolean negative = false;
    int i = 0, len = s.length();
    // 后面两个参数限制溢出的作用
    int limit = -Integer.MAX_VALUE;
    // 界定溢出，具体看下面的注释
    int multmin;
    // 通过Character#digit转换过来的数值
    int digit;

    if (len > 0) {
        // 处理第一个字符
        char firstChar = s.charAt(0);
        if (firstChar < '0') { // Possible leading "+" or "-"
            if (firstChar == '-') {
                negative = true;
                // 如果是负数，溢出标志变成Integer.MIN_VALUE
                limit = Integer.MIN_VALUE;
            } else if (firstChar != '+')
                throw NumberFormatException.forInputString(s);

            if (len == 1) // Cannot have lone "+" or "-"
                throw NumberFormatException.forInputString(s);
            i++;
        }
        // 界定是否溢出的标志，假设10进制最大是211，则multmin = 211 / 10 = 21，假设现在result为30，那么下一次迭代result *= radix肯定会大于211，溢出了。
        multmin = limit / radix;
        while (i < len) {
            // Accumulating negatively avoids surprises near MAX_VALUE
            // 转换函数，具体在Character类了解
            digit = Character.digit(s.charAt(i++),radix);
            if (digit < 0) {
                throw NumberFormatException.forInputString(s);
            }
            // 因为是当成负数(limit是负数)处理，相当于正数的result > multmin
            if (result < multmin) {
                throw NumberFormatException.forInputString(s);
            }
            result *= radix;// 迭代，就是套公式a * radix^(n-1)的过程
            // 同样是判断溢出的过程，继续上面的分析，result现在是210，如果digit是2，则转换后的result = 212，也是溢出了。
            if (result < limit + digit) {
                throw NumberFormatException.forInputString(s);
            }
            result -= digit;// 公式里相加的过程，负数的话就是减
        }
    } else {
        throw NumberFormatException.forInputString(s);
    }
    return negative ? result : -result;
}
// 这个就是调用上面的方法
public static int parseInt(String s) throws NumberFormatException {
  return parseInt(s,10);
}

valueOf()

接着看看valueOf方法，在看valueOf方法之前，需要先看看IntegerCache，顾名思义，这个是整数的缓存，默认情况下，IntegetCache会缓存[-128, 127]的所有实例，所以正常情况下，在这两个值范围内的对象都是相等的(==返回true)，因为它们引用的是同一块内存上的对象，有点单例的意思，当然可以通过启动参数-XX:AutoBoxCacheMax=size来修改缓存的内容(size必须大于127，否则当成127)来让jvm缓存[-size-1, size]的对象。看看代码：

private static class IntegerCache {
        static final int low = -128;
        static final int high;
        static final Integer cache[];

        static {
            // high value may be configured by property
            int h = 127;
            String integerCacheHighPropValue =
                sun.misc.VM.getSavedProperty("java.lang.Integer.IntegerCache.high");
            if (integerCacheHighPropValue != null) {
                int i = parseInt(integerCacheHighPropValue);
                i = Math.max(i, 127);// 如果配置的值比127小，缓存上界还是127
                // Maximum array size is Integer.MAX_VALUE
                h = Math.min(i, Integer.MAX_VALUE - (-low) -1);
            }
            high = h;

            cache = new Integer[(high - low) + 1];
            int j = low;
            // 对象一个个缓存起来，用cache数组保存
            for(int k = 0; k < cache.length; k++)
                cache[k] = new Integer(j++);
        }

        private IntegerCache() {}
    }

具体看看valueOf方法

// 调用的parseInt方法以及分析过
public static Integer valueOf(String s, int radix) throws NumberFormatException {
  return Integer.valueOf(parseInt(s,radix));
}
public static Integer valueOf(String s) throws NumberFormatException {
  return Integer.valueOf(parseInt(s, 10));
}
public static Integer valueOf(int i) {
  assert IntegerCache.high >= 127;// 防止IntegetCache函数上界不是127
  // 在[IntegetCache.low, Integer.high]直接的直接从缓存中返回
  if (i >= IntegerCache.low && i <= IntegerCache.high)
    return IntegerCache.cache[i + (-IntegerCache.low)];
  return new Integer(i);// 否则新建一个实例
}

转载请注明出处

java.lang.Integer源码精读(一)
地址：https://www.jianshu.com/p/02c1d9092347

java.lang.Integer源码精读(一)

JDK源码精读汇总帖

类声明

compareTo

toString(int)

toString(int, int)

toString()

toHexString(int)

parseInt(String, int)

valueOf()

转载请注明出处

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

java.lang.Integer源码精读(一)

JDK源码精读汇总帖

类声明

compareTo

toString(int)

toString(int, int)

toString()

toHexString(int)

parseInt(String, int)

valueOf()

转载请注明出处

热门文章

最新文章

相关课程

相关电子书