这是本系列的第七篇文章, 相关文章列表:
- OutOfMemoryError系列(1): Java heap space
- OutOfMemoryError系列(2): GC overhead limit exceeded
- OutOfMemoryError系列(3): Permgen space
- OutOfMemoryError系列(4): Metaspace
- OutOfMemoryError系列(5): Unable to create new native thread
- OutOfMemoryError系列(6): Out of swap space?
Java平台限制了数组的最大长度。各个版本的具体限制可能稍有不同, 但范围都在 1 ~ 21亿
之间。
如果程序抛出 java.lang.OutOfMemoryError: Requested array size exceeds VM limit
错误, 就说明想要创建的数组长度超过限制。
原因分析
这个错误是由JVM中的本地代码抛出的. 在真正为数组分配内存之前, JVM会执行一项检查: 要分配的数据结构在该平台是否可以寻址(addressable). 当然, 这个错误比你所想的还要少见得多。
一般很少看到这个错误, 因为Java使用 int 类型作为数组的下标(index, 索引)。在Java中, int类型的最大值为 2^31 – 1 = 2,147,483,647
。大多数平台的限制都约等于这个值 —— 例如在 64位的 MB Pro 上, Java 1.7 平台可以分配长度为 2,147,483,645
, 以及 Integer.MAX_VALUE-2
) 的数组。
再增加一点点长度, 变成 Integer.MAX_VALUE-1
时, 就会抛出我们所熟知的 OutOfMemoryError
:
`Exception in thread "main" java.lang.OutOfMemoryError: Requested array size exceeds VM limit`
在有的平台上, 这个最大限制可能还会更小一些, 例如在32位Linux, OpenJDK 6 上面, 数组长度大约在 11亿左右(约2^30
) 就会抛出 “java.lang.OutOfMemoryError: Requested array size exceeds VM limit
“ 错误。要找出具体的限制值, 可以执行一个小小的测试用例, 具体示例参见下文。
示例
以下代码用来演示 java.lang.OutOfMemoryError: Requested array size exceeds VM limit
错误:
for (int i = 3; i >= 0; i--) {
try {
int[] arr = new int[Integer.MAX_VALUE-i];
System.out.format("Successfully initialized an array with %,d elements.\n", Integer.MAX_VALUE-i);
} catch (Throwable t) {
t.printStackTrace();
}
}
其中,for循环迭代4次, 每次都去初始化一个 int 数组, 长度从 Integer.MAX_VALUE-3
开始递增, 到 Integer.MAX_VALUE
为止. 在 64位 Mac OS X 的 Hotspot 7 平台上, 执行这段代码会得到类似下面这样的结果:
java.lang.OutOfMemoryError: Java heap space
at eu.plumbr.demo.ArraySize.main(ArraySize.java:8)
java.lang.OutOfMemoryError: Java heap space
at eu.plumbr.demo.ArraySize.main(ArraySize.java:8)
java.lang.OutOfMemoryError: Requested array size exceeds VM limit
at eu.plumbr.demo.ArraySize.main(ArraySize.java:8)
java.lang.OutOfMemoryError: Requested array size exceeds VM limit
at eu.plumbr.demo.ArraySize.main(ArraySize.java:8)
请注意, 在后两次迭代抛出 java.lang.OutOfMemoryError: Requested array size exceeds VM limit
错误之前, 先抛出了2次 java.lang.OutOfMemoryError: Java heap space
错误。 这是因为 2^31-1
个 int 数占用的内存超过了JVM默认的8GB堆内存。
此示例也展示了这个错误比较罕见的原因 —— 要取得JVM对数组大小的限制, 要分配长度差不多等于 Integer.MAX_INT
的数组. 这个示例运行在64位的Mac OS X, Hotspot 7平台时, 只有两个长度会抛出这个错误: Integer.MAX_INT-1
和 Integer.MAX_INT
。
解决方案
发生 java.lang.OutOfMemoryError: Requested array size exceeds VM limit
错误的原因可能是:
- 数组太大, 最终长度超过平台限制值, 但小于
Integer.MAX_INT
- 为了测试系统限制, 故意分配长度大于
2^31-1
的数组。
第一种情况, 需要检查业务代码, 确认是否真的需要那么大的数组。如果可以减小数组长度, 那就万事大吉. 如果不行,可能需要把数据拆分为多个块, 然后根据需要按批次加载。
如果是第二种情况, 请记住, Java 数组用 int 值作为索引。所以数组元素不能超过 2^31-1
个. 实际上, 代码在编译阶段就会报错,提示信息为 “error: integer number too large
”。
如果确实需要处理超大数据集, 那就要考虑调整解决方案了. 例如拆分成多个小块,按批次加载; 或者放弃使用标准库,而是自己处理数据结构,比如使用 sun.misc.Unsafe
类, 通过Unsafe工具类可以像C语言一样直接分配内存。
原文链接: https://plumbr.eu/outofmemoryerror/requested-array-size-exceeds-vm-limit
翻译日期: 2017年9月21日