JVM将初始和最大内存大小设置为相同值的好处
启动应用程序时,我们指定初始内存大小和最大内存大小。对于在 JVM(Java 虚拟机)上运行的应用程序,初始和最大内存大小通过 “-Xms” 和 “-Xmx” 参数指定。如果 Java 应用程序在容器上运行,则通过“-XX:InitialRAMPercentage”和“-XX:MaxRAMPercentage”参数指定它。大多数企业将初始内存大小设置为低于最大内存大小的值。与这种普遍接受的做法相反,将初始内存大小设置为与最大内存大小相同具有如下优势。让我们在这篇文章中讨论它们。
1. 可用性
假设您正在启动应用程序,初始堆大小为 2GB,最大堆大小为 24GB。这意味着当应用程序启动时,操作系统将为您的应用程序分配 2GB 的内存。从那时起,当应用程序开始处理新请求时,将分配额外的内存,直到达到最大 24GB。
假设当您的应用程序的内存消耗正在从2GB增长到24GB的过程中,此时,服务器启动了其他一些进程,并且这些进程开始消耗内存。这种情况在生产/云环境中非常常见,尤其是在应用程序与其他进程(如自定义脚本、cron 作业、监视代理等)一起运行时。
发生这种情况时,您的应用程序将遇到以下情况:
“java.lang.OutOfMemoryError:Java heap space”
操作系统将终止您的应用程序,并显示“内存不足:杀死进程。
这意味着您的应用程序将在事务过程中崩溃。如果应用程序在启动期间以最大内存启动,则应用程序将是安全的。操作系统将仅终止内存消耗正在增长的新启动的脚本/cron 作业,而不会终止在启动期间内存已完全分配的应用程序。
2. 性能
我们还观察到,以相同的初始堆大小和最大堆大小启动的应用程序往往比以较低的初始堆大小启动的应用程序的性能相对较好。
这是一个真实的案例研究:我们使用记忆密集型应用程序进行测试。此应用程序处理非常大的二进制堆转储文件并生成分析报告。在这个应用程序中,我们反复分析一个11GB大小的二进制文件,这样它就会给操作系统带来内存压力。
我们进行了两个测试场景:
方案 1:我们将初始堆大小设置为 2GB,最大堆大小设置为 24GB。
方案 2:我们将初始堆大小和最大堆大小都设置为 24GB。
在场景 1 中,我们观察到平均响应时间为 385.32 秒,而在场景 2 中,我们观察到平均响应时间为 366.55 秒。响应时间缩短了 5.11%。响应时间的这种改善是由于以下两个原因:
操作系统的内存分配和解除分配
GC 暂停时间影响
让我们在这里讨论它们:
从操作系统分配和解除分配内存
当您为初始堆大小和最大堆大小设置了不同的大小时,JVM 将不得不与操作系统协商,以便在需要时分配内存。同样,当应用程序对内存的需求在运行时出现故障时,操作系统将占用分配的内存。这种持续的分配和解除分配将增加应用程序的开销。
场景 1:内存分配波动(按 GCeasy 绘制的图表)
上图显示了场景 1 JVM 的已分配和已解除分配的内存。从图表中,您可以注意到内存在不断波动(在 2GB 到 24GB 之间波动)。当应用程序处理堆转储时,内存最多可达 24GB。处理后,内存将回落到 2GB。当它再次处理新的堆转储时,内存会回弹到 24GB。
场景 2:内存分配常量(由 GCeasy 绘制)
上图显示了场景 2 JVM 在其生命周期内分配的内存。你可以看到没有波动。内存是在启动期间从操作系统保留的,从那时起,没有波动。无论应用程序中的活动如何,它始终保持在24GB。此行为有可能在一定程度上提高应用程序的性能。
GC 暂停时间影响
当垃圾回收运行时,它会暂停应用程序,这将对客户产生负面影响。我们使用 GCeasy 工具研究了两种方案的垃圾回收性能。结果如下:
垃圾回收性能结果
我们注意到 GC 吞吐量和 GC 暂停时间略有下降。在方案 1 中,GC 吞吐量为 96.59%,而在方案 2 中,GC 吞吐量略好 (97.83%)。同样,在场景 1 中,Max GC 的暂停时间为 5.23 秒,而在场景 2 中仅为 1.65 秒。。
应用程序启动时间
如果将初始堆大小设置为与最大堆大小相同,则应用程序的启动时间也会更好。以下是 Oracle 文档的摘录:
“如果初始堆太小,Java 应用程序的启动速度会变慢,因为 JVM 被迫频繁地执行垃圾回收,直到堆增长到更合理的大小。为获得最佳启动性能,请将初始堆大小设置为与最大堆大小相同。"
4. 成本
无论您将初始堆大小 (-Xms) 和最大堆大小 (-Xmx) 设置为相同值还是其他值,您支付给云托管提供商的计算成本都不会更改。假设您正在使用阿里云、腾讯云等云厂商的实例,那么无论设置初始堆大小和最大堆大小的值如何,您最终都将支付固定小时的费用。云提供商不会根据您在该计算机中使用的内存量向您收费。它们仅根据您使用实例的时间收费。因此,将初始堆大小设置为低于最大堆大小不会节省成本。
结论
在配置线程池或连接池时,将初始堆大小配置为小于最大堆大小是有意义的。在这些资源中,过度分配会产生不必要的影响,但是,内存并非如此。因此,如果要构建企业应用程序,强烈建议将初始堆大小和最大堆大小设置为相同的值。