Java 性能调优:调整 GC 线程以获得最佳结果

简介: Java 性能调优:调整 GC 线程以获得最佳结果

垃圾回收 (GC) 在 Java 的内存管理中起着重要作用。它有助于回收不再使用的内存。垃圾回收器使用自己的线程集来回收内存。这些线程称为 GC 线程。有时,JVM 最终可能会有太多或太少的 GC 线程。在这篇文章中,我们将讨论为什么 JVM 最终会拥有太多/太少的 GC 线程,它的后果,以及解决这些问题的潜在解决方案。

如何查找应用程序的 GC 线程计数

   您可以通过执行线程转储分析来确定应用程序的 GC 线程计数,如下所述:

从生产服务器捕获线程转储。

使用线程转储分析工具分析转储。

该工具将立即报告 GC 线程计数,如下图所示。

image.png

图 1:fastThread 工具报告 GC 线程计数

如何设置 GC 线程数

   您可以通过设置以下两个 JVM 参数来手动调整 GC 线程数:

-XX:ParallelGCThreads=n:设置垃圾回收器的并行阶段中使用的线程数

-XX:ConcGCThreads=n:控制垃圾回收器的并发阶段使用的线程数

默认的 GC 线程计数是多少?

   如果您没有使用上述两个 JVM 参数显式设置 GC 线程计数,则默认 GC 线程计数将根据服务器/容器中的 CPU 数量得出。

–XX:ParallelGCThreads Default:在 Linux/x86 机器上,它是根据以下公式派生的:

if (num of processors <=8) {      return num of processors; } else {    return 8+(num of processors-8)*(5/8); }

   因此,如果您的 JVM 在具有 32 个处理器的服务器上运行,那么该值将为:23(即 8 + (32 – 8)*(5/8))。ParallelGCThread

-XX:ConcGCThreads Default:它是根据公式派生的:

max((ParallelGCThreads+2)/4, 1)

因此,如果您的 JVM 在具有 32 个处理器的服务器上运行,则:

ParallelGCThread值将为:23(即 8 + (32 – 8)*(5/8))。

ConcGCThreads值将为:6 (i.e. max(25/4, 1)。

JVM 最终会有太多的 GC 线程吗?

   您的 JVM 可能会无意中拥有太多的 GC 线程,而您通常不会意识到。这通常是因为默认的 GC 线程数是根据服务器或容器中的 CPU 数量自动确定的。

   例如,在具有 128 个 CPU 的机器上,JVM 可能会为垃圾回收的并行阶段分配大约 80 个线程,为并发阶段分配大约 20 个线程,从而总共分配大约 100 个 GC 线程。

   如果您在这台 128 CPU 的计算机上运行多个 JVM,则每个 JVM 最终可能会有大约 100 个 GC 线程。这可能会导致资源使用过多,因为所有这些线程都在争夺相同的 CPU 资源。这个问题在容器化环境中尤为明显,因为多个应用程序共享相同的 CPU 内核。这将导致 JVM 分配的 GC 线程数超过必要数量,这可能会降低整体性能。

为什么 GC 线程过多是一个问题?

   虽然 GC 线程对于高效的内存管理至关重要,但拥有过多的 GC 线程可能会导致 Java 应用程序面临重大的性能挑战。

增强的上下文切换: 当 GC 线程数过多时,操作系统必须在这些线程之间频繁切换。这会导致上下文切换开销增加,其中更多的 CPU 周期用于管理线程,而不是执行应用程序的代码。因此,您的应用程序可能会显着减慢速度。

CPU 开销: 每个 GC 线程都会消耗 CPU 资源。如果同时处于活动状态的线程太多,它们可能会争夺 CPU 时间,从而减少可用于应用程序主要任务的处理能力。这种竞争会降低应用程序的性能,尤其是在 CPU 资源有限的环境中。

内存争用: 如果 GC 线程数量过多,则内存资源争用可能会增加。多个线程尝试同时访问和修改内存可能会导致锁争用,这会进一步降低应用程序的速度,并可能导致性能瓶颈。

GC 暂停时间增加,通量降低: 当过多的 GC 线程处于活动状态时,垃圾回收过程的效率可能会降低,从而导致应用程序暂时停止的 GC 暂停时间更长。这些长时间的暂停可能会导致应用程序出现明显的延迟或卡顿。此外,随着花在垃圾回收而不是处理请求上的时间越来越多,应用程序的整体吞吐量可能会降低,每秒处理的事务或请求更少,并影响其在负载下扩展和执行的能力。

更高的延迟: 由于线程数过多而导致 GC 活动增加,这可能会导致响应用户请求或处理任务的延迟增加。这对于需要低延迟的应用程序(例如实时系统或高频交易平台)来说尤其成问题,在这些应用程序中,即使是轻微的延迟也可能产生重大后果。

递减: 超过某个点后,添加更多 GC 线程不会提高性能。相反,它会导致收益递减,其中管理这些线程的开销超过了更快垃圾回收的好处。这可能会导致应用程序性能下降,而不是预期的优化。

为什么 GC 线程太少是一个问题?

   虽然 GC 线程过多会产生性能问题,但 GC 线程太少对 Java 应用程序来说同样会出现问题。原因如下:

更长的垃圾回收时间: 如果 GC 线程较少,垃圾回收过程可能需要更长的时间才能完成。由于可用于处理工作负载的线程较少,因此回收内存所需的时间会增加,从而导致 GC 暂停时间延长。

应用程序延迟增加: 较长的垃圾回收时间会导致延迟增加,尤其是对于需要低延迟操作的应用程序。用户可能会遇到延迟,因为应用程序在等待垃圾回收完成时变得无响应。

降低吞吐量: 较少的 GC 线程数意味着垃圾回收器无法高效工作,从而导致整体吞吐量降低。您的应用程序每秒处理的请求或事务可能会减少,从而影响其在负载下扩展的能力。

CPU 利用率低下: 如果 GC 线程太少,CPU 核心在垃圾回收期间可能无法得到充分利用。这可能会导致可用资源的使用效率低下,因为某些内核保持空闲状态,而其他内核则负担过重。

OutOfMemoryErrors 和内存泄漏的风险增加:如果垃圾回收器由于线程太少而无法跟上内存分配的速率,则它可能无法足够快地回收内存。这会增加应用程序内存不足的风险,从而导致潜在的崩溃。此外,GC 线程不足会减慢垃圾回收过程,从而允许更多未使用的对象在内存中积累,从而加剧内存泄漏。随着时间的推移,这可能会导致内存使用过多并进一步降低应用程序性能。OutOfMemoryErrors

优化 GC 线程数的解决方案

   如果您的应用程序由于 GC 线程数量过多或不足而出现性能问题,请考虑使用上述 JVM 参数手动设置 GC 线程计数:

-XX:ParallelGCThreads=n  

-XX:ConcGCThreads=n

   在生产环境中进行这些更改之前,必须研究应用程序的 GC 行为。首先使用工具收集和分析 GC 日志。此分析将帮助您确定当前线程计数是否导致性能瓶颈。根据这些见解,您可以对 GC 线程数进行明智的调整,而不会引入新问题

注意:始终先在受控环境中测试更改,以确认它们提高了性能,然后再将其部署到生产环境中。

   平衡 GC 线程的数量是确保 Java 应用程序平稳运行的关键。通过仔细监控和调整这些设置,您可以避免潜在的性能问题并保持应用程序高效运行。


目录
相关文章
|
26天前
|
弹性计算 人工智能 架构师
阿里云携手Altair共拓云上工业仿真新机遇
2024年9月12日,「2024 Altair 技术大会杭州站」成功召开,阿里云弹性计算产品运营与生态负责人何川,与Altair中国技术总监赵阳在会上联合发布了最新的“云上CAE一体机”。
阿里云携手Altair共拓云上工业仿真新机遇
|
2天前
|
人工智能 Rust Java
10月更文挑战赛火热启动,坚持热爱坚持创作!
开发者社区10月更文挑战,寻找热爱技术内容创作的你,欢迎来创作!
308 14
|
18天前
|
存储 关系型数据库 分布式数据库
GraphRAG:基于PolarDB+通义千问+LangChain的知识图谱+大模型最佳实践
本文介绍了如何使用PolarDB、通义千问和LangChain搭建GraphRAG系统,结合知识图谱和向量检索提升问答质量。通过实例展示了单独使用向量检索和图检索的局限性,并通过图+向量联合搜索增强了问答准确性。PolarDB支持AGE图引擎和pgvector插件,实现图数据和向量数据的统一存储与检索,提升了RAG系统的性能和效果。
|
5天前
|
JSON 自然语言处理 数据管理
阿里云百炼产品月刊【2024年9月】
阿里云百炼产品月刊【2024年9月】,涵盖本月产品和功能发布、活动,应用实践等内容,帮助您快速了解阿里云百炼产品的最新动态。
阿里云百炼产品月刊【2024年9月】
|
20天前
|
人工智能 IDE 程序员
期盼已久!通义灵码 AI 程序员开启邀测,全流程开发仅用几分钟
在云栖大会上,阿里云云原生应用平台负责人丁宇宣布,「通义灵码」完成全面升级,并正式发布 AI 程序员。
|
22天前
|
机器学习/深度学习 算法 大数据
【BetterBench博士】2024 “华为杯”第二十一届中国研究生数学建模竞赛 选题分析
2024“华为杯”数学建模竞赛,对ABCDEF每个题进行详细的分析,涵盖风电场功率优化、WLAN网络吞吐量、磁性元件损耗建模、地理环境问题、高速公路应急车道启用和X射线脉冲星建模等多领域问题,解析了问题类型、专业和技能的需要。
2584 22
【BetterBench博士】2024 “华为杯”第二十一届中国研究生数学建模竞赛 选题分析
|
4天前
|
存储 人工智能 搜索推荐
数据治理,是时候打破刻板印象了
瓴羊智能数据建设与治理产品Datapin全面升级,可演进扩展的数据架构体系为企业数据治理预留发展空间,推出敏捷版用以解决企业数据量不大但需构建数据的场景问题,基于大模型打造的DataAgent更是为企业用好数据资产提供了便利。
177 2
|
2天前
|
编译器 C#
C#多态概述:通过继承实现的不同对象调用相同的方法,表现出不同的行为
C#多态概述:通过继承实现的不同对象调用相同的方法,表现出不同的行为
102 65
|
6天前
|
Linux 虚拟化 开发者
一键将CentOs的yum源更换为国内阿里yum源
一键将CentOs的yum源更换为国内阿里yum源
283 2
|
22天前
|
机器学习/深度学习 算法 数据可视化
【BetterBench博士】2024年中国研究生数学建模竞赛 C题:数据驱动下磁性元件的磁芯损耗建模 问题分析、数学模型、python 代码
2024年中国研究生数学建模竞赛C题聚焦磁性元件磁芯损耗建模。题目背景介绍了电能变换技术的发展与应用,强调磁性元件在功率变换器中的重要性。磁芯损耗受多种因素影响,现有模型难以精确预测。题目要求通过数据分析建立高精度磁芯损耗模型。具体任务包括励磁波形分类、修正斯坦麦茨方程、分析影响因素、构建预测模型及优化设计条件。涉及数据预处理、特征提取、机器学习及优化算法等技术。适合电气、材料、计算机等多个专业学生参与。
1580 16
【BetterBench博士】2024年中国研究生数学建模竞赛 C题:数据驱动下磁性元件的磁芯损耗建模 问题分析、数学模型、python 代码