【Java虚拟机】JVM诊断神器Arthas入门实操

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 【Java虚拟机】JVM诊断神器Arthas入门实操

1.Arthas简介快速入门

d61a80e8671c4d7c839a389c3706bb12.jpg

  • 阿里开源的Java诊断工具,它可以在运行时对Java应用程序进行动态诊断和调试
  • 当你遇到以下类似问题而束手无策时,Arthas可以帮助你解决

这个类从哪个 jar 包加载的?为什么会报各种类相关的 Exception?

我改的代码为什么没有执行到?难道是我没 commit?分支搞错了?

遇到问题无法在线上 debug,难道只能通过加日志再重新发布吗?

线上遇到某个用户的数据处理有问题,但线上同样无法 debug,线下无法重现!

是否有一个全局视角来查看系统的运行状况?

有什么办法可以监控到 JVM 的实时运行状态?

怎么快速定位应用的热点,生成火焰图?

怎样直接从 JVM 内查找某个类的实例?

github地址:https://github.com/alibaba/arthas

官网:https://arthas.aliyun.com/

版本:Arthas-3.6.7

环境说明

Arthas 支持 JDK 6+,支持 Linux/Mac/Windows,采用命令行交互模式,

提供丰富的 Tab 自动补全功能,进一步方便进行问题的定位和诊断

也支持浏览器直接访问对应的ip+端口,固定端口 8563

默认情况下,arthas 只 listen 127.0.0.1,所以如果想从远程连接,使用 --target-ip参数指定 listen 的 IP

快速使用

启动 java -jar arthas-boot.jar

04270329836f43a7b543a82eb51359f5.jpg


运行日志路径 ~/logs/arthas/arthas.log

84d68db4af4c408794767f2e3eba8fb1.jpg


退出 arthas

如果只是退出当前的连接,其他客户端不受影响,可以用 quit或者exit命令

目标进程上的 arthas 还会继续运行,端口保持开放,下次连接时执行java -jar arthas-boot.jar可以直接连接上

如果想完全退出 arthas,可以执行stop命令

2.Arthas常用基础命令实战

  • version - 输出当前目标 Java 进程所加载的 Arthas 版本号
  • base64 - base64 编码转换,和 linux 里的 base64 命令类似

cat - 打印文件内容,和 linux 里的 cat 命令类似

cls - 清空当前屏幕区域

echo - 打印参数,和 linux 里的 echo 命令类似

grep - 匹配查找,和 linux 里的 grep 命令类似

help - 查看命令帮助信息

history - 打印命令历史

keymap - Arthas 快捷键列表及自定义快捷键

pwd - 返回当前的工作目录,和 linux 命令类似

quit - 退出当前 Arthas 客户端,其他 Arthas 客户端不受影响

reset - 重置增强类,将被 Arthas 增强过的类全部还原,Arthas 服务端关闭时会重置所有增强过的类

session - 查看当前会话的信息

stop - 关闭 Arthas 服务端,所有 Arthas 客户端全部退出

tee - 复制标准输入到标准输出和指定的文件,和 linux 里的 tee 命令类似

61853ce1763244b1b66adcaac374e80f.jpg

3.Arthas常用JVM命令案例实战

(1)JVM相关的命令

  • dashboard - 当前系统的实时数据面板

heapdump - dump java heap, 类似 jmap 命令的 heap dump 功能

jvm - 查看当前 JVM 的信息

memory - 查看 JVM 的内存信息

ognl - 执行 ognl 表达式

perfcounter - 查看当前 JVM 的 Perf Counter 信息

sysenv - 查看 JVM 的环境变量

sysprop - 查看和修改 JVM 的系统属性

thread - 查看当前 JVM 的线程堆栈信息

vmoption - 查看和修改 JVM 里诊断相关的 option

(2)dashboard - 当前系统的实时数据面板

  • 整体大面板

b94908aebb504708b40040f0b4624dec.jpg

  • 顶部-线程的基本信息

image.jpeg

字段 说明
id Java 级别的线程 ID
name 线程名称
group 线程组名称
proirity 线程优先级,1 ~ 10 之间的数字,越大优先级越高
state 线程的状态
cpu 线程的 cpu 使用率
lta_time 上次采样之后线程运行增量 CPU 时间,数据格式为秒
time 线程运行总 CPU 时间,数据格式为 分:秒
interupted 当前线程是否中断
daemon 是否是 daemon 守护线程
  • 中部-堆内存的使用情况


49f3bc68b4c54d0e8201051fa5f101e7.jpg

字段 说明
used 当前使用了多少内存
total 总共分配了多少内存
max 最大使用了多少
usage 使用比例
gc 垃圾回收器
  • 底部-操作系统信息,JDK版本

e01fafd57c7c4411999f90b763266b1b.jpg

(3)thead - 查看当前 JVM 的线程堆栈信息

  • 常用参数
  • –all :显示所有匹配的线程,默认就是第一页线程信息

image.jpeg

  • -i:设置cpu统计时的采样间隔,单位为毫秒 thread -i 2000

image.jpeg

  • [ id ]:查看指定ID的线程堆栈 thread 54

d4f81d46f1044b40a588c72f648c99d5.jpg

  • -n :查看CPU使用率最高的TopN个线程, 如果值为-1表示显示所有线程 thread -n 3

d98f689ee3304302b06ec1b131828964.jpg

-b :展示阻塞线程 thread -b

cf864118d50d4cefb9de644a22973410.jpg


–state : 根据线程状态筛选线程 thread --state TIMED_WAITING

状态类型:NEW, RUNNABLE, TIMED_WAITING, WAITING, BLOCKED,TERMINATED


8e3258e936364949bbfa24cfda846768.jpg

(4)heapdump - 类似 jmap 命令的 heap dump 功能

  • 生成堆栈快照 heapdump /Users/mac/Desktop/heapdump.hprof


a5e4dd79cae9426da242bf6597032834.jpg

(5)jvm - 查看当前 JVM 的信息

afbf07ec381f49fcbc45f877ffe33759.jpg

(6)sysenv - 查看 JVM 的环境变量

2960faed793b454f9eb8b5a6c86ed9a4.jpg

(7)sysprop - 查看和修改 JVM 的系统属性

  • 查看所有属性:sysprop

fd4c71644b974ac99abd4601878dd056.jpg

  • 查看单个属性:sysprop java.version

9c43ef501700453e89cff2bd547dac28.jpg

  • 修改某个属性:sysprop user.country CN


654df90a70fd477e81fa2cba10b8a1e7.jpg

(8)sc - 查看 JVM 已加载的类信息

  • -d 详情,-f 类属性输出
  • sc -d -f com.lixiang.controller.SpringTestController
  • 6b9c0b13704c41e4932c4c228fc5c2a9.jpg

(9)sm - 查看已加载类的方法信息

  • sm -d com.lixiang.controller.SpringTestController

bfd7d834262444a286efdebcb6eaca8f.jpg

(10)jad - 反编译指定已加载类的源码

  • 反编译整个类 jad com.lixiang.SpringTestApplication

0729b94018d44e42a81da9654007e9ab.jpg

  • 通过--source-only选项,可以只打印源代码

aa785ae44ee5400a91eee48079960ce5.jpg

  • 应用场景
  • 查看某个类的业务逻辑,方法逻辑
  • 查看本地修改的代码是否线上成功生效

4.Arthas方法诊断命令案例实战

(1)monitor - 方法执行监控

  • 非实时响应,需要对应的方法有被调用才行,所以需要触发web接口请求
  • 监视一个时间段中指定方法的执行次数,成功次数,失败次数,耗时等这些信息
  • monitor -c 2 com.lixiang.controller.SpringTestController query

a303e256a5154021bce7ed0120967e5a.jpg


5c222cc0b5534c0f9e414f070be79bb1.jpg

7e7b6bf596b64bab924650d6bdd46120.jpg

(2)stack - 输出当前方法被调用的调用路径, 一个方法被执行的路径非常多,不知道这个方法是从那里被执行,就可以采用

  • 案例 stack com.lixiang.controller.SpringTestController query

fd83c8b377724a72a077dad4444e46c7.jpg

403b8e8c84f440c1b01f25adeb96887d.jpg


79be7e37ca9d49a2ba8e3bd94cf099b8.jpg

(3)trace - 方法内部调用,输出方法路径上的每个节点上耗时, 定位因 RT 高导致的性能问题

  • 每次只能跟踪一级方法的调用链路
  • 案例输出全部方法 trace com.lixiang.controller.SpringTestController *

ts: 时间戳,表示日志记录的时间,该字段的值为2023年3月26日下午5点48分46秒。

thread_name: 线程名称,表示当前执行该日志记录的线程名称,该字段的值为http-nio-8080-exec-10。

id: 线程ID,表示当前执行该日志记录的线程ID,该字段的值为20。

  • is_daemon: 是否为守护线程,该字段的值为true,表示该线程是守护线程。
  • priority: 线程优先级,该字段的值为5,表示该线程的优先级为5。
  • TCCL: 线程上下文类加载器,表示当前线程的上下文类加载器为TomcatEmbeddedWebappClassLoader。

2919855aa71e41bea88ccc46bbacb304.jpg

默认情况下,trace不会包含jdk里的函数调用,如果希望trace jdk里的函数, 需要显式设置–skipJDKMethod false

即 trace --skipJDKMethod false com.lixiang.controller.SpringTestController *

67910d6653114830867bd07dc0a1185d.jpg

(4)watch - 方法执行数据观测

  • 应用场景:查看方法调用栈,参数入参,返回值等调试
  • 默认的 观察表达式,默认值是{params, target, returnObj}
  • 也可以指定观察返回值 watch com.lixiang.controller.SpringTestController * {params,returnObj}


973f60c428624089ad8122844d6a18dc.jpg

  • 展开里面具体的值 -x 参数表示遍历深度,可以调整来打印具体的参数和结果内容,默认值是 1, 最大是4。
  • watch com.lixiang.controller.SpringTestController * {params,returnObj} -x 4


f4e5166dbe3b46edb15fa6244b8ec2da.jpg

5.Arthas在线调试案例实战

  • 生产环境运行了java程序,需要在线调试,在不重启JVM程序,动态调整,打印参数或修改方法内部逻辑。
  • 步骤以及环境准备f308e26eb70c4d5895314c7afbb1b534.jpg
  • 第一步:jad 把字节码文件反编译成源代码


81da20ae1d4d4bd4b44b811f142e8cc5.jpg



aace80d1af98416ebbc263f85096fc94.jpg

  • 第二步:mc 在内存中把源代码编译成字节码文件

e1a819bcdf7e410fad4ad3c4c8bb9ccf.jpg

9b1fa50b247449b6a1aef5d7b80fda80.jpg

  • 第三步:redefine 把新生成的字节码文件在内存中执行

b0fcc5e6c954419ba0f594a804c85d6f.jpg

e75b8245cdff4083a68d5ba9cae37405.jpg


相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
23天前
|
监控 算法 Java
Java虚拟机(JVM)的垃圾回收机制深度解析####
本文深入探讨了Java虚拟机(JVM)的垃圾回收机制,旨在揭示其背后的工作原理与优化策略。我们将从垃圾回收的基本概念入手,逐步剖析标记-清除、复制算法、标记-整理等主流垃圾回收算法的原理与实现细节。通过对比不同算法的优缺点及适用场景,为开发者提供优化Java应用性能与内存管理的实践指南。 ####
|
14天前
|
监控 算法 Java
Java虚拟机(JVM)垃圾回收机制深度剖析与优化策略####
本文作为一篇技术性文章,深入探讨了Java虚拟机(JVM)中垃圾回收的工作原理,详细分析了标记-清除、复制算法、标记-压缩及分代收集等主流垃圾回收算法的特点和适用场景。通过实际案例,展示了不同GC(Garbage Collector)算法在应用中的表现差异,并针对大型应用提出了一系列优化策略,包括选择合适的GC算法、调整堆内存大小、并行与并发GC调优等,旨在帮助开发者更好地理解和优化Java应用的性能。 ####
23 0
|
11天前
|
监控 架构师 Java
Java虚拟机调优的艺术:从入门到精通####
本文作为一篇深入浅出的技术指南,旨在为Java开发者揭示JVM调优的神秘面纱,通过剖析其背后的原理、分享实战经验与最佳实践,引领读者踏上从调优新手到高手的进阶之路。不同于传统的摘要概述,本文将以一场虚拟的对话形式,模拟一位经验丰富的架构师向初学者传授JVM调优的心法,激发学习兴趣,同时概括性地介绍文章将探讨的核心议题——性能监控、垃圾回收优化、内存管理及常见问题解决策略。 ####
|
11天前
|
存储 监控 算法
深入探索Java虚拟机(JVM)的内存管理机制
本文旨在为读者提供对Java虚拟机(JVM)内存管理机制的深入理解。通过详细解析JVM的内存结构、垃圾回收算法以及性能优化策略,本文不仅揭示了Java程序高效运行背后的原理,还为开发者提供了优化应用程序性能的实用技巧。不同于常规摘要仅概述文章大意,本文摘要将简要介绍JVM内存管理的关键点,为读者提供一个清晰的学习路线图。
|
14天前
|
存储 监控 算法
Java虚拟机(JVM)垃圾回收机制深度解析与优化策略####
本文旨在深入探讨Java虚拟机(JVM)的垃圾回收机制,揭示其工作原理、常见算法及参数调优方法。通过剖析垃圾回收的生命周期、内存区域划分以及GC日志分析,为开发者提供一套实用的JVM垃圾回收优化指南,助力提升Java应用的性能与稳定性。 ####
|
17天前
|
机器学习/深度学习 监控 算法
Java虚拟机(JVM)的垃圾回收机制深度剖析####
本文深入探讨Java虚拟机(JVM)的垃圾回收机制,揭示其工作原理、常见算法、性能调优策略及未来趋势。通过实例解析,为开发者提供优化Java应用性能的思路与方法。 ####
31 1
|
18天前
|
Oracle 安全 Java
深入理解Java生态:JDK与JVM的区分与协作
Java作为一种广泛使用的编程语言,其生态中有两个核心组件:JDK(Java Development Kit)和JVM(Java Virtual Machine)。本文将深入探讨这两个组件的区别、联系以及它们在Java开发和运行中的作用。
38 1
|
27天前
|
Ubuntu 网络安全 虚拟化
VMware虚拟机ping不通原因排查及分析
下面以 VMware 虚拟机为例进行介绍。
348 3
|
1月前
|
存储 SQL 数据库
虚拟化数据恢复—Vmware虚拟机误还原快照的数据恢复案例
虚拟化数据恢复环境: 一台虚拟机从物理机迁移到ESXI虚拟化平台,迁移完成后做了一个快照。虚拟机上运行了一个SQL Server数据库,记录了数年的数据。 ESXI虚拟化平台上有数十台虚拟机,EXSI虚拟化平台连接了一台EVA存储,所有的虚拟机都存放在EVA存储上。 虚拟化故障: 工组人员误操作将数年前迁移完成后做的快照还原了,也就意味着虚拟机状态还原到数年前,近几年数据都被删除了。 还原快照相当于删除数据,意味着部分存储空间会被释放。为了不让这部分释放的空间被重用,需要将连接到这台存储的所有虚拟机都关掉,需要将不能长时间宕机的虚拟机迁移到别的EXSI虚拟化平台上。
105 50
|
2月前
|
安全 虚拟化 数据中心
Xshell 连接 VMware虚拟机操作 截图和使用
Xshell 连接 VMware虚拟机操作 截图和使用
63 4

热门文章

最新文章