JVM Profiler介绍

简介: 开篇 过去的几周把java多线程相关部分的源码粗粗的看了一遍基本上也算告一段落了,后面应该会聚焦看下dubbo、mycat、datax以及剩下部分的mybatis。

开篇

 过去的几周把java多线程相关部分的源码粗粗的看了一遍基本上也算告一段落了,后面应该会聚焦看下dubbo、mycat、datax以及剩下部分的mybatis。

 应该是周一的时候公众号推了一篇文章《Uber开源JVM Profiler,用以跟踪分布式Java虚拟机》,刚好认识公司内部的一个大神(在java方面造诣很深让人非常佩服,技术深的跟大海一样,知道是谁了吧,你们懂的)在公司内部开发了类似的系统,然后勾起了我的兴趣,然后自然而然地把核心代码看了一遍,准备分几篇文章依次讲解,希望有兴趣的可以一并看看。

 之所以我觉得值得看,原因有以下几点:

  • 代码全java编写,结构清晰阅读难度不大。
  • 整个代码框架非常有扩展性,适合内部拉分支然后继承更多的东西。
  • 对jvm相关系统采集、jvm字节码修改等技术有一定了解。


JVM Profile诞生

 Apache Spark 计算框架已经被广泛用来构建大规模数据应用。对 Uber 而言, 数据是战略决策和产品开发的核心。为了更好地利用这些数据, Uber 需要管理遍布全球的 Spark 实例。 Spark 使得数据技术更易于访问, 如果要做到对 Spark 应用程序的进行合理的资源分配, 优化数据基础架构的操作效率, 就需要对这些系统有更细粒度的洞察力, 即识别其资源使用模式。
 为了在不改变用户代码的情况下也能达成上述目标, Uber Engineering 团队构建并开源了 JVM Profiler —— 一个分布式探查器,用于收集性能和资源使用率指标为进一步分析提供服务。尽管它是为 Spark 应用而构建的, 但它的通用实现使其适用于任何基于 Java 虚拟机 ( Java virtual machine ,JVM) 的服务或应用程序。
但是,JVM Profile可以用到其他地方,包括用来监控方法级耗时,IO&CPU性能,JVM各代垃圾回收等


JVM Profiler介绍

 Uber Engineering 团队构建并开源了 JVM Profiler 。现有的同类开源工具, 比如 Etsy 的 statsd-jvm-profiler , 可以在单个应用程序级别收集度量, 但是不提供动态代码注入收集度量的能力。在这些工具的启发下, 我们的探查器提供了新功能, 如任意 Java 方法/参数分析。

 JVM Profiler 由三项主要功能组成, 它使收集性能和资源使用率指标变得更容易, 然后可以将这些指标 (如 Apache Kafka) 提供给其他系统进行进一步分析:

  • 代理功能 ( java agent ) : 支持用户以分布式的方式收集各种指标 (例如如 CPU/内存利用率) ,用于 JVM 进程的堆栈跟踪。
  • 高级分析功能(Advanced profiling capabilities): 支持跟踪任意 Java 方法和用户代码中的参数, 而不进行任何实际的代码更改。此功能可用于跟踪 Spark 应用的 HDFS NameNode RPC 调用延迟, 并标识慢速方法调用。它还可以跟踪每个 Spark 应用读取或写入的 HDFS 文件路径, 用以识别热文件后进一步优化。
  • 数据分析报告( Data analytics reporting ): 使用 JVM Profile 可以将指标数据推送给 Kafka topics 和 Apache Hive tables , 提高数据分析的速度和灵活性。


JVM Profiler 实现

JVM Profiler 具有非常简单且可扩展的设计。可以很容易地添加其他 Profiler 收集更多的指标, 也能部署自定义 reporter 向不同的系统发送数据指标。

img_e6e5d5e6bd6370833613d822c961c102.png
image

一旦启动 JVM Profiler 代码即通过代理参数加载到一个 Java 进程中。它由三个主要部分组成:

Class File Transformer

  • 类文件转换器介由进程内的 Java 方法字节码监视任意用户代码并在内部度量缓冲区中保存度量。

Metric Profilers

  • CPU/Memory Profiler: 通过 JMX 收集 CPU/内存利用率并发送给 reporter
  • Method Duration Profiler: 从度量缓冲区读取方法时延 (method duration) 并发送给 reporter
  • Method Argument Profiler: 从度量缓冲区读取方法参数值(method argument )并发送给 reporter

Reporters

  • Console Reporter: 控制台输出
  • Kafka Reporter: 发送到 Kafka topics

JVM Profiler 扩展
通过 -javaagent 选项可以构建自己的 reporter , 例如:

java -javaagent:jvm-profiler-0.0.5.jar=reporter=com.uber.profiling.reporters.CustomReporter



JVM Profiler 应用
示例:使用 JVM Profiler 跟踪一个简单的 Java 应用

首先,git clone 项目代码
git clone https://github.com/uber-common/jvm-profiler.git

然后,mvn package 构建 jvm-profiler jar
mvn clean package

最后,调用 JAR 运行 JVM Profiler (e.g.target/jvm-profiler-0.0.5.jar)
java -javaagent:target/jvm-profiler-0.0.5.jar=reporter=com.uber.profiling.reporters.ConsoleOutputReporter -cp target/jvm-profiler-0.0.5.jar com.uber.profiling.examples.HelloWorldApplication

上述命令行将运行一个简单的 Java 应用并通过控制台输出性能和资源使用情况。

ConsoleOutputReporter - MethodDuration: {"metricName":"duration.count","processName":"1871@xiaozhideMacBook-Pro.local","appId":null,"host":"xiaozhideMacBook-Pro.local","processUuid":"ab87c07f-0c4b-493e-9465-f2b081545873","metricValue":2.0,"methodName":"publicSleepMethod","className":"com.uber.profiling.examples.HelloWorldApplication","epochMillis":1536043534991,"tag":"mytag"}
ConsoleOutputReporter - MethodDuration: {"metricName":"duration.sum","processName":"1871@xiaozhideMacBook-Pro.local","appId":null,"host":"xiaozhideMacBook-Pro.local","processUuid":"ab87c07f-0c4b-493e-9465-f2b081545873","metricValue":2026.0,"methodName":"publicSleepMethod","className":"com.uber.profiling.examples.HelloWorldApplication","epochMillis":1536043534991,"tag":"mytag"}
ConsoleOutputReporter - MethodDuration: {"metricName":"duration.min","processName":"1871@xiaozhideMacBook-Pro.local","appId":null,"host":"xiaozhideMacBook-Pro.local","processUuid":"ab87c07f-0c4b-493e-9465-f2b081545873","metricValue":1005.0,"methodName":"publicSleepMethod","className":"com.uber.profiling.examples.HelloWorldApplication","epochMillis":1536043534991,"tag":"mytag"}


参考文章

jvm-profiler github

目录
相关文章
|
分布式计算 监控 Java
Uber jvm profiler 使用
Uber jvm profiler 使用
299 0
Uber jvm profiler 使用
|
存储 SQL 分布式计算
如何用 Uber JVM Profiler 等可视化工具监控 Spark 应用程序?
  关键要点   持续可靠地运行 Spark 应用程序是一项具有挑战性的任务,而且需要一个良好的性能监控系统。   - 在设计性能监控系统时有三个目标——收集服务器和应用程序指标、在时序数据库中存储指标,并提供用于数据可视化的仪表盘。   Uber JVM Profiler 被用于监控 Spark 应用程序,用到的其他技术还有 InfluxDB(用于存储时序数据)和 Grafana(数据可视化工具)。性能监控系统可帮助 DevOps 团队有效地监控系统,用以满足应用程序的合规性和 SLA。
279 0
|
监控 Java 调度
JVM Profiler 启动过程分析
开篇  先来调侃一句,原来独角兽Uber的程序员写的代码也是看得懂的,而且还是比较容易看得懂的,所以有时候在设计模式和代码结构清晰以及可读性方面我还是更倾向于后者,宁可重复或浪费一部分代码也要整个代码的可读性更强一些。
1173 0
|
数据采集 Linux 索引
JVM Profiler IOProfiler
开篇  IOProfiler因为采集方法的限制,目前支持linux系统指标采集,但是不支持mac,windows等操作系统。  IOProfiler通过读取linux系统的/proc/self/io的当前线程的IO指标数据,该文件的内容如下图所示,通过解析成kv键值对完成采集。
1045 0
|
Java
JVM Profiler CpuAndMemoryProfiler
开篇   CpuAndMemoryProfiler主要用来采集cpu和memory相关的信息,采集核心方法都是由ManagementFactory提供的接口: getClassLoadingMXBean() 返回 Java 虚拟机的类加载系统的管理 Bean。
899 0
|
Java
JVM Profiler StacktraceCollectorProfiler
开篇  StacktraceCollectorProfiler主要用来采集线程的调用栈,原理是通过ManagementFactory.getThreadMXBean()返回的ThreadMXBean对象来实现。
825 0
|
监控 Java 编解码
JVM Profiler 方法耗时采集
开篇  JVM Profile的方法采集通过修改字节码在原来方法体的前置和后置增加采集耗时的代码。核心是基于基于java自带的instrument包和javassist包来实现的。
1193 0
|
NoSQL Java Redis
JVM Profiler Reporter介绍
开篇  JVM Profiler采集完数据后可以通过多种途径上报数据,对接Console,File,redis,kafka等,这篇文章会把源码罗列一下毕竟都很简单。
1185 0
|
监控 Java 消息中间件
JVM Profiler 整体架构
开篇 整个JVM Profiler的组件类似于上图,抽象出来主要分为:Class File Transformer:负责转换被监控方法的字节码,在前后增加耗时统计。
1065 0
|
2月前
|
缓存 Prometheus 监控
Elasticsearch集群JVM调优设置合适的堆内存大小
Elasticsearch集群JVM调优设置合适的堆内存大小
527 1