浅谈阿里开源JVM Sandbox(内含代码实战)

简介: 浅谈阿里开源JVM Sandbox(内含代码实战)

在日常业务代码开发中,我们经常接触到AOP(面向切面编程),比如熟知的Spring AOP。我们经常用它来实现业务切面逻辑,比如登录校验,日志记录,性能监控,全局过滤器等。但Spring AOP有一个局限性,并不是所有的类都托管在 Spring 容器中,例如很多中间件代码、三方包代码和部分原生代码,都不能被Spring AOP代理到。如此一来,一旦你想实现的切面逻辑并不属于Spring的管辖范围,或者你想实现Spring之外的切面功能,就无从下手。

对于Java后端应用,有没有一种更为通用的AOP方式?答案是有的,Java自身提供了JVM TI,Instrumentation等特性和接口,允许使用者以通过一系列原生API完成对JVM的复杂控制。自此衍生出了很多著名的框架,比如Btrace,Arthas等等,帮助开发者们实现更多更复杂的Java功能。


JVM Sandbox也是其中的一员。当然,不同框架的设计目的和使命是不一样的,JVM-Sandbox的设计目的是实现一种在不重启、不侵入目标JVM应用情况下的AOP解决方案。


举几个典型的JVM-Sandbox应用场景:


  • 流量回放:如何录制线上应用每次接口请求的入参和出参?改动应用代码固然可以,但成本太大,通过JVM-Sandbox,可以直接在不修改代码的情况下,直接抓取接口的出入参。
  • 安全漏洞热修复:假设某个三方包(例如出名的fastjson)又出现了漏洞,集团内那么多应用,一个个发布新版本修复,漏洞已经造成了大量破坏。通过JVM-Sandbox,直接修改替换有漏洞的代码,及时止损。
  • 接口故障模拟:想要模拟某个接口超时5s后返回false的情况,JVM-Sandbox很轻松就能实现。
  • 故障定位:像Arthas类似的功能。
  • 接口限流:动态对指定的接口做限流。
  • 日志打印...


可以看到,借助JVM-Sandbox,你可以实现很多之前在传统切面实现中做不了的事,大大拓展了切面可操作的范围。


本文围绕JVM SandBox展开,主要介绍如下内容:


  • JVM SandBox的诞生背景
  • JVM SandBox的架构设计
  • 代码实战:Spring Bean初始化耗时统计
  • JVM SandBox的底层技术
  • 总结


JVM Sandbox诞生背景


JVM Sandbox诞生的技术背景在引言中已经赘述完毕,下面是作者开发该框架的一些业务背景,以下描述引用自文章[1]:

JVM SandBox 是阿里开源的一款 JVM 平台非侵入式运行期 AOP 解决方案,本质上是一种 AOP 落地形式。那么可能有同学会问:已有成熟的 Spring AOP 解决方案,阿里巴巴为什么还要“重复造轮子”?这个问题要回到 JVM SandBox 诞生的背景中来回答。在 2016 年中,天猫双十一催动了阿里巴巴内部大量业务系统的改动,恰逢徐冬晨(阿里巴巴测试开发专家)所在的团队调整,测试资源保障严重不足,迫使他们必须考虑更精准、更便捷的老业务测试回归验证方案。开发团队面临的是新接手的老系统,老的业务代码架构难以满足可测性的要求,很多现有测试框架也无法应用到老的业务系统架构中,于是需要新的测试思路和测试框架。


JVM Sandbox整体架构


本章节不详细赘述JVM SandBox的架构设计,只讲其中几个重要的特性,详细的架构设计可以看开源代码的Wiki[2]。


类隔离


很多框架通过破坏双亲委派(我更愿意称之为直系亲属委派)来实现类隔离,JVM SandBox也不例外。它通过自定义的SandboxClassLoader破坏了双亲委派的约定,实现了几个隔离特性:

  • 和目标应用的类隔离:不用担心加载沙箱会引起原应用的类污染、冲突。
  • 模块之间类隔离:做到模块与模块之间、模块和沙箱之间、模块和应用之间互不干扰。


图1 JVM Sandbox架构(引用自官方文档)


无侵入AOP与事件驱动

JVM-SANDBOX属于基于Instrumentation的动态编织类的AOP框架,通过精心构造了字节码增强逻辑,使得沙箱的模块能在不违反JDK约束情况下实现对目标应用方法的无侵入运行时AOP拦截


图2 JVM Sandbox编织代码示例(引用自官方文档)


从上图中,可以看到一个方法的整个执行周期都被代码“加强”了,能够带来的好处就是你在使用JVM SandBox只需要对于方法的事件进行处理。


主要是以下三种事件:


// BEFOREtry {
/** do something...*/// RETURNreturn;
} catch (Throwablecause) {
// THROWS}



在沙箱的世界观中,任何一个Java方法的调用都可以分解为BEFORERETURNTHROWS三个环节,由此在三个环节上引申出对应环节的事件探测和流程控制机制。

基于BEFORERETURNTHROWS三个环节事件分离,沙箱的模块可以完成很多类AOP的操作。

  1. 可以感知和改变方法调用的入参
  2. 可以感知和改变方法调用返回值和抛出的异常
  3. 可以改变方法执行的流程
  • 在方法体执行之前直接返回自定义结果对象,原有方法代码将不会被执行
  • 在方法体返回之前重新构造新的结果对象,甚至可以改变为抛出异常
  • 在方法体抛出异常之后重新抛出新的异常,甚至可以改变为正常返回

(引用自官方文档)


一切都是事件驱动的,这一点你可能很迷糊,但是别担心,请继续往下阅读,在下文的实战环节中,可以帮助你理解事件驱动的含义。


代码实战


示例代码版本:JVM-Sandbox 1.2.0


在平常的业务开发中,我们会遇到很多启动时间非常久的应用,通常都是因为业务代码堆积,缺乏维护导致。通常我们会视而不见,忍一忍海阔天空。但是当积累到一定的程度,每次部署应用就成了开发者们的负担,常常需要等待几分钟甚至十几分钟。对于Spring应用来说,大部分启动时间都消耗在了Spring Bean的初始化上,所以我们来实现一个小工具,统计Spring Bean初始化的耗时,最后形成数据表,供开发者优化分析。


在JVM SandBox中如何实现上面的工具?其实非常简单。


先贴上思路的整体流程:


图3 工具流程图


首先新建Maven工程,在Maven依赖中引用JVM SandBox,官方推荐独立工程使用parent方式。


<parent><groupId>com.alibaba.jvm.sandbox</groupId><artifactId>sandbox-module-starter</artifactId><version>1.2.0</version></parent>



新建一个类作为一个JVM SandBox模块,如下图:


图4 主入口代码实现


使用@Infomation声明mode为AGENT模式,一共有两种模式Agent和Attach。

  • Agent:随着JVM启动一起启动
  • Attach:在已经运行的JVM进程中,动态的插入


我们由于是监控JVM启动数据,所以需要AGENT模式。


其次,继承com.alibaba.jvm.sandbox.api.Module和com.alibaba.jvm.sandbox.api.ModuleLifecycle。


其中ModuleLifecycle包含了整个模块的生命周期回调函数。


  • onLoad:模块加载,模块开始加载之前调用!模块加载是模块生命周期的开始,在模块生命中期中有且只会调用一次。 这里抛出异常将会是阻止模块被加载的唯一方式,如果模块判定加载失败,将会释放掉所有预申请的资源,模块也不会被沙箱所感知。
  • onUnload:模块卸载,模块开始卸载之前调用!模块卸载是模块生命周期的结束,在模块生命中期中有且只会调用一次。 这里抛出异常将会是阻止模块被卸载的唯一方式,如果模块判定卸载失败,将不会造成任何资源的提前关闭与释放,模块将能继续正常工作。
  • onActive:模块被激活后,模块所增强的类将会被激活,所有com.alibaba.jvm.sandbox.api.listener.EventListener将开始收到对应的事件。
  • onFrozen:模块被冻结后,模块所持有的所有com.alibaba.jvm.sandbox.api.listener.EventListener将被静默,无法收到对应的事件。 需要注意的是,模块冻结后虽然不再收到相关事件,但沙箱给对应类织入的增强代码仍然还在。
  • loadCompleted:模块加载完成,模块完成加载后调用!模块完成加载是在模块完成所有资源加载、分配之后的回调,在模块生命中期中有且只会调用一次。 这里抛出异常不会影响模块被加载成功的结果。模块加载完成之后,所有的基于模块的操作都可以在这个回调中进行。


最常用的是loadCompleted,所以我们重写loadCompleted类,在里面开启我们的监控类SpringBeanStartMonitor线程。


而SpringBeanStartMonitor的核心代码如下图:


图5 过滤器代码实现

使用Sandbox的doClassFilter过滤出匹配的类,这里我们是BeanFactory,接着使用doMethodFilter过滤出要监听的方法,这里是initializeBean。我们取initializeBean作为统计耗时的切入方法。为什么选择该方法,涉及到SpringBean的启动生命周期,不在本文赘述范围内。


图6 initializeBean入口源码注释


接着,我们使用JVM Sandbox提供的方法moduleEventWatcher.watch(springBeanFilter, springBeanInitListener, Event.Type.BEFORE, Event.Type.RETURN);将我们的springBeanInitListener监听器绑定到被观测的方法上,这样每次initializeBean被调用,都会走到我们的切面逻辑。


监听器的主要逻辑如下:

图7 监听逻辑代码实现


代码有点长,不必细看,主要就是在原方法的BeforeEvent(进入前)和ReturnEvent(执行正常返回后)执行上述的切面逻辑,我这里便是使用了一个HashMap存储每个Bean的初始化开始和结束时间,最终统计出初始化耗时。


最终,我们还需要一个方法来知道我们的原始Spring应用已经启动完毕,这样我们可以手动卸载我们的Sandbox模块,毕竟他已经完成了他的历史使命,不需要再依附在主进程上。

我们通过一个简陋的办法,检查应用的HTTP端口是否会返回小于500的状态码,来判断Spring容器是否已经正确启动并对外提供服务。当然如果你的Spring没有使用Web框架,就不能用这个方法来判断启动完成,你也许可以通过Spring自己的生命周期钩子函数来实现,这里图方便,省略了更复杂的实现。


整个SpringBean监听模块的开发就完成了,你可以感受到,你的开发和日常业务开发几乎没有区别,这就是JVM Sandbox封装带来的便利。


下面是实际运行的效果:


图7 工具生成的SpringBean耗时报表


PS:该工具经过拓展,已经在集团内部已经孵化为 应用启动速度治理平台 ,采集了包括SpringBean、HSF、CPU堆栈等Java后端应用启动数据,帮助集团内部应用优化部署时间,大幅度提升应用优化效率。


JVM Sandbox底层技术

整个JVM Sandbox的入门使用基本上讲完了,上文提到了一些JVM技术名词,可能小伙伴们听过但不是特别了解。这里简单阐述几个重要的概念,理清楚这几个概念之间的关系,以便大家更好的理解JVM Sandbox底层的实现。


JVMTI


JVMTI(JVM Tool Interface)是 Java 虚拟机所提供的 native 编程接口,JVMTI可以用来开发并监控虚拟机,可以查看JVM内部的状态,并控制JVM应用程序的执行。可实现的功能包括但不限于:调试、监控、线程分析、覆盖率分析工具等。

很多Java监控、诊断工具都是基于这种形式来工作的。如果arthas、jinfo、brace等,虽然这些工具底层是JVM TI,但是它们还使用到了上层工具JavaAgent。


JavaAgent和Instrumentation


Javaagent是java命令的一个参数。参数 -javaagent 可以用于指定一个 jar 包。


-agentlib:<libname>[=<选项>] # 加载本机代理库 <libname>, 例如 -agentlib:hprof,另请参阅 -agentlib:jdwp=help 和 -agentlib:hprof=help

-agentpath:<pathname>[=<选项>] # 按完整路径名加载本机代理库

-javaagent:<jarpath>[=<选项>] # 加载 Java 编程语言代理, 请参阅 java.lang.instrument


在上面的-javaagent参数中提到了参阅java.lang.instrument,这是在rt.jar 中定义的一个包,该包提供了一些工具帮助开发人员在 Java 程序运行时,动态修改系统中的 Class 类型。其中,使用该软件包的一个关键组件就是 Javaagent。从名字上看,似乎是个 Java 代理之类的,而实际上,他的功能更像是一个Class 类型的转换器,他可以在运行时接受重新外部请求,对Class类型进行修改。


Instrumentation的底层实现依赖于JVMTI。


JVM 会优先加载 带 Instrumentation 签名的方法,加载成功忽略第二种,如果第一种没有,则加载第二种方法。


Instrumentation支持的接口:


publicinterfaceInstrumentation {
//添加一个ClassFileTransformer//之后类加载时都会经过这个ClassFileTransformer转换voidaddTransformer(ClassFileTransformertransformer, booleancanRetransform);
voidaddTransformer(ClassFileTransformertransformer);
//移除ClassFileTransformerbooleanremoveTransformer(ClassFileTransformertransformer);
booleanisRetransformClassesSupported();
//将一些已经加载过的类重新拿出来经过注册好的ClassFileTransformer转换//retransformation可以修改方法体,但是不能变更方法签名、增加和删除方法/类的成员属性voidretransformClasses(Class<?>... classes) throwsUnmodifiableClassException;
booleanisRedefineClassesSupported();
//重新定义某个类voidredefineClasses(ClassDefinition... definitions)
throwsClassNotFoundException, UnmodifiableClassException;
booleanisModifiableClass(Class<?>theClass);
@SuppressWarnings("rawtypes")
Class[] getAllLoadedClasses();
@SuppressWarnings("rawtypes")
Class[] getInitiatedClasses(ClassLoaderloader);
longgetObjectSize(ObjectobjectToSize);
voidappendToBootstrapClassLoaderSearch(JarFilejarfile);
voidappendToSystemClassLoaderSearch(JarFilejarfile);
booleanisNativeMethodPrefixSupported();
voidsetNativeMethodPrefix(ClassFileTransformertransformer, Stringprefix);
}


Instrumentation的局限性:

  • 不能通过字节码文件和自定义的类名重新定义一个本来不存在的类
  • 增强类和老类必须遵循很多限制:比如新类和老类的父类必须相同;新类和老类实现的接口数也要相同,并且是相同的接口;新类和老类访问符必须一致。 新类和老类字段数和字段名要一致;新类和老类新增或删除的方法必须是private static/final修饰的;

再谈Attach和Agent


上面的实战章节中已经提到了attach和agent两者的区别,这里再展开聊聊。


在Instrumentation中,Agent模式是通过-javaagent:<jarpath>[=<选项>]从应用启动时候就插桩,随着应用一起启动。它要求指定的类中必须要有premain()方法,并且对premain方法的签名也有要求,签名必须满足以下两种格式:


publicstaticvoidpremain(StringagentArgs, Instrumentationinst)
publicstaticvoidpremain(StringagentArgs)


一个java程序中-javaagent参数的个数是没有限制的,所以可以添加任意多个javaagent。所有的java agent会按照你定义的顺序执行,例如:


java-javaagent:agent1.jar-javaagent:agent2.jar-jarMyProgram.jar


上面介绍Agent模式的Instrumentation是在 JDK 1.5中提供的,在1.6中,提供了attach方式的Instrumentation,你需要的是agentmain方法,并且签名如下:


publicstaticvoidagentmain (StringagentArgs, Instrumentationinst)
publicstaticvoidagentmain (StringagentArgs)


这两种方式各有不同用途,一般来说,Attach方式适合于动态的对代码进行功能修改,在排查问题的时候用的比较多。而Agent模式随着应用启动,所以经常用于提前实现一些增强功能,比如我上面实战中的启动观测,应用防火墙,限流策略等等。


总结


本文花了较短的篇幅重点介绍了JVM Sandbox的功能,实际用法,以及基础原理。它通过封装一些底层JVM控制的框架,使得对JVM层面的AOP开发变的异常简单,就像作者自己所说“JVM-SANDBOX还能帮助你做很多很多,取决于你的脑洞有多大了。


参考


[1] JVM SandBox 的技术原理与应用分析

https://www.infoq.cn/article/tsy4lgjvsfweuxebw*gp

[2] Github jvm-sandbox

https://github.com/alibaba/jvm-sandbox/wiki

[3] javaagent使用指南

https://www.cnblogs.com/rickiyang/p/11368932.html

[4] Java JVMTI和Instrumention机制介绍

https://www.jianshu.com/p/eff047d4480a

相关文章
|
6月前
|
监控 Java 调度
探秘Java虚拟机(JVM)性能调优:技术要点与实战策略
【6月更文挑战第30天】**探索JVM性能调优:**关注堆内存配置(Xms, Xmx, XX:NewRatio, XX:SurvivorRatio),选择适合的垃圾收集器(如Parallel, CMS, G1),利用jstat, jmap等工具诊断,解决Full GC问题,实战中结合MAT分析内存泄露。调优是平衡内存占用、延迟和吞吐量的艺术,借助VisualVM等工具提升系统在高负载下的稳定性与效率。
102 1
|
2月前
|
监控 架构师 Java
JVM进阶调优系列(6)一文详解JVM参数与大厂实战调优模板推荐
本文详述了JVM参数的分类及使用方法,包括标准参数、非标准参数和不稳定参数的定义及其应用场景。特别介绍了JVM调优中的关键参数,如堆内存、垃圾回收器和GC日志等配置,并提供了大厂生产环境中常用的调优模板,帮助开发者优化Java应用程序的性能。
|
2月前
|
存储 监控 算法
JVM调优深度剖析:内存模型、垃圾收集、工具与实战
【10月更文挑战第9天】在Java开发领域,Java虚拟机(JVM)的性能调优是构建高性能、高并发系统不可或缺的一部分。作为一名资深架构师,深入理解JVM的内存模型、垃圾收集机制、调优工具及其实现原理,对于提升系统的整体性能和稳定性至关重要。本文将深入探讨这些内容,并提供针对单机几十万并发系统的JVM调优策略和Java代码示例。
55 2
|
2月前
|
存储 Kubernetes 架构师
阿里面试:JVM 锁内存 是怎么变化的? JVM 锁的膨胀过程 ?
尼恩,一位经验丰富的40岁老架构师,通过其读者交流群分享了一系列关于JVM锁的深度解析,包括偏向锁、轻量级锁、自旋锁和重量级锁的概念、内存结构变化及锁膨胀流程。这些内容不仅帮助群内的小伙伴们顺利通过了多家一线互联网企业的面试,还整理成了《尼恩Java面试宝典》等技术资料,助力更多开发者提升技术水平,实现职业逆袭。尼恩强调,掌握这些核心知识点不仅能提高面试成功率,还能在实际工作中更好地应对高并发场景下的性能优化问题。
|
5月前
|
运维 监控 Java
(十)JVM成神路之线上故障排查、性能监控工具分析及各线上问题排错实战
经过前述九章的JVM知识学习后,咱们对于JVM的整体知识体系已经有了全面的认知。但前面的章节中,更多的是停留在理论上进行阐述,而本章节中则更多的会分析JVM的实战操作。
116 1
|
5月前
|
缓存 监控 Java
Java虚拟机(JVM)性能调优实战指南
在追求软件开发卓越的征途中,Java虚拟机(JVM)性能调优是一个不可或缺的环节。本文将通过具体的数据和案例,深入探讨JVM性能调优的理论基础与实践技巧,旨在为广大Java开发者提供一套系统化的性能优化方案。文章首先剖析了JVM内存管理机制的工作原理,然后通过对比分析不同垃圾收集器的适用场景及性能表现,为读者揭示了选择合适垃圾回收策略的数据支持。接下来,结合线程管理和JIT编译优化等高级话题,文章详细阐述了如何利用现代JVM提供的丰富工具进行问题诊断和性能监控。最后,通过实际案例分析,展示了性能调优过程中可能遇到的挑战及应对策略,确保读者能够将理论运用于实践,有效提升Java应用的性能。 【
205 10
|
4月前
|
存储 监控 算法
深入解析JVM内部结构及GC机制的实战应用
深入解析JVM内部结构及GC机制的实战应用
|
5月前
|
JSON Java BI
一次Java性能调优实践【代码+JVM 性能提升70%】
这是我第一次对系统进行调优,涉及代码和JVM层面的调优。如果你能看到最后的话,或许会对你日常的开发有帮助,可以避免像我一样,犯一些低级别的错误。本次调优的代码是埋点系统中的报表分析功能,小公司,开发结束后,没有Code Review环节,所以下面某些问题,也许在Code Review环节就可以避免。
164 0
一次Java性能调优实践【代码+JVM 性能提升70%】
|
6月前
|
存储 缓存 监控
深入JVM:解析OOM的三大场景,原因及实战解决方案
深入JVM:解析OOM的三大场景,原因及实战解决方案
|
6月前
|
运维 Java Shell
手工触发Full GC:JVM调优实战指南
本文是关于Java应用性能调优的指南,重点介绍了如何使用`jmap`工具手动触发Full GC。Full GC是对堆内存全面清理的过程,通常在资源紧张时进行以缓解内存压力。文章详细阐述了Full GC的概念,并提供了两种使用`jmap`触发Full GC的方法:通过`-histo:live`选项获取存活对象统计信息,或使用`-dump`选项生成堆转储文件以分析内存状态。同时,文中也提醒注意手动Full GC可能带来的性能开销,建议在生产环境中谨慎操作。
1672 1