《Java应用提速(速度与激情)》——五、ClassLoader提速

简介: 《Java应用提速(速度与激情)》——五、ClassLoader提速

1. 现状

 

集团整套电商系统已经运行好多年了,机器上运行的jar包,不会因为最近大环境不好而减少,只会逐年递增,而中台的几个核心应用,因为之前走的是“平台集成业务”的模式,像个黑洞一样,所有业务都在上面开发,膨胀得更加明显,比如热点应用A机器上运行的jar包就有上千个,jar包中包含的资源文件数量更是达到了上万级别,通过工具分析,发现热点应用A启动耗时中有180秒以上是花在classLoader上,占总耗时的1/3以上,其中占比大头的是findResource的耗时。

 

不论是loadClass还是getResource,最终都会调用到findResource,慢主要是慢在资源的检索上。现在spring框架几乎是每个Java必备的,各种annotation,各种扫包,虽然极大的方便开发者,但也给应用的启动带来不少的负担。目前集团有上万多个Java应用,classLoader如果可以进行优化,将带来非常非常可观的收益。

 

2. 解决方案

 

优化的方案可以简单的用一句话概括,就是给URLClassLoader的资源查找加索引。

 

3. 提速效果

 

目前中台核心应用都已升级,基本都有100秒以上的启动提速,占总耗时的20~35%,效果非常明显!

 

4. 原理

 

1) 原生URLClassLoader为什么会慢

 

Java的JITjust in time即时编译,想必大家都不陌生,JDK里不仅仅是类的装载过程按这个思想去设计的,类的查找过程也是一样的。通过研读URLClassPath的实现,你会发现以下几个特性:

 

URLClassPath初始化的时候,所有的URL都没有open

 

findResources会比findResource更快的返回,因为实际并没有查找,而是在调用Enumeration的next()的时候才会去遍历查找,而findResource去找了第一个

 

URL是在遍历过程逐个open的,会转成Loader,放到loaders里(数组结构,决定了顺序)和lmap中Map结构防止重复加载)。

 

一个URL可以通过Class-Path引入新的URL(所以,理论上是可能存在新URL又引入新的URL,无限循环的场景)

 

因为URL和Loader是会在遍历过程中动态新增,所以URLClassPath#getLoaderint index里加了两把锁

 

image.png 

 

这些特性就是为了按需加载(懒加载),遍历的过程是ON的复杂度,按顺序从头到尾的遍历,而且遍历过程可能会伴随着URL的打开,和新URL的引入,所以,随着jar包数量的增多,每次loadClass或者findResources的耗时会线性增长,调用次数也会增长(加载的类也变多了),启动就慢下去了。慢的另一个次要原因是,getLoaderint index加了两把锁。

 

2) JDK为什么不给URLClassLoader加索引

 

跟数据库查询一样,数量多了,加个索引,立杆见效,那为什么URLClassLoader里没加索引。其实,在JDK8里的URLClassPath代码里面,是可以看到索引的踪影的,通过加“-Dsun.cds.enableSharedLookupCache=true”来打开,但是,我换各种姿势尝试了数次,发现都没生效,lookupCacheEnabled始终是false,通过debug发现JDK启动的过程会把这个变量从System的properties里移除掉。另外,最近都在升JDK11,也看了一下它里面的实现,发现这块代码直接被删除的干干净净,不见踪影了。

 

通过仔细阅读URLClassPath的代码,我能想到JDK没支持索引的原因有以下3点:

 

原因一:跟按需加载相矛盾,且URL的加载有不确定性

 

建索引就得提前将所有URL打开并遍历一遍,这与原先的按需加载设计相矛盾。另外,URL的加载有2个不确定性:

 

一是可能是非本地文件,需要从网络上下载jar包,下载可能快,可能慢,也可能会失败

二是URL的加载可能会引入新的URL,新的URL又可能会引入新的URL。

 

原因二:不是所有URL都支持遍历

 

URL的类型可以归为3种:

 

本地文件目录,如classes目录

本地或者远程下载下来的jar包

其他URL。

 

前2种是最基本最常见的,可以进行遍历的,而第3种是不一定支持遍历,默认只有一个get接口,传入确定性的name,返回有或者没有。

 

原因三:URL里的内容可能在运行时被修改

 

比如本地文件目录(classes目录)的URL,就可以在运行时往改目录下动态添加文件和类,URLClassLoader是能加载到的,而索引要支持动态更新,这个非常难。

 

3) FastURLClassLoader如何进行提速

 

首先必须承认,URLClassLoader需要支持所有场景都能建索引,这是有点不太现实的,所以,FastURLClassLoader设计之初只为满足绝大部分使用场景能够提速,我们设计了一个enable的开关,关闭则跟原生URLClassLoader是一样的。

 

另外,一个java进程里经常会存在非常多的URLClassLoader实例,不能将所有实例都开打fast模式,这也是没有直接在AliJDK里修改原生URLClassLoader的实现,而是新写了个类的原因。

 

FastURLClassLoader继承了URLClassLoader,核心是将URLClassPath的实现重写了,在初始化过程,会将所有的Loader进行初始化,并遍历一遍生成index索引,后续findResources的时候,不是从0开始,而是从index里获取需要遍历的Loader数组,这将原来的ON复杂度优化到了O1,且查找过程是无锁的。

 

FastURLClassLoader会有以下特征:

 

特征一:初始化过程不是懒加载,会慢一些

 

索引是在构造函数里进行初始化的,如果url都是本地文件(目录或Jar包),这个过程不会暂用过多的时间,3000+的jar,建索引耗时在0.5秒以内,内部会根据jar包数量进行多线程并发建索引。这个耗时,懒加载方式只是将它打散了,实际并没有少,而且集团大部分应用都使用了spring框架,spring启动过程有各种扫包,第一次扫包,所有URL就都打开了。

 

特征二目前只支持本地文件夹和Jar类型的URL

 

如果包含其他类型的URL,会直接抛异常。虽然如ftp协议的URL也是支持遍历的,但得针对性的去开发,而且ftp有网络开销,可能懒加载更适合,后续有需要再支持。

 

特征三:目前不支持通过META-INF/INDEX.LIST引入更多URL

 

当前正式版本支持通过Class-Path引入更多的URL,但还不支持通过META-INF/INDEX.LIST来引入,目前还没碰用到这个的场景,但可以支持。通过Class-Path引入更多的URL比较常见,比如idea启动,如果jar太多,会因为参数过长而无法启动,转而选择使用JAR manifest模式启动。

 

image.png 

 

特征四:索引是初始化过程创建的,除了主动调用addURL时会更新,其他场景不会更新

 

比如在classes目录下,新增文件或者子目录,将不会更新到索引里。为此,FastURLClassLoader做了一个兜底保护,如果通过索引找不到,会降级逐一到本地目录类型的URL里找一遍(大部分场景下,目录类型的URL只有一个),Jar包类型的URL一般不会动态修改,所以没找。

 

5. 注意事项

 

1) 索引对内存的开销

 

索引的是jar包和它目录和根目录文件的关系,所以不是特别大,热点应用A有3000+个jar包,INDEX.LIST的大小是3.2M

 

2) 同名类的仲裁

 

tomcat在没有INDEX.LIST的情况下,同名类使用哪个jar包中的,存在一定不确性,添加索引后,仲裁优先级是jar包名称按字母排序来的,保险起见,可以对启动后应用加载的类进行对比验证。

相关文章
|
4天前
|
前端开发 Java 测试技术
Java一分钟之Spring MVC:构建Web应用
【5月更文挑战第15天】Spring MVC是Spring框架的Web应用模块,基于MVC模式实现业务、数据和UI解耦。常见问题包括:配置DispatcherServlet、Controller映射错误、视图解析未设置、Model数据传递遗漏、异常处理未配置、依赖注入缺失和忽视单元测试。解决这些问题可提升代码质量和应用性能。注意配置`web.xml`、`@RequestMapping`、`ViewResolver`、`Model`、`@ExceptionHandler`、`@Autowired`,并编写测试用例。
51 3
|
4天前
|
Java 测试技术
Java一分钟之-正则表达式在Java中的应用
【5月更文挑战第14天】正则表达式是Java中用于文本处理的强大力量,通过`java.util.regex`包支持。常见问题包括元字符的理解、边界匹配和贪婪/懒惰量词的使用。错误通常涉及未转义特殊字符、不完整模式或过度匹配。要避免这些问题,需学习实践、使用在线工具和测试调试。示例代码展示了如何验证邮箱地址。掌握正则表达式需要不断练习和调试。
17 2
|
1天前
|
Java
深入理解Java并发编程:线程池的应用与优化
【5月更文挑战第18天】本文将深入探讨Java并发编程中的重要概念——线程池。我们将了解线程池的基本概念,应用场景,以及如何优化线程池的性能。通过实例分析,我们将看到线程池如何提高系统性能,减少资源消耗,并提高系统的响应速度。
11 5
|
1天前
|
算法 搜索推荐 Java
滚雪球学Java(33):数组算法大揭秘:应用案例实战分享
【5月更文挑战第8天】🏆本文收录于「滚雪球学Java」专栏,专业攻坚指数级提升,希望能够助你一臂之力,帮你早日登顶实现财富自由🚀;同时,欢迎大家关注&&收藏&&订阅!持续更新中,up!up!up!!
21 8
滚雪球学Java(33):数组算法大揭秘:应用案例实战分享
|
2天前
|
自然语言处理 Java API
Java 8的Stream API和Optional类:概念与实战应用
【5月更文挑战第17天】Java 8引入了许多重要的新特性,其中Stream API和Optional类是最引人注目的两个。这些特性不仅简化了集合操作,还提供了更好的方式来处理可能为空的情况,从而提高了代码的健壮性和可读性。
24 7
|
3天前
|
安全 Java Android开发
构建高效Android应用:探究Kotlin与Java的性能差异
【5月更文挑战第16天】 在移动开发领域,性能一直是开发者关注的焦点。随着Kotlin语言的普及,其与Java在Android应用中的性能表现成为热门话题。本文将深入分析Kotlin和Java在Android平台上的性能差异,并通过实际测试数据来揭示二者在编译速度、应用启动时间以及运行效率方面的表现。我们的目标是为开发者提供一个参考依据,以便在选择合适的编程语言时做出更加明智的决策。
|
4天前
|
Java 开发工具 Maven
java解析apk获取应用信息
请注意,你需要替换"path/to/your/apkfile.apk"为你的APK文件的实际路径。
11 0
|
4天前
|
Java 编译器 开发者
Java一分钟之-Java注解的理解与应用
【5月更文挑战第12天】本文介绍了Java注解的基础知识和常见应用,包括定义、应用和解析注解。注解在编译检查、框架集成和代码生成等方面发挥重要作用。文章讨论了两个易错点:混淆保留策略和注解参数类型限制,并提供了避免策略。提醒开发者避免过度使用注解,以保持代码清晰。理解并恰当使用注解能提升代码质量。
14 3
|
4天前
|
Java API 开发者
Java中Lambda表达式的深入理解与应用
【5月更文挑战第12天】在Java 8之后,Lambda表达式已经成为了Java开发者必备的技能之一。Lambda表达式以其简洁、灵活的特点,大大提高了编程的效率。本文将深入探讨Lambda表达式的基本概念,语法规则,以及在实际开发中的应用,帮助读者更好地理解和使用Lambda表达式。
|
4天前
|
算法 安全 Java
深入探索Java中的并发编程:CAS机制的原理与应用
总之,CAS机制是一种用于并发编程的原子操作,它通过比较内存中的值和预期值来实现多线程下的数据同步和互斥,从而提供了高效的并发控制。它在Java中被广泛应用于实现线程安全的数据结构和算法。
24 0