工作半年遇到最奇葩的问题

简介: 工作半年遇到最奇葩的问题背景公司最近买了一套项目,在启动的时候出现了一系列奇怪的问题,对方的技术栈要求是Tomcat7启动,但是由于我们公司出于安全的考虑所以是要求用Tomcat9进行启动的。问题描述下面情况都是相同war包相同Tomcat情况下系统Tomcat版本能否启动WindowsTomcat7能WindowsTomcat9能macOSTomcat7能macOSTomcat9不能LinuxTomcat7能LinuxTomcat9不能由于对于项目的不熟悉,导致找了很久才找出来原因。

工作半年遇到最奇葩的问题

背景

公司最近买了一套项目,在启动的时候出现了一系列奇怪的问题,对方的技术栈要求是Tomcat7启动,但是由于我们公司出于安全的考虑所以是要求用Tomcat9进行启动的。

问题描述

下面情况都是相同war包相同Tomcat情况下

系统 Tomcat版本 能否启动
Windows Tomcat7
Windows Tomcat9
macOS Tomcat7
macOS Tomcat9 不能
Linux Tomcat7
Linux Tomcat9 不能

由于对于项目的不熟悉,导致找了很久才找出来原因。查找过程就是用了阿里开源的Arthas 编译出正在运行时出问题的那个类,发现两个类来源于不同的Jar包,所以问题就转向了Jar的加载顺序是由什么因素导致了。

问题深究

两个同路径名同类名的类在类加载器只会加载一次

出现这个问题的时候查了些资料知道,JVM的类加载是一个树形的结构,JVM在加载的过程采用的双亲委派的模式,层级越高,那么类加载器会越早的加载其路径下的类。下面是Tomcat的类加载器所在的级别。


      Bootstrap
          |
       System
          |
       Common
       /     \
  Webapp1   Webapp2 .

我们可以知道出问题的两个Jar是在相同的类加载器中,所以排除了不同级别类加载器导致的问题。

Tomcat7加载Jar包原理

Tomcat自己实现了自己的类加载器,用于加载自己本地项目中jar包中的所有class文件,所以在相同的类加载器下,如果有相同路径名和类名那么加载顺序就是根据jar包的顺序来决定的。谁的jar包先进来,那么就先加载哪个类。

但是为什么在Tomcat7所有环境都能运行正常,而在Tomcat9中就不行了呢?于是就查看了Tomcat7的源码在Context加载项目中的jar包时

Tomcat7加载jar部分,在WebappLoader.setRepositories()方法中,粘贴出其中重要代码。

 // Looking up directory /WEB-INF/lib in the context
    NamingEnumeration<NameClassPair> enumeration = null;
    try {
        //这一句是获得jar包的路径
        enumeration = libDir.list("");
    } catch (NamingException e) {
        IOException ioe = new IOException(sm.getString(
                "webappLoader.namingFailure", libPath));
        ioe.initCause(e);
        throw ioe;
    }

list是获得了应用中WEB-INF下lib下所有jar包的路径。我们跟踪进去发现FileDirContext 的list方法中有下面这一句

Arrays.sort(names);             // Sort alphabetically

我们可以发现在Tomcat7中对获得所有jar包作了一个排序的动作。对jar包进行了首字母a-z进行了排序。而我们所期望加载的那个jar包首字母正好在错误jar包的前面。

Tomcat9加载Jar包原理

上面我们知道了为什么在所有项目中Tomcat7能启动起来的原因了,是因为Tomcat7做了排序的动作,那么在Tomcat9加载Jar包时,又是怎么做的呢?

Tomcat9在加载源码的时候是通过StandardRoot.processWebInfLib()方法进行加载的

    protected void processWebInfLib() throws LifecycleException {
        WebResource[] possibleJars = listResources("/WEB-INF/lib", false);
        for (WebResource possibleJar : possibleJars) {
            if (possibleJar.isFile() && possibleJar.getName().endsWith(".jar")) {
                createWebResourceSet(ResourceSetType.CLASSES_JAR,
                        "/WEB-INF/classes", possibleJar.getURL(), "/");
            }
        }
    }

在这我们可以看到Tomcat没有对取出来的Jar作任何动作,仅仅是File file = new File()这样遍历出来了。那么为什么相同的Tomcat9相同的War包在Windos能启动起来,但是在macOS和Linux中都启动不起来呢?经过试验发现Java的获取文件夹下面的所有文件是跟操作系统的文件系统有关系的,相同的文件夹内容,在Windows中取出来,输出名字你会发现输出是经过a-z排序过的,但是在macOS或者Linux中你可以根据命令ll -fi就可以输出自然顺序,你会发现没有什么规律可言。

解决

到这里上面描述的所有问题我们都能解释通了,接下来就该如何解决了。

  1. 修改Tomcat9的源码,在获取所有Jar包的时候,也对它进行排序
  2. 解决掉有冲突的文件

第一种解决办法只能解决一时问题,即项目能正常启动起来,但是一旦随后涉及到了相关类的修改,那么冲突类的哪个类呢?那么这个问题肯定是一个定时炸弹。

第二种方案是找到有冲突的文件,然后找出不用的那个给删除掉,但是发现删除一个又会蹦出其他的,删除了好几个以后发现由于买的项目代码不规范,所以这种现象特别多,如果单纯靠手工筛选的话极其麻烦。于是就写了一个脚本跑出项目中所有同名类的文件。

脚本思路

  1. 找出所有Java文件
  2. 找到Java文件上package那一行,然后读取此行
  3. package后面的包名与类名拼接存入List集合中
  4. 筛选出集合中相同的内容

具体的脚本代码可以去GitHub中查看。使用简单说明,将想要扫描的项目代码全放在一个文件夹中,例如我要扫描A、B、C、D四个项目。

--/
  --scanDir
   --A
   --B
   --C
   --D

那么我只要引入了Jar包以后如下调用即可

List<String> list = FindDuplicate.findDuplicatePath("/scanDir/");

返回的是一个集合,一条记录表示有一个组冲突文件,两个冲突文件路径被||||||||隔开

脚本代码

往期关于Tomcat文章

相关文章
|
Python
Python传参数:传值还是传址?
【2月更文挑战第18天】
490 6
|
SQL 分布式计算 数据处理
如何充分发挥 SQL 能力?
如何充分发挥 SQL 能力,是本篇文章的主题。本文尝试独辟蹊径,强调通过灵活的、发散性的数据处理思维,就可以用最基础的语法,解决复杂的数据场景。
158330 59
|
机器人 API
钉钉里{"code: 400, 错误描述:机器人权限校验不通过;解决方案:请登陆开放平台后台,检查机器人是否归属于token对应的主应用名下 请问场景机器人-发消息-这个报错什么原因导致的啊?
钉钉里{"code: 400, 错误描述:机器人权限校验不通过;解决方案:请登陆开放平台后台,检查机器人是否归属于token对应的主应用名下 请问场景机器人-发消息-这个报错什么原因导致的啊?
905 0
|
9月前
|
监控 算法 安全
基于 C# 的内网行为管理软件入侵检测算法解析
当下数字化办公环境中,内网行为管理软件已成为企业维护网络安全、提高办公效率的关键工具。它宛如一位恪尽职守的网络守护者,持续监控内网中的各类活动,以确保数据安全及网络稳定。在其诸多功能实现的背后,先进的数据结构与算法发挥着至关重要的作用。本文将深入探究一种应用于内网行为管理软件的 C# 算法 —— 基于二叉搜索树的入侵检测算法,并借助具体代码例程予以解析。
150 4
|
10月前
|
IDE 开发工具 C++
灵码2.0使用体验
灵码2.0使用deepseek插件初体验
257 3
|
Go
Golang生成随机数案例实战
关于如何使用Go语言生成随机数的三个案例教程。
384 91
Golang生成随机数案例实战
|
9月前
|
关系型数据库 MySQL 网络安全
Typecho 入门指南:个人博客网站保姆级攻略!
Typecho是一款轻量级开源博客系统,基于PHP+MySQL/SQLite构建,专注于为内容创作者提供简洁、快速的博客搭建体验。其支持多用户管理、Markdown编辑、伪静态SEO优化等功能,适合个人和技术博客使用。本文详细介绍了通过宝塔面板快速部署Typecho的方法,包括运行环境配置、源码上传与安装、SSL设置等步骤,帮助用户在10分钟内完成博客搭建,实现高效极简的内容创作与分享。
597 0
|
前端开发 算法 测试技术
前端大模型应用笔记(五):大模型基础能力大比拼-计数篇-通义千文 vs 文心一言 vs 智谱 vs 讯飞vsGPT
本文对比测试了通义千文、文心一言、智谱和讯飞等多个国产大模型在处理基础计数问题上的表现,特别是通过链式推理(COT)提示的效果。结果显示,GPTo1-mini、文心一言3.5和讯飞4.0Ultra在首轮测试中表现优秀,而其他模型在COT提示后也能显著提升正确率,唯有讯飞4.0-Lite表现不佳。测试强调了COT在提升模型逻辑推理能力中的重要性,并指出免费版本中智谱GLM较为可靠。
596 0
前端大模型应用笔记(五):大模型基础能力大比拼-计数篇-通义千文 vs 文心一言 vs 智谱 vs 讯飞vsGPT
|
Kubernetes 调度 算法框架/工具
NVIDIA Triton系列02-功能与架构简介
本文介绍了NVIDIA Triton推理服务器的功能与架构,强调其不仅适用于大型服务类应用,还能广泛应用于各类推理场景。Triton支持多种模型格式、查询类型和部署方式,具备高效的模型管理和优化能力,确保高性能和系统稳定性。文章详细解析了Triton的主从架构,包括模型仓库、客户端应用、通信协议和推理服务器的核心功能模块。
590 1
NVIDIA Triton系列02-功能与架构简介
|
JavaScript 前端开发
Playwright执行 JavaScript 脚本:探索浏览器自动化的新境界
在Web自动化中,Playwright提供`page.evaluate()`和`page.evaluate_handle()`来执行JavaScript脚本。`page.evaluate()`返回脚本执行结果,而`page.evaluate_handle()`返回JSHandle。示例展示了如何使用它们,如打印网页标题、操作元素及获取页面内容。通过这些方法,可以处理常规方法难以操作的网页元素。