【Java Web编程 十二】深入理解Tomcat系统架构及工作原理(上)

本文涉及的产品
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
全局流量管理 GTM,标准版 1个月
云解析 DNS,旗舰版 1个月
简介: 【Java Web编程 十二】深入理解Tomcat系统架构及工作原理(上)

了解了Servlet、JSP等这些模块的使用,学会了这些模块的使用,了解了MVC的基本架构之后总感觉哪里还少了点儿东西,没错,就是原理,我们的Web程序是运行在Tomcat上的,我们只知道该按照什么规范创建什么类型的文件,例如JSP、Servlet,但是不知道为什么这么写,项目就能按照我们预期的样子运行起来,换句话说,Tomcat这个服务器到底是怎么托管Web项目?如何启动和停止Web项目?如何处理请求?这些原理层面的内容我们一概不知。所以非常有必要对Tomcat内部一探究竟,才能通透的理解网站的运行方式。

Tomcat目录结构

好,又回到最初的起点,我们虽然在本专栏开始的博客提到了Tomcat的目录布局,但是并没有详细去聊它的实现,现在再重新回顾下目录结构:

一级目录结构

各个一级文件目录的主要作用如下:

  • bin:tomcat 管理命令,所有的可执行命令存放在这里,启动和关闭服务器的命令就在此文件夹中
  • conf:tomcat 配置文件。其中 server.xml是 tomcat 的核心配置文件,当然还有web.xml -为不同的Tomcat配置的web应用设置缺省值的文件,在webapps下的单个Web程序目录下也包含此文件,优先级更高,tomcat-users.xml- Tomcat用户认证的配置文件
  • lib:tomcat 应用程序在运行时依赖的第三方jar。
  • logs:存放 tomcat 的运行日志。
  • temp:存放 tomcat 运行时生成的临时文件。
  • webapps:tomcat 在默认情况下,接收到请求之后到 webapps下定位资源文件,Web 应用程序存放的目录,Web 项目保存到此目录中即可发布
  • work:由Tomcat自动生成,这是Tomcat放置它运行期间的中间(intermediate)文件(诸如编译的JSP文件)地方,tomcat在默认情况下,在work文件夹下将jsp文件编辑为java文件,并编译为.class文件,如果当Tomcat运行时,删除了这个目录那么将不能够执行包含JSP的页面

其中webapps存放的Web程序的目录结构,也是主要的二级目录结构

主要二级目录结构

webapps存放的主要的二级目录结构下单个Web程序目录结构如下:

其中WEB-INF是较为重点的文件,其余为前端的一些文件或者资源文件,WEB-INF的结构如下:

这里的三个文件含义如下:

  • classes文件夹: 这个目录及其下的子目录应该包括这个Web应用程序的所有JavaBean及Servlet等编译好的Java类文件(*.class)文件,以及没有被压缩打入JAR包的其他class文件和相关资源,也就是我们项目的Java文件被编译后的类文件存放地。
  • lib文件夹: 当前项目运行时所依赖的jar包。
  • web.xml文件:是一个Web应用程序的描述文件。这个文件是一个XML文件,描述了Servlet和这个Web应用程序的其他组件信息,此外还包括一些初始化信息和安全约束等,优先级高于conf文件夹下的默认配置文件

大概了解了目录后,我们可以发现,其实可以通过server.xml的配置来了解整个Tomcat的实际组成模块。

Tomcat核心配置

Tomcat有两个比较关键的配置文件:server.xml和web.xml,通过这两个配置文件我们可以一窥Tomcat的全貌。

server.xml配置文件

从tomcat的server.xml中我们可以看到tomcat的相关模块设计,从server.xml文件中解析出来的各个对象都是容器,比如Server、service、Connector和host等,这些容器都有新建、初始化、启动、停止、失败和销毁等状态

<?xml version="1.0" encoding="UTF-8"?>
<!--Server-->
<Server port="8005" shutdown="SHUTDOWN">
  <Listener className="org.apache.catalina.startup.VersionLoggerListener" />
  <Listener className="org.apache.catalina.core.AprLifecycleListener" SSLEngine="on" />
  <Listener className="org.apache.catalina.core.JreMemoryLeakPreventionListener" />
  <Listener className="org.apache.catalina.mbeans.GlobalResourcesLifecycleListener" />
  <Listener className="org.apache.catalina.core.ThreadLocalLeakPreventionListener" />
  <!-- Naming-->
  <GlobalNamingResources>
    <Resource name="UserDatabase" auth="Container"
              type="org.apache.catalina.UserDatabase"
              description="User database that can be updated and saved"
              factory="org.apache.catalina.users.MemoryUserDatabaseFactory"
              pathname="conf/tomcat-users.xml" />
  </GlobalNamingResources>
  <!-- Service-->
  <Service name="Catalina">
    <!-- Connector-->
    <Connector port="8080" protocol="HTTP/1.1"
               connectionTimeout="20000"
               redirectPort="8443" />
    <!-- Container-->
    <Engine name="Catalina" defaultHost="localhost">
      <!-- Realm -->
      <Realm className="org.apache.catalina.realm.LockOutRealm">
        <Realm className="org.apache.catalina.realm.UserDatabaseRealm"
               resourceName="UserDatabase"/>
      </Realm>
      <!-- Host -->
      <Host name="localhost"  appBase="webapps"
            unpackWARs="true" autoDeploy="true">
        <Valve className="org.apache.catalina.valves.AccessLogValve" directory="logs"
               prefix="localhost_access_log" suffix=".txt"
               pattern="%h %l %u %t &quot;%r&quot; %s %b" />
      </Host>
    </Engine>
  </Service>
</Server>

同样在web.xml文件中我们也能看到一些处理模块:

web.xml配置文件

web.xml配置文件也是一个默认的default配置文件,我们也可以在具体项目的目录下找到该目录的配置描述文件。是用来管理一个Context组件中的一些规范:

<!-- ---------------------------Servlet默认配置模块------------------------------------------------------------->
   <servlet>
        <servlet-name>default</servlet-name>
        <servlet-class>org.apache.catalina.servlets.DefaultServlet</servlet-class>
        <init-param>
            <param-name>debug</param-name>
            <param-value>0</param-value>
        </init-param>
        <init-param>
            <param-name>listings</param-name>
            <param-value>false</param-value>
        </init-param>
        <load-on-startup>1</load-on-startup>
    </servlet>
    <!-- ---------------------------JSP引擎处理模块------------------------------------------------------------->
    <servlet>
        <servlet-name>jsp</servlet-name>
        <servlet-class>org.apache.jasper.servlet.JspServlet</servlet-class>
        <init-param>
            <param-name>fork</param-name>
            <param-value>false</param-value>
        </init-param>
        <init-param>
            <param-name>xpoweredBy</param-name>
            <param-value>false</param-value>
        </init-param>
        <load-on-startup>3</load-on-startup>
    </servlet>
    <!-- The mapping for the default servlet -->
    <servlet-mapping>
        <servlet-name>default</servlet-name>
        <url-pattern>/</url-pattern>
    </servlet-mapping>
    <servlet-mapping>
        <servlet-name>jsp</servlet-name>
        <url-pattern>*.jsp</url-pattern>
        <url-pattern>*.jspx</url-pattern>
    </servlet-mapping>
    <!-- ---------------------------session配置模块------------------------------------------------------------->
    <session-config>
        <session-timeout>30</session-timeout>
    </session-config>
    <!-- ---------------------------欢迎页配置模块------------------------------------------------------------->
    <welcome-file-list>
        <welcome-file>index.html</welcome-file>
        <welcome-file>index.htm</welcome-file>
        <welcome-file>index.jsp</welcome-file>
    </welcome-file-list>

Tomcat核心架构

Tomcat由什么组成的呢,除了上述配置文件我们可以看到的几个核心配置,一个Tomcat的实例由如下几个模块组成,他们共同构成了Tomcat的服务体系:

各个概念的释义如下,一个Tomcat实例就是一个Server,而一个Server可以包含多个Service,可以理解为包含多个Web项目。

  • Server:指的就是整个 Tomcat 服务器,包含多组服务,负责管理和启动各个 Service,同时监听 8005 端口发过来的 shutdown 命令,用于关闭整个容器
  • Service:Tomcat 封装的、对外提 供完整的、基于组件的 web 服务, 包含 Connectors、Container 两个 核心组件,以及多个功能组件,各个 Service 之间是独立的,但是共享 同一JVM 的资源 , 一个 Tomcat 实例支持部署多个彼此端口隔离的站点,这就是通过配置多个 Service 实现的

Service中核心组件

  • Connector:Tomcat 与外部世界的连接器,监听固定端口接收外部请求,传递给 Container,并 将 Container 处理的结果返回给外部,一个Service可以包含多个Connector,这些Connector不仅能处理http、https请求,还能处理别的网络请求,总之类似于一个接口做各种处理后将转换后Container需要的数据传递给它。我们的请求和响应交互仰赖该模块
  • Container:也就是Catalina,Servlet 容器,内部由多层容器组成,用于管理 Servlet 生命周期,调用 servlet 相关方法。Servlet程序的生命周期皆受控于此模块

Service中其它组件

  • Loader:封装了 Java ClassLoader,用于 Container 加载类文件
  • Realm:Tomcat 中为 web 应用程序提供访问认证和角色管理的机制
  • JMX:Java SE 中定义技术规范,是一个为应用程序、设备、系统等植入管理功能的框架,通过 JMX 可以远程监控 Tomcat 的运行状态
  • Jasper:Tomcat 的 Jsp 解析引擎,用于将 Jsp 转换成 Java 文件,并编译成 class 文件。我们的JSP文件之所以能编译成可执行的文件就仰赖此模块
  • Session:负责管理和创建 session,以及 Session 的持久化(可自定义),支持 session 的集群。我们的Session创建就是该模块负责的
  • Pipeline:在容器中充当管道的作用,管道中可以设置各种 valve(阀门),请求和响应在经由管 道中各个阀门处理,提供了一种灵活可配置的处理请求和响应的机制。
  • Naming:命名服务,JNDI, Java 命名和目录接口,是一组在 Java 应用中访问命名和目录服务的 API。命名服务将名称和对象联系起来,使得我们可以用名称访问对象,目录服务也是一种命名 服务,对象不但有名称,还有属性。Tomcat 中可以使用 JNDI 定义数据源、配置信息,用于开发 与部署的分离。

这些组件保证了Web请求到来时能被正确接收处理和响应。

Connector组件

Connector用于接受请求并将请求封装成Request和Response,然后交给Container进行处理,Container处理完之后在交给Connector返回给客户端,Connector 连接器面向底层数据传输,主要完成以下核心功能:

  1. 监听网络端口,接收和响应网络请求
  2. 网络字节流处理。处理 socket 通信,按照应用层协议解析处理数据,将网络数据封装成底层 Request/Response 对象,将底层 Request/Response 对象转换为 Servlet 容器能处理的标准 ServletRequest/ServletResponse,并将其投进 Container 容器进行处理

为了实现以上功能,Tomcat 将 Connector 连接器分为两个组件,分别是 ProtocolHandlerAdapter

  • ProtocolHandler组件:协议处理器,将不同的协议和通讯方式组合封装成对应的协议处理器,如Http11NioProtocol 封装的是Http+NIO,目前Tomcat支持的协议和通讯方式如下:EndPointProcessor组成。从一个请求的处理流程来看:
  • Endpoint 负责提供请求字节流给 Processor。通信监听接口,具体的 Socket 接收和发送处理器,是对传输层的抽象
  • Processor 负责构建并把 Tomcat 定义的 Request 对象给 Adapter。接收来自 EndPoint 的 Socket,读取字节流解析成 Request 和 Response 对象,是对应用层协议的抽象
  • Adapter组件: 负责提供标准的 ServletRequest 对象给 Servlet 容器。由于 Request 并没有实现 Servlet 规范,而 Servlet 容器只能接收 ServletRequest,因此需要引入一个适配器将 Request 转换成 ServletRequest,再传递给 Servlet 容器

整体的流程结构如下图所示:

相关文章
|
2月前
|
存储 Java 关系型数据库
高效连接之道:Java连接池原理与最佳实践
在Java开发中,数据库连接是应用与数据交互的关键环节。频繁创建和关闭连接会消耗大量资源,导致性能瓶颈。为此,Java连接池技术通过复用连接,实现高效、稳定的数据库连接管理。本文通过案例分析,深入探讨Java连接池的原理与最佳实践,包括连接池的基本操作、配置和使用方法,以及在电商应用中的具体应用示例。
77 5
|
23天前
|
NoSQL Java 关系型数据库
Liunx部署java项目Tomcat、Redis、Mysql教程
本文详细介绍了如何在 Linux 服务器上安装和配置 Tomcat、MySQL 和 Redis,并部署 Java 项目。通过这些步骤,您可以搭建一个高效稳定的 Java 应用运行环境。希望本文能为您在实际操作中提供有价值的参考。
111 26
|
10天前
|
监控 Java API
探索Java NIO:究竟在哪些领域能大显身手?揭秘原理、应用场景与官方示例代码
Java NIO(New IO)自Java SE 1.4引入,提供比传统IO更高效、灵活的操作,支持非阻塞IO和选择器特性,适用于高并发、高吞吐量场景。NIO的核心概念包括通道(Channel)、缓冲区(Buffer)和选择器(Selector),能实现多路复用和异步操作。其应用场景涵盖网络通信、文件操作、进程间通信及数据库操作等。NIO的优势在于提高并发性和性能,简化编程;但学习成本较高,且与传统IO存在不兼容性。尽管如此,NIO在构建高性能框架如Netty、Mina和Jetty中仍广泛应用。
26 3
|
10天前
|
安全 算法 Java
Java CAS原理和应用场景大揭秘:你掌握了吗?
CAS(Compare and Swap)是一种乐观锁机制,通过硬件指令实现原子操作,确保多线程环境下对共享变量的安全访问。它避免了传统互斥锁的性能开销和线程阻塞问题。CAS操作包含三个步骤:获取期望值、比较当前值与期望值是否相等、若相等则更新为新值。CAS广泛应用于高并发场景,如数据库事务、分布式锁、无锁数据结构等,但需注意ABA问题。Java中常用`java.util.concurrent.atomic`包下的类支持CAS操作。
41 2
|
2月前
|
存储 算法 Java
大厂面试高频:什么是自旋锁?Java 实现自旋锁的原理?
本文详解自旋锁的概念、优缺点、使用场景及Java实现。关注【mikechen的互联网架构】,10年+BAT架构经验倾囊相授。
大厂面试高频:什么是自旋锁?Java 实现自旋锁的原理?
|
2月前
|
Java
Java之CountDownLatch原理浅析
本文介绍了Java并发工具类`CountDownLatch`的使用方法、原理及其与`Thread.join()`的区别。`CountDownLatch`通过构造函数接收一个整数参数作为计数器,调用`countDown`方法减少计数,`await`方法会阻塞当前线程,直到计数为零。文章还详细解析了其内部机制,包括初始化、`countDown`和`await`方法的工作原理,并给出了一个游戏加载场景的示例代码。
Java之CountDownLatch原理浅析
|
2月前
|
Java 索引 容器
Java ArrayList扩容的原理
Java 的 `ArrayList` 是基于数组实现的动态集合。初始时,`ArrayList` 底层创建一个空数组 `elementData`,并设置 `size` 为 0。当首次添加元素时,会调用 `grow` 方法将数组扩容至默认容量 10。之后每次添加元素时,如果当前数组已满,则会再次调用 `grow` 方法进行扩容。扩容规则为:首次扩容至 10,后续扩容至原数组长度的 1.5 倍或根据实际需求扩容。例如,当需要一次性添加 100 个元素时,会直接扩容至 110 而不是 15。
Java ArrayList扩容的原理
|
2月前
|
消息中间件 前端开发 JavaScript
探索微前端架构:构建现代Web应用的新策略
本文探讨了微前端架构的概念、优势及实施策略,旨在解决传统单体应用难以快速迭代和团队协作的问题。微前端允许不同团队独立开发、部署应用的各部分,提升灵活性与可维护性。文中还讨论了技术栈灵活性、独立部署、团队自治等优势,并提出了定义清晰接口、使用Web组件、状态管理和样式隔离等实施策略。
|
2月前
|
监控 前端开发 JavaScript
探索微前端架构:构建可扩展的现代Web应用
【10月更文挑战第29天】本文探讨了微前端架构的核心概念、优势及实施策略,通过将大型前端应用拆分为多个独立的微应用,提高开发效率、增强可维护性,并支持灵活的技术选型。实际案例包括Spotify和Zalando的成功应用。
|
2月前
|
前端开发 JavaScript API
探索JAMstack架构:现代Web开发的新范式
【10月更文挑战第28天】JAMstack架构是一种现代Web开发方法,以其高性能、高安全性和易于维护的特点受到开发者青睐。本文深入探讨了JAMstack的核心概念、优势、工具链及其如何改变Web开发方式,包括静态网站生成、API驱动和预渲染等关键技术。

热门文章

最新文章