带你读《Apache Tomcat的云原生演进》——Web容器可观测最佳实践(2)

本文涉及的产品
容器镜像服务 ACR,镜像仓库100个 不限时长
函数计算FC,每月15万CU 3个月
Serverless 应用引擎免费试用套餐包,4320000 CU,有效期3个月
简介: 带你读《Apache Tomcat的云原生演进》——Web容器可观测最佳实践(2)

带你读《Apache Tomcat的云原生演进》——Web容器可观测最佳实践(1)https://developer.aliyun.com/article/1377524


image.png

 

接下来介绍一下TraceMetrics的基本原理。

 

首先看一下Trace的原理,这里列了一个场景。一个HTTP请求进来,在最上面会过一个Tomcat的方法,StandarHostValve.invoke。进来之后会调一次数据库,在里面sleep了一秒,然后再往外发了一个http请求。

 

那么这个调用链路,我们怎么通过Trace技术用柱状图的形式,反映它的耗时情况呢?

 

我们会通过埋点的技术来实现,这种埋点技术可能是用户手动埋点,也有可能通过Java的agent技术字节码增强,也就是在用户运行时动态插入一些代码。我们会在每个方法执行的前后打上点,然后把整个方法执行的上下文记录下来,包括方法的执行耗时等等,这样就形成了上图右侧的粉色柱状图了。

 

此外,在sleep一秒的位置,还有一个绿色的柱状图。这个方法调用由于没有埋点,所以在整个Trace里是看不到的,相当于是一个监控的盲点。所以我们也无法知道它耗时在哪里,后面会详细介绍通过Profiling技术来解决这个问题,帮助我们定位调用慢、调用出错等问题。

 

接下来介绍一下Metrics的基本原理,Metrics目前的标准是基于Prometheus提出的单指标、多维度的指标模型,以及它提出的一些指标类型,比如CounterGaugeHistogramSummary。还有它提出的关键概念包括时间点、时间线,PromQL等等。

 

image.png 

 

我们在传统的web容器里做耗时埋点的时候,有一个很关键的点是,我们要把埋点的地方尽可能的提前,来保证用户的业务代码都能获取上下文。因为在一些开源的探针,比如我们现在Skywalking和OpenTelemetry的探针里,还有一些商业化的产品里,他们对Tomcat的埋点可能会去复用Tomcat的filter的技术。它会在Tomcat的filter链里加一个filter进去,在filter里面做一些耗时的统计。

 

但阿里云的商业化产品就会把这个埋点提前到StandarHostValve.invoke的地方,来保证在每一个用户的filter里都能有Trace的上下文,然后把Trace的上下关联到日志和指标里。

 

此外,在新型的web服务端技术里,这里主要指的是构建在Reactor-netty上,像SpringCloud Gateway、Flex这样的技术里面,埋点的复杂点在于,因为它是一个纯异步的框架,你很难在一个方法里准确的统计它的调用耗时。所以针对这种纯异步的框架,我们把创建一个span和关闭一个span的操作进行异步化了,来保证我们统计到的指标是准确的。

 

带你读《Apache Tomcat的云原生演进》——Web容器可观测最佳实践(3)https://developer.aliyun.com/article/1377521

相关文章
|
3月前
|
消息中间件 监控 大数据
优化Apache Kafka性能:最佳实践与调优策略
【10月更文挑战第24天】作为一名已经对Apache Kafka有所了解并有实际使用经验的开发者,我深知在大数据处理和实时数据流传输中,Kafka的重要性不言而喻。然而,在面对日益增长的数据量和业务需求时,如何保证系统的高性能和稳定性成为了摆在我们面前的一个挑战。本文将从我的个人视角出发,分享一些关于如何通过合理的配置和调优来提高Kafka性能的经验和建议。
128 4
|
2月前
|
人工智能 运维 监控
阿里云ACK容器服务生产级可观测体系建设实践
本文整理自2024云栖大会冯诗淳(花名:行疾)的演讲,介绍了阿里云容器服务团队在生产级可观测体系建设方面的实践。冯诗淳详细阐述了容器化架构带来的挑战及解决方案,强调了可观测性对于构建稳健运维体系的重要性。文中提到,阿里云作为亚洲唯一蝉联全球领导者的容器管理平台,其可观测能力在多项关键评测中表现优异,支持AI、容器网络、存储等多个场景的高级容器可观测能力。此外,还介绍了阿里云容器服务在多云管理、成本优化等方面的最新进展,以及即将推出的ACK AI助手2.0,旨在通过智能引擎和专家诊断经验,简化异常数据查找,缩短故障响应时间。
阿里云ACK容器服务生产级可观测体系建设实践
|
2月前
|
Prometheus Kubernetes 监控
OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性
聚焦近日OpenAI的大规模K8s集群故障,介绍阿里云容器服务与可观测团队在大规模K8s场景下我们的建设与沉淀。以及分享对类似故障问题的应对方案:包括在K8s和Prometheus的高可用架构设计方面、事前事后的稳定性保障体系方面。
|
1月前
|
人工智能 运维 监控
容器服务Kubernetes场景下可观测体系生产级最佳实践
阿里云容器服务团队在2024年继续蝉联Gartner亚洲唯一全球领导者象限,其可观测体系是运维的核心能力之一。该体系涵盖重保运维、大规模集群稳定性、业务异常诊断等场景,特别是在AI和GPU场景下提供了全面的观测解决方案。通过Tracing、Metric和Log等技术,阿里云增强了对容器网络、存储及多集群架构的监控能力,帮助客户实现高效运维和成本优化。未来,结合AI助手,将进一步提升问题定位和解决效率,缩短MTTR,助力构建智能运维体系。
|
6月前
|
Java 关系型数据库 MySQL
"解锁Java Web传奇之旅:从JDK1.8到Tomcat,再到MariaDB,一场跨越数据库的冒险安装盛宴,挑战你的技术极限!"
【8月更文挑战第19天】在Linux上搭建Java Web应用环境,需安装JDK 1.8、Tomcat及MariaDB。本指南详述了使用apt-get安装OpenJDK 1.8的方法,并验证其版本。接着下载与解压Tomcat至`/usr/local/`目录,并启动服务。最后,通过apt-get安装MariaDB,设置基本安全配置。完成这些步骤后,即可验证各组件的状态,为部署Java Web应用打下基础。
77 1
|
6月前
|
Java 应用服务中间件 Shell
Nginx+Keepalived+Tomcat 实现Web高可用集群
Nginx+Keepalived+Tomcat 实现Web高可用集群
177 0
|
4月前
|
负载均衡 应用服务中间件 Apache
Tomcat负载均衡原理详解及配置Apache2.2.22+Tomcat7
Tomcat负载均衡原理详解及配置Apache2.2.22+Tomcat7
80 3
|
5月前
|
人工智能 运维 监控
阿里云ACK容器服务生产级可观测体系建设实践
阿里云ACK容器服务生产级可观测体系建设实践
|
4月前
|
Java 应用服务中间件 Apache
浅谈Tomcat和其他WEB容器的区别
Tomcat是一款轻量级的免费开源Web应用服务器,常用于中小型系统及并发访问量适中的场景,尤其适合开发和调试JSP程序。它不仅能处理HTML页面,还充当Servlet和JSP容器。相比之下,物理服务器是指具备处理器、硬盘等硬件设施的服务器,如云服务器,其设计目标是在处理能力、稳定性和安全性等方面提供高标准服务。简言之,Tomcat专注于运行Java应用,而物理服务器则提供基础计算资源。
|
6月前
|
网络协议 Java 应用服务中间件
Tomcat源码分析 (一)----- 手撕Java Web服务器需要准备哪些工作
本文探讨了后端开发中Web服务器的重要性,特别是Tomcat框架的地位与作用。通过解析Tomcat的内部机制,文章引导读者理解其复杂性,并提出了一种实践方式——手工构建简易Web服务器,以此加深对Web服务器运作原理的认识。文章还详细介绍了HTTP协议的工作流程,包括请求与响应的具体格式,并通过Socket编程在Java中的应用实例,展示了客户端与服务器间的数据交换过程。最后,通过一个简单的Java Web服务器实现案例,说明了如何处理HTTP请求及响应,强调虽然构建基本的Web服务器相对直接,但诸如Tomcat这样的成熟框架提供了更为丰富和必要的功能。

推荐镜像

更多