带你读《Apache Tomcat的云原生演进》——Web容器可观测最佳实践(2)

本文涉及的产品
应用实时监控服务-可观测链路OpenTelemetry版,每月50GB免费额度
服务治理 MSE Sentinel/OpenSergo,Agent数量 不受限
容器镜像服务 ACR,镜像仓库100个 不限时长
简介: 带你读《Apache Tomcat的云原生演进》——Web容器可观测最佳实践(2)

带你读《Apache Tomcat的云原生演进》——Web容器可观测最佳实践(1)https://developer.aliyun.com/article/1377524


image.png

 

接下来介绍一下TraceMetrics的基本原理。

 

首先看一下Trace的原理,这里列了一个场景。一个HTTP请求进来,在最上面会过一个Tomcat的方法,StandarHostValve.invoke。进来之后会调一次数据库,在里面sleep了一秒,然后再往外发了一个http请求。

 

那么这个调用链路,我们怎么通过Trace技术用柱状图的形式,反映它的耗时情况呢?

 

我们会通过埋点的技术来实现,这种埋点技术可能是用户手动埋点,也有可能通过Java的agent技术字节码增强,也就是在用户运行时动态插入一些代码。我们会在每个方法执行的前后打上点,然后把整个方法执行的上下文记录下来,包括方法的执行耗时等等,这样就形成了上图右侧的粉色柱状图了。

 

此外,在sleep一秒的位置,还有一个绿色的柱状图。这个方法调用由于没有埋点,所以在整个Trace里是看不到的,相当于是一个监控的盲点。所以我们也无法知道它耗时在哪里,后面会详细介绍通过Profiling技术来解决这个问题,帮助我们定位调用慢、调用出错等问题。

 

接下来介绍一下Metrics的基本原理,Metrics目前的标准是基于Prometheus提出的单指标、多维度的指标模型,以及它提出的一些指标类型,比如CounterGaugeHistogramSummary。还有它提出的关键概念包括时间点、时间线,PromQL等等。

 

image.png 

 

我们在传统的web容器里做耗时埋点的时候,有一个很关键的点是,我们要把埋点的地方尽可能的提前,来保证用户的业务代码都能获取上下文。因为在一些开源的探针,比如我们现在Skywalking和OpenTelemetry的探针里,还有一些商业化的产品里,他们对Tomcat的埋点可能会去复用Tomcat的filter的技术。它会在Tomcat的filter链里加一个filter进去,在filter里面做一些耗时的统计。

 

但阿里云的商业化产品就会把这个埋点提前到StandarHostValve.invoke的地方,来保证在每一个用户的filter里都能有Trace的上下文,然后把Trace的上下关联到日志和指标里。

 

此外,在新型的web服务端技术里,这里主要指的是构建在Reactor-netty上,像SpringCloud Gateway、Flex这样的技术里面,埋点的复杂点在于,因为它是一个纯异步的框架,你很难在一个方法里准确的统计它的调用耗时。所以针对这种纯异步的框架,我们把创建一个span和关闭一个span的操作进行异步化了,来保证我们统计到的指标是准确的。

 

带你读《Apache Tomcat的云原生演进》——Web容器可观测最佳实践(3)https://developer.aliyun.com/article/1377521

相关文章
|
Kubernetes 监控 开发者
掌握容器化:Docker与Kubernetes的最佳实践
【10月更文挑战第26天】本文深入探讨了Docker和Kubernetes的最佳实践,涵盖Dockerfile优化、数据卷管理、网络配置、Pod设计、服务发现与负载均衡、声明式更新等内容。同时介绍了容器化现有应用、自动化部署、监控与日志等开发技巧,以及Docker Compose和Helm等实用工具。旨在帮助开发者提高开发效率和系统稳定性,构建现代、高效、可扩展的应用。
|
3月前
|
运维 数据可视化 C++
2025 热门的 Web 化容器部署工具对比:Portainer VS Websoft9
2025年热门Web化容器部署工具对比:Portainer与Websoft9。Portainer以轻量可视化管理见长,适合技术团队运维;Websoft9则提供一站式应用部署与容器管理,内置丰富开源模板,降低中小企业部署门槛。两者各有优势,助力企业提升容器化效率。
352 1
2025 热门的 Web 化容器部署工具对比:Portainer VS Websoft9
|
6月前
|
存储 缓存 分布式计算
StarRocks x Iceberg:云原生湖仓分析技术揭秘与最佳实践
本文将深入探讨基于 StarRocks 和 Iceberg 构建的云原生湖仓分析技术,详细解析两者结合如何实现高效的查询性能优化。内容涵盖 StarRocks Lakehouse 架构、与 Iceberg 的性能协同、最佳实践应用以及未来的发展规划,为您提供全面的技术解读。 作者:杨关锁,北京镜舟科技研发工程师
StarRocks x Iceberg:云原生湖仓分析技术揭秘与最佳实践
|
消息中间件 监控 大数据
优化Apache Kafka性能:最佳实践与调优策略
【10月更文挑战第24天】作为一名已经对Apache Kafka有所了解并有实际使用经验的开发者,我深知在大数据处理和实时数据流传输中,Kafka的重要性不言而喻。然而,在面对日益增长的数据量和业务需求时,如何保证系统的高性能和稳定性成为了摆在我们面前的一个挑战。本文将从我的个人视角出发,分享一些关于如何通过合理的配置和调优来提高Kafka性能的经验和建议。
392 4
|
7月前
|
监控 安全 BI
优化 Apache 日志记录的 5 个最佳实践
Apache 日志记录对于维护系统运行状况和网络安全至关重要,其核心包括访问日志与错误日志的管理。通过制定合理的日志策略,如选择合适的日志格式、利用条件日志减少冗余、优化日志级别、使用取证模块提升安全性及实施日志轮换,可有效提高日志可用性并降低系统负担。此外,借助 Eventlog Analyzer 等专业工具,能够实现日志的高效收集、可视化分析与威胁检测,从而精准定位安全隐患、评估服务器性能,并满足合规需求,为强化网络安全提供有力支持。
199 0
优化 Apache 日志记录的 5 个最佳实践
|
9月前
|
人工智能 安全 API
容器化AI模型的安全防护实战:代码示例与最佳实践
本文基于前文探讨的容器化AI模型安全威胁,通过代码示例展示如何在实际项目中实现多层次的安全防护措施。以一个基于TensorFlow的图像分类模型为例,介绍了输入验证、模型加密、API认证和日志记录的具体实现方法,并结合最佳实践,如使用安全容器镜像、限制权限、网络隔离等,帮助构建更安全的AI服务。
|
10月前
|
人工智能 运维 监控
容器服务Kubernetes场景下可观测体系生产级最佳实践
阿里云容器服务团队在2024年继续蝉联Gartner亚洲唯一全球领导者象限,其可观测体系是运维的核心能力之一。该体系涵盖重保运维、大规模集群稳定性、业务异常诊断等场景,特别是在AI和GPU场景下提供了全面的观测解决方案。通过Tracing、Metric和Log等技术,阿里云增强了对容器网络、存储及多集群架构的监控能力,帮助客户实现高效运维和成本优化。未来,结合AI助手,将进一步提升问题定位和解决效率,缩短MTTR,助力构建智能运维体系。
|
11月前
|
Kubernetes 安全 数据安全/隐私保护
云卓越架构:容器安全最佳实践
本次分享由阿里云智能集团解决方案架构师张玉峰主讲,主题为“云卓越架构:容器安全最佳实践”。内容涵盖容器安全的挑战、云原生容器安全架构及典型场景。首先分析了容器安全面临的问题,如镜像漏洞和权限管理。接着介绍了容器安全架构的五个维度:身份权限管理、配置安全检查、运行时防护、镜像安全检测及发布的安全管控。最后通过具体场景展示了容器身份与权限管理、密钥管理、运行时防入侵等最佳实践,强调了安全左移的重要性,确保从开发到运行的全生命周期安全覆盖。
|
开发者 Docker Python
从零开始:使用Docker容器化你的Python Web应用
从零开始:使用Docker容器化你的Python Web应用
486 4
|
机器学习/深度学习 数据采集 Docker
Docker容器化实战:构建并部署一个简单的Web应用
Docker容器化实战:构建并部署一个简单的Web应用

推荐镜像

更多