带你读《企业级云原生白皮书项目实战》——4.3.3ARMS最佳实践(上)

简介: 带你读《企业级云原生白皮书项目实战》——4.3.3ARMS最佳实践(上)

4.3.3 ARMS最佳实践


4.3.3.1 系统监控以及应用拓扑发现

ARMS应用监控探针能够自动发现应用的上下游依赖关系。具体而言,该探针能够有效捕获、智能计算、自动展示不同应用之间通过RPC框架(例如Dubbo、HTTP、HSF等协议)组成的调用链。ARMS支持展示接口调用链路拓扑、数据库调用链路拓扑、NoSQL调用链路拓扑、MQ调用链路拓扑。可以通过相关的应用拓扑轻松发现系统中的性能瓶颈和异常调用。以下是ARMS的调用链路拓扑图,从此链路图中可以看到系统各个组件的请求数量、请求错误数、以及请求响应时长。用户可以根据具体对比具体链路的请求错误数量来发现业务异常,通过查看请求响应时长来查看影响系统性能提升的具体模块,然后根据具体模块接口调用情况分析接口慢调用情况,结合SQL调用分析日志以及业务日志来具体定位出慢调用模块的系统性能瓶颈。当然并不是所有瓶颈都发生在业务层面,当出现系统调用瓶颈是查看对应的业务部署环境也是必要的。ARMS对部署环境监控支持JVM监控、主机监控、Pod监控。通过JVM监控可以看到JAVA应用的GC情况、堆栈使用情况、JVM线程数,这对分析JAVA应用网络调用慢、应用OOM等JAVA应用问题是很有帮助的。主机监控则展示了主机的CPU、物理内存、磁盘、网络流量等重要指标,用户可以根据这些指标来判断是否需要增加业务使用的依赖资源。

image.png

图:完整调用链路拓扑

image.png

图:JVM监控

image.png

图:主机监控

4.3.3.2 异常事务以及慢事务分析

ARMS在链路监控的基础上支持更进一步获取接口的慢SQL、MQ堆积分析报表、异常分类报表以及异常分类报表。用户可以根据报表中展示的异常堆栈信息以及程序接口调用耗时快速定位异常事务。通过接口具体方法执行耗时以及方法中的业务SQL调用分析对慢事务进行更为细致的问题定位,结合主机监控全面分析系统的瓶颈所在,从而进一步提高系统的性能。

image.png

图:流式处理示例


《企业级云原生白皮书项目实战》——第四章 云原生中间件——4.3 可观测产品ARMS——4.3.3ARMS最佳实践(下) https://developer.aliyun.com/article/1229049?groupCode=supportservice

相关实践学习
通过轻量消息队列(原MNS)主题HTTP订阅+ARMS实现自定义数据多渠道告警
本场景将自定义告警信息同时分发至多个通知渠道的需求,例如短信、电子邮件及钉钉群组等。通过采用轻量消息队列(原 MNS)的主题模型的HTTP订阅方式,并结合应用实时监控服务提供的自定义集成能力,使得您能够以简便的配置方式实现上述多渠道同步通知的功能。
相关文章
|
移动开发 监控 Android开发
Android & iOS 使用 ARMS 用户体验监控(RUM)的最佳实践
本文主要介绍了 ARMS 用户体验监控的基本功能特性,并介绍了在几种常见场景下的最佳实践。
1359 108
|
存储 缓存 分布式计算
StarRocks x Iceberg:云原生湖仓分析技术揭秘与最佳实践
本文将深入探讨基于 StarRocks 和 Iceberg 构建的云原生湖仓分析技术,详细解析两者结合如何实现高效的查询性能优化。内容涵盖 StarRocks Lakehouse 架构、与 Iceberg 的性能协同、最佳实践应用以及未来的发展规划,为您提供全面的技术解读。 作者:杨关锁,北京镜舟科技研发工程师
StarRocks x Iceberg:云原生湖仓分析技术揭秘与最佳实践
|
人工智能 Cloud Native 安全
从云原生到 AI 原生,网关的发展趋势和最佳实践
本文整理自阿里云智能集团资深技术专家,云原生产品线中间件负责人谢吉宝(唐三)在云栖大会的精彩分享。讲师深入浅出的分享了软件架构演进过程中,网关所扮演的各类角色,AI 应用的流量新特征对软件架构和网关所提出的新诉求,以及基于阿里自身实践所带来的开源贡献和商业能力。
1250 111
|
Cloud Native 关系型数据库 Serverless
基于阿里云函数计算(FC)x 云原生 API 网关构建生产级别 LLM Chat 应用方案最佳实践
本文带大家了解一下如何使用阿里云Serverless计算产品函数计算构建生产级别的LLM Chat应用。该最佳实践会指导大家基于开源WebChat组件LobeChat和阿里云函数计算(FC)构建企业生产级别LLM Chat应用。实现同一个WebChat中既可以支持自定义的Agent,也支持基于Ollama部署的开源模型场景。
2168 133
|
运维 Kubernetes Cloud Native
构建高效云原生运维体系:Kubernetes最佳实践
【5月更文挑战第9天】 在动态和快速演变的云计算环境中,高效的运维是确保应用稳定性与性能的关键。本文将深入探讨在Kubernetes环境下,如何通过一系列最佳实践来构建一个高效且响应灵敏的云原生运维体系。文章不仅涵盖了容器化技术的选择与优化、自动化部署、持续集成/持续交付(CI/CD)流程的整合,还讨论了监控、日志管理以及灾难恢复策略的重要性。这些实践旨在帮助运维团队有效应对微服务架构下的复杂性,确保系统可靠性及业务的连续性。
|
负载均衡 Cloud Native 安全
云原生最佳实践系列 6:MSE 云原生网关使用 JWT 进行认证鉴权
本文档介绍了如何在 MSE(Microservices Engine)云原生网关中集成JWT进行全局认证鉴权。
1577 129
|
弹性计算 监控 Cloud Native
云原生最佳实践系列 4:基于 MSE 和 SAE 的微服务部署与压测
通过MSE(微服务引擎)、SAE(Serverless应用引擎)、ARMS(应用监控服务)、PTS(性能测试服务)等产品,实现微服务的无服务化部署、监控和弹性伸缩。
1299 111
|
消息中间件 Cloud Native 网络安全
云原生最佳实践系列 3:基于 SpringCloud 应用玩转 MSE
该文档介绍了基于云原生应用的产品构建的微服务架构实践。
1229 109
|
负载均衡 Kubernetes Cloud Native
云原生最佳实践系列2:基于 MSE 云原生网关同城多活
通过使用阿里云的云原生微服务引擎 MSE,可以实现注册中心的同城容灾多活微服务应用。MSE 提供了云原生网关和注册中心,支持机房级故障的秒级自动转移、非对等部署下的全局流量负载均衡以及流量精细化管控。
1124 138
|
Kubernetes Cloud Native Ubuntu
庆祝 .NET 9 正式版发布与 Dapr 从 CNCF 毕业:构建高效云原生应用的最佳实践
2024年11月13日,.NET 9 正式版发布,Dapr 从 CNCF 毕业,标志着云原生技术的成熟。本文介绍如何使用 .NET 9 Aspire、Dapr 1.14.4、Kubernetes 1.31.0/Containerd 1.7.14、Ubuntu Server 24.04 LTS 和 Podman 5.3.0-rc3 构建高效、可靠的云原生应用。涵盖环境准备、应用开发、Dapr 集成、容器化和 Kubernetes 部署等内容。
919 6

热门文章

最新文章