王东:微服务下的APM全链路监控

本文涉及的产品
注册配置 MSE Nacos/ZooKeeper,118元/月
服务治理 MSE Sentinel/OpenSergo,Agent数量 不受限
云原生网关 MSE Higress,422元/月
简介:

f274c01f4064b50e3dc4cbae594dc87bbe4e4d59

什么是APM?

APM (Application Performance Management) 即应用性能管理,属于IT运维管理(ITOM)范畴。主要是针对企业 关键业务的IT应用性能和用户体验的监测、优化,提高企业IT应用的可靠性和质量,保证用户得到良好的服务,降 低IT总拥有成本(TCO)。

8acdd29bd449e459548b1e22d11679f9fa4d95f5

APM的发展历程

f4280acf1766d1fcac3d933309869cddcc213c0e

Gartner对APM的定义(2014)

2014年Gartner对APM的5个定义:

c83b6b927e36c1de7292bc8681984bd7ed059895

Gartner对APM的定义(2016)

2016年重新定义,将原来的五部分合成三部分。

2ba5424afbf5d6fdb8eb5e8fc6931e81fd0a2c79

服务开发架构的发展历程

一开始的应用开发是从Main-frame一直到2010年以前比较热的SOA架构,到14年比较热的Microsorvices架构,从14年开始基于容器化的Microsorvices。服务开发框架复杂度越来越高。

fba8fb290289d4f9fce438ad87fba34fdc9ab9c5

微服务带来的挑战

  • 依赖关系复杂 
  • 持续交付 
  • 容器化环境 
  • 服务注册、发现和可靠性 
  • 一切皆服务(Everything-as-a-Service) 
  • DevOps

微服务对APM的大影响

205dd95d5fb3e474748ef68524e910f2995edc6f

APM的核心能力

19dcc8bc4081857958fe975c0f71617bb0921222

基于微服务的应用程序端到端监控

e63341c81161640bdad6dfed6dec3b928edd49dc

APM探针的基本原理 (Java Instrument)

b61edb5aca52b6e8c1eabea109f37a46ced61337

APM探针的基本原理 (Java探针结构)

81033f06fd0373c0421dc82f8d5ac203c03e06f4

APM探针的基本原理 (Java Instrument)

14b6e5c579b88a5135b5bbe7da1a81850fbac9ac

分布式追踪 – Google Dapper

e7cdb5777111d376bea524c728b49f9f827c0605

分布式追踪 – OpenTracing

0b8dcb0a04b9ff8a4c82275e0345a21ef09c71f4

追踪一切

无论是业务服务还是微服务,要做到收取流失的数据,还有所有组件健康检查,还要做到数据的分析。

032a1451f1d8d194c7be112e4e416c1a4d7c3b18

服务关联元数据

监控是分层的,只知道一个服务有问题,并不能定位这个服务的根本原因是什么,就需要使用元数据。

b606edc20cda0c3c8dea40b40b426a0f50664912

服务动态拓扑

随时间的推移去变化

4f7e92fb87eb97d837919cec254482c824ff3bd3

服务调用链分析

bf69cf2c647d450644216ebcf1bea62c75f342c5

APM总体架构

890cef7b4e122e1f867cbd4010433a934083d400

探针配置

df22ef1a6c298433ce2f54c35bf145d105c3e4d8

APM核心能力

da0c6b798cd4f5f274f67ee4558c1bbc542c1697

性能测试 

3248032dfb07888578f00092601ae9ada7f41555

构建“部署 + 监控 + 告警 + 报障”闭环

1eed2219bfe1fb778c86b6c8953f9f11bde99fbf

告警平台

e0bf6cdb64f88dede2495664b099633fc6adf610

通过故障分类系统、支持组,快速将接入的各监控系统报障通知给相应维护人员, 并通过配置的SLA及组织架构,对未及时响应的报障进行上告处理,以达到卓越运维的目的。

3fdc8f8bb209f4bd5abe9cbbca02e5facd316ec4

大数据能力的充分释放-自动异常点检测

d693c0503699434baa49e4f35175a36321226c39

AIOps

  • 告警归并 
  • 根因分析 
  • 故障自动恢复 
  • 容量预测
db26e43e82a089373d2775176e4b42299e8d5907

原文发布时间为:2017-11-24
本文作者:王东
本文来自云栖社区合作伙伴“ 中生代技术”,了解相关信息可以关注“ 中生代技术”微信公众号
相关实践学习
通过云拨测对指定服务器进行Ping/DNS监测
本实验将通过云拨测对指定服务器进行Ping/DNS监测,评估网站服务质量和用户体验。
相关文章
|
2月前
|
移动开发 监控 Android开发
Android & iOS 使用 ARMS 用户体验监控(RUM)的最佳实践
本文主要介绍了 ARMS 用户体验监控的基本功能特性,并介绍了在几种常见场景下的最佳实践。
345 13
|
14天前
|
监控 开发工具 Android开发
ARMS 用户体验监控正式发布原生鸿蒙应用 SDK
阿里云 ARMS 用户体验监控(RUM)推出了针对原生鸿蒙应用的 SDK。SDK 使用 ArkTS 语言开发,支持页面采集、资源加载采集、异常采集及自定义采集等功能,能够全面监控鸿蒙应用的表现。集成简单,只需几步即可将 SDK 接入项目中,为鸿蒙应用的开发者提供了强有力的支持。
|
22天前
|
Prometheus 监控 Java
如何全面监控所有的 Spring Boot 微服务
如何全面监控所有的 Spring Boot 微服务
32 3
|
27天前
|
存储 Prometheus 运维
在云原生环境中,阿里云ARMS与Prometheus的集成提供了强大的应用实时监控解决方案
在云原生环境中,阿里云ARMS与Prometheus的集成提供了强大的应用实时监控解决方案。该集成结合了ARMS的基础设施监控能力和Prometheus的灵活配置及社区支持,实现了全面、精准的系统状态、性能和错误监控,提升了应用的稳定性和管理效率。通过统一的数据视图和高级查询功能,帮助企业有效应对云原生挑战,促进业务的持续发展。
34 3
|
28天前
|
监控 负载均衡 Java
微服务架构下的服务治理与监控
微服务架构下的服务治理与监控
76 0
|
1月前
|
存储 监控 负载均衡
构建高效微服务架构:服务治理与监控的实践
构建高效微服务架构:服务治理与监控的实践
|
2月前
|
监控 Java 对象存储
监控与追踪:如何利用Spring Cloud Sleuth和Netflix OSS工具进行微服务调试
监控与追踪:如何利用Spring Cloud Sleuth和Netflix OSS工具进行微服务调试
50 1
|
4月前
|
Prometheus 监控 前端开发
ARMS设置监控规则
【8月更文挑战第24天】
126 9
|
4月前
|
数据采集 运维 监控
ARMS自定义监控
【8月更文挑战第25天】
121 3
|
4月前
|
Prometheus 监控 Cloud Native
微服务的监控与可观测性
【8月更文第29天】在微服务架构中,确保每个服务的健康状态和性能表现是非常重要的。为了达到这一目标,我们需要实施一套完整的监控和可观测性方案。本篇文章将介绍如何通过日志、指标和追踪来监测微服务的状态和性能,并提供相应的代码示例。
489 0