新IT运维模式下,全栈溯源助你解应用性能监控难题

本文涉及的产品
应用实时监控服务-用户体验监控,每月100OCU免费额度
应用实时监控服务-应用监控,每月50GB免费额度
简介:

2016年,Gartner对APM的定义将原来的五个维度定义修改成了三个维度,即:数字化体验监控(DEM),应用发现、追踪和诊断(ADTD),以及应用分析(AA)。此外,Garter还强调,最终用户的体验始终是APM最重要的任务,而APM的核心功能则是能够基于应用去做问题的发现与诊断。这一定义的改变,源于用户在新的IT形势下,对APM提出的新需求。

近年来,公有云和移动互联网的增长,推动了APM市场和技术的快速发展。然而,云计算、微服务和容器化让监控的数据呈海量增长,为APM的发展带来了挑战。微服务架构和容器化让应用更具灵活性、弹性和扩展性,但在提高应用效率的同时,也让应用的拓扑架构和通讯变得更复杂,更难监控。

与此同时,企业数字化转型规模在愈发扩大,各行业对性能监控提出了更高的要求,传统的监控方案只能定位解决不到30%的问题,剩下的70%该怎么办呢?如何才能快速定位最终用户关键业务的性能问题?怎样才能保障关键业务流程各方面的稳健运行?

为了能够帮助企业应对新IT形势下的应用性能监控方面的难题,帮助IT管理团队快速实现不同业务逻辑下的性能排障,国内应用性能管理服务提供商听云,于2016年推出了全栈溯源解决方案,它在国内首次实现了全端、跨应用监控。

2017年,面对现阶段复杂的全栈环境,定位问题变得更加复杂,为了能够对应用性能问题更加深入的追踪与诊断,听云全栈溯源进行了全面升级。此次升级主要是基于用户体验的性能监控升级,实现了工具产品平台化,为用户提供全面的听云全栈溯源解决方案。

据听云产品副总裁Moca介绍,所谓全栈溯源,就是从用户体验出发,基于事务请求进行全栈问题的定位追踪。目前,其涉及的主要功能有:APP端事务请求全栈溯源、浏览器页面事务请求全栈溯源、拨测事务请求全栈溯源、单用户全栈溯源。

“全栈溯源是全球APM行业的趋势。在国外,Dynatrace、AppDynamics这些老牌APM厂商已经将全栈溯源作为了产品的标配。但是,从功能上来说,听云的技术在国内是非常领先的。因为我们的服务体系更加符合国内企业的要求,国外的APM不支持国内组件,比如阿里云的基于微服务架构的支持,类似达梦数据库的国产化技术。” Moca说。

新IT运维模式下,全栈溯源助你解应用性能监控难题

听云全栈溯源解决方案可以实现清晰责任界定为各部门提供统一的信息平台,共同讨论目前应用发生的问题,以及解决方案。基于客户关键业务的自动质量控制平台,将把以周为单位的解决问题时间缩短为几分钟。同时,当发生严重问题时,系统会进行自动响应,及时告警。

新IT运维模式下,全栈溯源助你解应用性能监控难题

新IT运维模式下,全栈溯源助你解应用性能监控难题

既然全栈溯源解决方案是从用户体验出发,听云是怎样来衡量用户体验的呢? Moca解释说,一方面,用户可以结合自身来定义用户体验问题,比如反应快慢时间。另一方面,听云全栈溯源解决方案设置了一个默认值。此外,在用户感知层面,针对首屏时间、点击控件时间等,系统会通过请求的关联,来发现是否是因为请求慢导致用户体验度低的问题。

那么,针对微服务架构和容器化等新技术,听云全栈溯源解决方案是否能够很好的解决应用性能监控的问题呢?

对此,Moca表示,简单来说,微服务就是把整个系统划分为多个细小的服务。以听云为例,听云服务器端整个监控系统,报表、数据库查询系统等,都可以拆分成一个个微服务。这里的挑战在于,以前我们很清楚是A、B、C应用组成了一个系统,而现在我们不知道A、B、C应用中的哪些微服务组成了一个系统。因为听云也在用微服务和容器,它们在带来灵活、可扩展性强等诸多好处的同时,也给业务管理带来很多的瓶颈,定位一个问题需要定位到某一个具体的微服务。如果是容器,则需要考虑映射到哪个主机等,这些都是听云正在努力的方向。

目前,听云全栈溯源解决方案已经支持容器。因为容器的核心就是可以动态扩展,动态扩展时会变成很多实例,此时就可以动态的根据这些实例去扩展。所以如果忽略容器这一层,把能具体定位到错误与容器和主机映射到一起,就可知道系统级别、基础架构下的哪里出现了哪些问题。然后定位到应用级别,再把应用拆开,就能找到这个应用具体映射到哪个容器和服务器,最终实现对应用性能的监控。

采访最后,Moca表示:“全栈溯源核心在于从用户体验出发,可以支持多种复杂的环境。客户无论使用怎样的生产环境,我们都能够给予支持。这是我们走向市场,成熟商业化的重要标准之一。今年,听云的重点是从用户体验出发,不断完善全栈溯源解决方案的功能,实现多种视角,使产品更加易用。”


本文作者:杜美洁   

来源:51CTO

相关实践学习
通过云拨测对指定服务器进行Ping/DNS监测
本实验将通过云拨测对指定服务器进行Ping/DNS监测,评估网站服务质量和用户体验。
目录
相关文章
|
7天前
|
运维 应用服务中间件 Linux
自动化运维的利器:Ansible在配置管理中的应用
【10月更文挑战第39天】本文旨在通过深入浅出的方式,向读者展示如何利用Ansible这一强大的自动化工具来优化日常的运维工作。我们将从基础概念讲起,逐步深入到实战操作,不仅涵盖Ansible的核心功能,还会分享一些高级技巧和最佳实践。无论你是初学者还是有经验的运维人员,这篇文章都会为你提供有价值的信息,帮助你提升工作效率。
|
11天前
|
机器学习/深度学习 数据采集 人工智能
智能化运维在现代IT基础设施中的应用与价值####
本文探讨了智能化运维(AIOps)在现代IT基础设施管理中的实际应用、面临的挑战及其带来的深远影响。通过引入先进的算法和机器学习模型,智能化运维不仅提高了故障检测与响应的速度,还显著优化了资源配置,降低了运营成本,为企业数字化转型提供了强有力的技术支撑。 ####
|
9天前
|
机器学习/深度学习 人工智能 运维
智能运维在现代IT系统中的应用与挑战####
本文深入探讨了智能运维(AIOps)在现代IT系统中的关键作用,通过具体案例分析,揭示了其在提升系统稳定性、优化资源配置及自动化故障处理方面的显著优势。同时,文章也指出了实施智能运维过程中面临的数据安全、技术整合及人员技能转型等挑战,并提出了相应的解决策略,为读者提供了全面而深刻的见解。 ####
33 6
|
9天前
|
人工智能 运维 监控
智能运维在现代数据中心的应用与挑战
随着云计算和大数据技术的迅猛发展,现代数据中心的运维管理面临着前所未有的挑战。本文探讨了智能运维技术在数据中心中的应用,包括自动化监控、故障预测与诊断、资源优化等方面,并分析了当前面临的主要挑战,如数据安全、系统集成复杂性等。通过实际案例分析,展示了智能运维如何帮助数据中心提高效率、降低成本,并提出了未来发展趋势和建议。
|
10天前
|
运维 Ubuntu 应用服务中间件
自动化运维工具Ansible的实战应用
【10月更文挑战第36天】在现代IT基础设施管理中,自动化运维已成为提升效率、减少人为错误的关键手段。本文通过介绍Ansible这一流行的自动化工具,旨在揭示其在简化日常运维任务中的实际应用价值。文章将围绕Ansible的核心概念、安装配置以及具体使用案例展开,帮助读者构建起自动化运维的初步认识,并激发对更深入内容的学习兴趣。
31 4
|
8天前
|
运维 安全 应用服务中间件
自动化运维的利剑:Ansible在配置管理中的应用
【10月更文挑战第37天】本文将深入探讨如何利用Ansible简化和自动化复杂的IT基础设施管理任务。我们将通过实际案例,展示如何用Ansible编写可重用的配置代码,以及这些代码如何帮助运维团队提高效率和减少人为错误。文章还将讨论如何构建Ansible playbook来自动部署应用、管理系统更新和执行常规维护任务。准备好深入了解这个强大的工具,让你的运维工作更加轻松吧!
24 2
|
15天前
|
数据采集 机器学习/深度学习 运维
智能化运维在现代IT系统中的应用与挑战####
【10月更文挑战第29天】 本文探讨了智能化运维(AIOps)在现代IT系统中的重要作用及其面临的主要挑战。通过引入机器学习和大数据分析,智能化运维能显著提高系统稳定性、降低运营成本,并增强故障预测能力。然而,数据质量、技术整合及安全性等问题仍是其广泛应用的主要障碍。本文详细分析了这些挑战,并提出了相应的解决方案和未来发展趋势。 ####
38 5
|
17天前
|
机器学习/深度学习 数据采集 运维
智能化运维:机器学习在故障预测和自动化响应中的应用
智能化运维:机器学习在故障预测和自动化响应中的应用
42 4
|
22天前
|
机器学习/深度学习 人工智能 运维
智能化运维:AI驱动下的IT运维革命###
本文探讨了人工智能(AI)技术在IT运维领域的创新应用,强调其在提升效率、预防故障及优化资源配置中的关键作用,揭示了智能运维的新趋势。 ###
|
18天前
|
机器学习/深度学习 人工智能 运维
智能化运维:提升IT服务效率的新引擎###
本文深入浅出地探讨了智能化运维(AIOps)如何革新传统IT运维模式,通过大数据、机器学习与自动化技术,实现故障预警、快速定位与处理,从而显著提升IT服务的稳定性和效率。不同于传统运维依赖人工响应,AIOps强调预测性维护与自动化流程,为企业数字化转型提供强有力的支撑。 ###

热门文章

最新文章