新IT运维模式下,全栈溯源助你解应用性能监控难题

简介:

2016年,Gartner对APM的定义将原来的五个维度定义修改成了三个维度,即:数字化体验监控(DEM),应用发现、追踪和诊断(ADTD),以及应用分析(AA)。此外,Garter还强调,最终用户的体验始终是APM最重要的任务,而APM的核心功能则是能够基于应用去做问题的发现与诊断。这一定义的改变,源于用户在新的IT形势下,对APM提出的新需求。

近年来,公有云和移动互联网的增长,推动了APM市场和技术的快速发展。然而,云计算、微服务和容器化让监控的数据呈海量增长,为APM的发展带来了挑战。微服务架构和容器化让应用更具灵活性、弹性和扩展性,但在提高应用效率的同时,也让应用的拓扑架构和通讯变得更复杂,更难监控。

与此同时,企业数字化转型规模在愈发扩大,各行业对性能监控提出了更高的要求,传统的监控方案只能定位解决不到30%的问题,剩下的70%该怎么办呢?如何才能快速定位最终用户关键业务的性能问题?怎样才能保障关键业务流程各方面的稳健运行?

为了能够帮助企业应对新IT形势下的应用性能监控方面的难题,帮助IT管理团队快速实现不同业务逻辑下的性能排障,国内应用性能管理服务提供商听云,于2016年推出了全栈溯源解决方案,它在国内首次实现了全端、跨应用监控。

2017年,面对现阶段复杂的全栈环境,定位问题变得更加复杂,为了能够对应用性能问题更加深入的追踪与诊断,听云全栈溯源进行了全面升级。此次升级主要是基于用户体验的性能监控升级,实现了工具产品平台化,为用户提供全面的听云全栈溯源解决方案。

据听云产品副总裁Moca介绍,所谓全栈溯源,就是从用户体验出发,基于事务请求进行全栈问题的定位追踪。目前,其涉及的主要功能有:APP端事务请求全栈溯源、浏览器页面事务请求全栈溯源、拨测事务请求全栈溯源、单用户全栈溯源。

“全栈溯源是全球APM行业的趋势。在国外,Dynatrace、AppDynamics这些老牌APM厂商已经将全栈溯源作为了产品的标配。但是,从功能上来说,听云的技术在国内是非常领先的。因为我们的服务体系更加符合国内企业的要求,国外的APM不支持国内组件,比如阿里云的基于微服务架构的支持,类似达梦数据库的国产化技术。” Moca说。

新IT运维模式下,全栈溯源助你解应用性能监控难题

听云全栈溯源解决方案可以实现清晰责任界定为各部门提供统一的信息平台,共同讨论目前应用发生的问题,以及解决方案。基于客户关键业务的自动质量控制平台,将把以周为单位的解决问题时间缩短为几分钟。同时,当发生严重问题时,系统会进行自动响应,及时告警。

新IT运维模式下,全栈溯源助你解应用性能监控难题

新IT运维模式下,全栈溯源助你解应用性能监控难题

既然全栈溯源解决方案是从用户体验出发,听云是怎样来衡量用户体验的呢? Moca解释说,一方面,用户可以结合自身来定义用户体验问题,比如反应快慢时间。另一方面,听云全栈溯源解决方案设置了一个默认值。此外,在用户感知层面,针对首屏时间、点击控件时间等,系统会通过请求的关联,来发现是否是因为请求慢导致用户体验度低的问题。

那么,针对微服务架构和容器化等新技术,听云全栈溯源解决方案是否能够很好的解决应用性能监控的问题呢?

对此,Moca表示,简单来说,微服务就是把整个系统划分为多个细小的服务。以听云为例,听云服务器端整个监控系统,报表、数据库查询系统等,都可以拆分成一个个微服务。这里的挑战在于,以前我们很清楚是A、B、C应用组成了一个系统,而现在我们不知道A、B、C应用中的哪些微服务组成了一个系统。因为听云也在用微服务和容器,它们在带来灵活、可扩展性强等诸多好处的同时,也给业务管理带来很多的瓶颈,定位一个问题需要定位到某一个具体的微服务。如果是容器,则需要考虑映射到哪个主机等,这些都是听云正在努力的方向。

目前,听云全栈溯源解决方案已经支持容器。因为容器的核心就是可以动态扩展,动态扩展时会变成很多实例,此时就可以动态的根据这些实例去扩展。所以如果忽略容器这一层,把能具体定位到错误与容器和主机映射到一起,就可知道系统级别、基础架构下的哪里出现了哪些问题。然后定位到应用级别,再把应用拆开,就能找到这个应用具体映射到哪个容器和服务器,最终实现对应用性能的监控。

采访最后,Moca表示:“全栈溯源核心在于从用户体验出发,可以支持多种复杂的环境。客户无论使用怎样的生产环境,我们都能够给予支持。这是我们走向市场,成熟商业化的重要标准之一。今年,听云的重点是从用户体验出发,不断完善全栈溯源解决方案的功能,实现多种视角,使产品更加易用。”


本文作者:杜美洁   

来源:51CTO

相关实践学习
通过轻量消息队列(原MNS)主题HTTP订阅+ARMS实现自定义数据多渠道告警
本场景将自定义告警信息同时分发至多个通知渠道的需求,例如短信、电子邮件及钉钉群组等。通过采用轻量消息队列(原 MNS)的主题模型的HTTP订阅方式,并结合应用实时监控服务提供的自定义集成能力,使得您能够以简便的配置方式实现上述多渠道同步通知的功能。
目录
相关文章
|
4月前
|
人工智能 运维 自然语言处理
别再靠“救火”过日子了:智能运维,正在重塑IT服务的未来
别再靠“救火”过日子了:智能运维,正在重塑IT服务的未来
407 15
|
5月前
|
机器学习/深度学习 人工智能 运维
智能运维加速交付:应用上线别再慢吞吞
智能运维加速交付:应用上线别再慢吞吞
174 2
|
4月前
|
运维 Prometheus 监控
别再“亡羊补牢”了!——聊聊如何优化企业的IT运维监控架构
别再“亡羊补牢”了!——聊聊如何优化企业的IT运维监控架构
201 8
|
5月前
|
运维 Linux 网络安全
自动化真能省钱?聊聊运维自动化如何帮企业优化IT成本
自动化真能省钱?聊聊运维自动化如何帮企业优化IT成本
178 4
|
5月前
|
运维 Kubernetes 测试技术
应用多、交付快,研发运维怎么管?看云效+SAE 如何一站式破局
通过在云效中创建 SAE 服务连接并关联集群,团队可将应用环境直接部署到 SAE,实现从代码提交、镜像构建到 SAE 部署的自动化流水线。该集成打通了研发与运维的壁垒,特别适用于应用数量多、团队规模大、交付节奏快的组织,助力企业实现敏捷、可靠的持续交付。
|
6月前
|
人工智能 运维 监控
IT运维数字化转型:不是换工具,而是换思路
IT运维数字化转型:不是换工具,而是换思路
184 9
|
9月前
|
运维 Kubernetes 前端开发
传统企业如何玩转平台工程?2 个运维靠它管 50 + 应用
做了五年运维,最深刻的感悟是:技术自负是效率的天敌。以前总觉得懂 Kubectl 命令才专业,直到被平台工程打脸,真正的专业不是炫技,而是让复杂技术为业务服务。现在我常跟新人说:能让开发和厂商爽的运维,才是好运维,而 Rainbond,就是那个让所有人都爽的神器。
传统企业如何玩转平台工程?2 个运维靠它管 50 + 应用
|
11月前
|
数据采集 机器学习/深度学习 人工智能
智能运维在IT管理中的实践与探索
【10月更文挑战第21天】 本文深入探讨了智能运维(AIOps)技术在现代IT管理中的应用,通过分析其核心组件、实施策略及面临的挑战,揭示了智能运维如何助力企业实现自动化监控、故障预测与快速响应,从而提升整体运维效率与系统稳定性。文章还结合具体案例,展示了智能运维在实际环境中的显著成效。
541 133
|
7月前
|
运维 监控 应用服务中间件
运维打铁: Ruby 脚本在运维自动化中的应用探索
Ruby 是一种简洁、动态类型的编程语言,适合运维自动化任务。本文介绍了其在服务器配置管理、定时任务执行和日志分析处理中的应用,并提供了代码示例,展示了 Ruby 在运维自动化中的实际价值。
232 2

热门文章

最新文章