阿里云上监控知多少(下)

简介: 上一次我们介绍了云监控,这次我们再来了解一下应用实时监控这个体系。

“可监控、可灰度、可回滚” 据说是阿里集团内部有关系统稳定性的“三板斧”,作为第一步的“可监控”自然是所有业务条线的一项“刚需”,那么到底如何实现“可监控”就让我们从阿里云的现有监控服务产品中来一窥究竟吧。

阿里云目前有两大监控服务体系,一个是偏向于云基础架构侧的“云监控”、一个是偏向于应用侧的“应用实时监控”,上一次我们介绍了云监控,这次我们再来了解一下应用实时监控这个体系。

应用实时监控又称ARMS是阿里云一个偏向应用层监控的产品家族,其中第一部分是应用服务监控,这个产品说白了就是一款APM应用性能管理(Application Performance Management)产品,这个市场里的产品过去主要面向的都是一些线下IDC的应用场景,虽然后来也出现了一些SaaS化的APM产品,但总体上面向的客户群还是以非互联网客户为主,而阿里云的这款APM是从阿里巴巴内部电商等业务里孵化出来的,因此天然具备的是互联网的基因,随后在很多的传统企业互联网转型项目中被大量的采用,只要是中台相关的项目建设,ARMS都是绕不过去的产品,由于之前对应用监控这块儿有过探讨,所以这次对于这个产品的细节我这里就不过多介绍了。

除了APM,ARMS还有前端监控这一部分的功能,通过在WEB或者小程序的前端代码中嵌入ARMS的埋点代码,就能对应用的前端运行状态进行掌控,监控的状态包括前端页面的打开和运行速度、运行过程中自身及API的出错等情况。

用户使用ARMS前端监控主要能够获得如下好处:

  • 及时的获知用户在本站点遇到的JS错误信息。
  • 及时获知应用对外部调用的成功率等信息。
  • 及时获知前端页面在全球各地的打开速度。

前端监控主要是被动的接收用户访问页面之后监控数据,假如客户希望更主动的改善用户的使用体验就引出了ARMS产品家族的另一个服务“云拨测”,这个云拨测有些类似于云监控的站点监控,都是利用阿里云遍布全球的探测站点对目标网站或服务的可用性进行“主动”的探测的服务。

相对于云监控中的站点监控,ARMS体系中的云拨测更加偏向于对应用服务返回的WEB元素进行更细粒度的探测和匹配,说白了就是云拨测能够创建对目标站点进行定时“浏览”的任务,在此期间对于页面的元素级错误进行及时的预警以改善用户体验。

最后一个ARMS家族的成员来自开源的监控体系,正是当下正炙手可热的Prometheus监控服务。使用ARMS Prometheus完全兼容开源Prometheus的客户端和查询语言(PromSQL),而不需要自行构建和运维Prometheus的各种后台服务,直接开箱使用即可,目前ARMS Prometheus 既支持对自建或者云上的K8S集群进行监控接入,又支持通过丰富的开源Exporter组件接入到ECS服务器中的MySQL、Redis、MongoDB、ElasticSearch、RocketMQ、Ngnix、ZooKeeper等中间件服务,随着Prometheus相关生态的日益繁盛,未来将会有更多的中间件服务以Exporter的方式接入到Prometheus体系中,这样一来通过ARMS的Prometheus服务就能完整的实现对在ECS上自建的各类应用中间件的监控,可以说ARMS Prometheus补上了阿里云上监控的最后一块拼图。

相关实践学习
通过轻量消息队列(原MNS)主题HTTP订阅+ARMS实现自定义数据多渠道告警
本场景将自定义告警信息同时分发至多个通知渠道的需求,例如短信、电子邮件及钉钉群组等。通过采用轻量消息队列(原 MNS)的主题模型的HTTP订阅方式,并结合应用实时监控服务提供的自定义集成能力,使得您能够以简便的配置方式实现上述多渠道同步通知的功能。
目录
相关文章
|
人工智能 JSON 自然语言处理
基于阿里云通义千问的AI模型应用开发指南
阿里云通义千问是阿里巴巴集团推出的多模态大语言模型平台,提供了丰富的API和接口,支持多种AI应用场景,如文本生成、图像生成和对话交互等。本文将详细介绍阿里云通义千问的产品功能,并展示如何使用其API来构建一个简单的AI应用,包括程序代码和具体操作流程,以帮助开发者快速上手。
3591 3
|
移动开发 安全 Java
钉钉企业应用网关了解一下
通过企业应用网关,即便该服务器完全在互联网上运行,我们也能够实现“零信任”访问。
2792 1
钉钉企业应用网关了解一下
|
Docker 容器
14 response from daemon: open \\.\pipe\docker_engine_linux: The system cannot find the file speci
14 response from daemon: open \\.\pipe\docker_engine_linux: The system cannot find the file speci
404 1
|
人工智能 自然语言处理 计算机视觉
AI大模型开启智能化新时代
12月19日下午,复旦大学计算机科学技术学院第十二期“步青讲坛”在江湾校区二号交叉学科楼E1006报告厅举行。本期讲坛特别邀请了阿里巴巴集团副总裁、IEEE Fellow叶杰平教授做题为《AI大模型开启智能化新时代》的精彩技术报告。
459 4
|
数据采集 人工智能 运维
从企业级 RAG 到 AI Assistant,阿里云Elasticsearch AI 搜索技术实践
本文介绍了阿里云 Elasticsearch 推出的创新型 AI 搜索方案
734 3
从企业级 RAG 到 AI Assistant,阿里云Elasticsearch AI 搜索技术实践
|
人工智能 JSON 自然语言处理
智能化AI工具-语言翻译与本地化
在全球化发展的背景下,语言翻译与本地化需求日益增长。无论是跨境电商、国际合作,还是本地化应用开发,都需要高效、准确的翻译解决方案。阿里云通义千问作为一款强大的大语言模型,不仅具备出色的自然语言理解能力,还能够在多语言翻译和本地化场景中发挥重要作用。本博客将详细介绍如何基于阿里云通义千问开发语言翻译与本地化工具,包括产品介绍、程序代码以及阿里云相关产品的具体使用流程。
596 10
|
存储 自然语言处理 关系型数据库
基于阿里云通义千问开发智能客服与问答系统
在企业的数字化转型过程中,智能客服系统已成为提高客户满意度和降低运营成本的重要手段。阿里云的通义千问作为一款强大的大语言模型,具有自然语言理解、对话生成、知识检索等能力,非常适合用来开发智能客服与问答系统。 通过本博客,我们将演示如何基于阿里云的通义千问模型,结合阿里云相关产品如函数计算(FC)、API网关、RDS等,搭建一个功能齐全的智能客服系统。
1611 5
|
存储 监控 搜索推荐
大规模数据存储与检索:Java与Elasticsearch应用
大规模数据存储与检索:Java与Elasticsearch应用
225 11
|
存储 安全 Java
如何接入OSS
如何接入OSS
|
存储 安全 API
对象存储OSS产品常见问题之附件上传后存储存在被窃取的风险如何解决
对象存储OSS是基于互联网的数据存储服务模式,让用户可以安全、可靠地存储大量非结构化数据,如图片、音频、视频、文档等任意类型文件,并通过简单的基于HTTP/HTTPS协议的RESTful API接口进行访问和管理。本帖梳理了用户在实际使用中可能遇到的各种常见问题,涵盖了基础操作、性能优化、安全设置、费用管理、数据备份与恢复、跨区域同步、API接口调用等多个方面。
643 0