《2021 阿里云可观测技术峰会演讲实录合辑(下)》——一、基于OPLG从0到1构建统一可观测平台实践——场景实践2:如何基于Prometheus和Grafana做统一的监控和告警

简介: 《2021 阿里云可观测技术峰会演讲实录合辑(下)》——一、基于OPLG从0到1构建统一可观测平台实践——场景实践2:如何基于Prometheus和Grafana做统一的监控和告警

首先,在接入中心选择要接入的组件,有MySQL、Redis、ES等,默认支持阿里云上的很多组件。

image.png

以MySQL为例,首先选择要接入的实例,填写exporter名称,选择地址,再写入用户密码,此处也可以查看当前exporter采集的指标。

image.png

如果实例未接入,可以选择新建实例。比如针对ECS环境或自建机房,可以通过下载ARMS提供的helm安装Prometheus Agent,也可以通过Remote Write的方式直接上报数据。如果希望将多个地域的数据源放在一起查看,也可以通过Global View全局接口实例将多个数据进行统一展示。

image.png


进入集成中心后,可以看到当前实例已经安装的组件,可以查看组件采集的指标,可以更精细化地选择哪些指标需要采集,哪些不需要。

image.png


大盘列表里,ARMS提供了非常多预置的Grafana大盘,比如K8s的总览视图或node详情视图,可以查看当前节点各种状态,用户也可以基于视图自己编辑新的图表。

image.png

因为数据都写到Prometheus,所以告警也可以基于PromQL扩展。我们提供了很多默认的告警模板,比如节点的CPU使用率等。除了可以定制告警内容,还可以选择通知策略,比如不同的告警发给不同的值班人员。

 

Grafana ARMS提供了两种类型的Grafana,分别是共享版本和托管的独占版本。我们更推荐开通独占的托管版本,可以做自定义的账号管理,也可以得到更好的可用性和安全性保障。

相关文章
|
10月前
|
Prometheus 监控 Cloud Native
云原生监控实战:Prometheus+Grafana快速搭建指南
云原生监控实战:Prometheus+Grafana快速搭建指南
|
10月前
|
存储 Prometheus 监控
OSS监控体系搭建:Prometheus+Grafana实时监控流量、错误码、存储量(开源方案替代云监控自定义视图)
本方案基于Prometheus构建OSS监控系统,涵盖架构设计、指标采集、可视化、告警及性能优化,助力企业实现高可用、低成本的自建监控体系。
938 1
|
10月前
|
存储 监控 Cloud Native
云原生监控实战:Prometheus+Grafana打造RDS多维度预警体系
本方案构建了基于Prometheus与Thanos的云原生RDS监控体系,涵盖数据采集、存储、可视化与告警全流程。支持10万+QPS采集、90%存储压缩,具备<30秒告警延迟能力。通过自定义指标与智能预警策略,显著提升故障发现效率,实现分钟级响应。
682 5
|
10月前
|
Prometheus 监控 Cloud Native
|
9月前
|
Prometheus 监控 Cloud Native
Docker 部署 Prometheus 和 Grafana 监控 Spring Boot 服务
Docker 部署 Prometheus 和 Grafana 监控 Spring Boot 服务实现步骤
776 0
|
Prometheus 运维 监控
智能运维实战:Prometheus与Grafana的监控与告警体系
【10月更文挑战第26天】Prometheus与Grafana是智能运维中的强大组合,前者是开源的系统监控和警报工具,后者是数据可视化平台。Prometheus具备时间序列数据库、多维数据模型、PromQL查询语言等特性,而Grafana支持多数据源、丰富的可视化选项和告警功能。两者结合可实现实时监控、灵活告警和高度定制化的仪表板,广泛应用于服务器、应用和数据库的监控。
1519 3
|
11月前
|
运维 监控 网络协议
物联网设备状态监控全解析:从告警参数到静默管理的深度指南-优雅草卓伊凡
物联网设备状态监控全解析:从告警参数到静默管理的深度指南-优雅草卓伊凡
343 11
物联网设备状态监控全解析:从告警参数到静默管理的深度指南-优雅草卓伊凡
|
数据采集 运维 监控
数据采集监控与告警:错误重试、日志分析与自动化运维
本文探讨了数据采集技术从“简单采集”到自动化运维的演进。传统方式因反爬策略和网络波动常导致数据丢失,而引入错误重试、日志分析与自动化告警机制可显著提升系统稳定性与时效性。正方强调健全监控体系的重要性,反方则担忧复杂化带来的成本与安全风险。未来,结合AI与大数据技术,数据采集将向智能化、全自动方向发展,实现动态调整与智能识别反爬策略,降低人工干预需求。附带的Python示例展示了如何通过代理IP、重试策略及日志记录实现高效的数据采集程序。
562 7
数据采集监控与告警:错误重试、日志分析与自动化运维
|
10月前
|
编解码 监控 算法
CDN+OSS边缘加速实践:动态压缩+智能路由降低30%视频流量成本(含带宽峰值监控与告警配置)
本方案通过动态压缩、智能路由及CDN与OSS集成优化,实现视频业务带宽成本下降31%,首帧时间缩短50%,错误率降低53%。结合实测数据分析与架构创新,有效解决冷启动延迟、跨区域传输及设备适配性问题,具备快速投入回收能力。
695 0
|
Prometheus 监控 Cloud Native
【监控】prometheus传统环境监控告警常用配置
【监控】prometheus传统环境监控告警常用配置
【监控】prometheus传统环境监控告警常用配置

相关产品

  • 可观测可视化 Grafana 版
  • 可观测监控 Prometheus 版
  • 推荐镜像

    更多