直达最佳实践:【云上prometheus监控运维】
最佳实践频道:【点击查看更多上云最佳实践】
这里有丰富的企业上云最佳实践,从典型场景入门,提供一系列项目实践方案,降低企业上云门槛的同时满足您的需求!
众能联合:我们公司目前正在使用阿里云的K8S的服务为我们的业务提供服务,在使用过程中遇到了些服务资源监控的问题,寻找了很多文档都没有很好的解决,自从在官网看到最佳实践的文档(云上Prometheus 监控运维最佳实践),如获至宝。文档写的很详细,很认真,更新及时,很赞,按照文档很快解决了问题,真是如鱼得水希望最佳实践可以一直持续的更新。
沪江英语:通过阿里云api对接到云上的管理平台,能快速、完整的获取监控数据;另外使用云上的监控组件简化了配置文件的调整,方便了监控的部署和管理,也有助于监控报警处理的闭环。
监控系统概述
什么是监控系统?监控系统特指对数据中心的监控,包括硬件和软件的监控和告警。
那么监控系统究竟有什么作用呢?
- 实时监控。提供硬件和软件的运行状态展示,随时监查运行过程,做到即时跟踪。
- 告警。通过统一配置的告警服务,可以发送符合预设告警阈值则通过多种方式发送告警信息。
- 帮助辅助决策。大数据监控不仅提供实时状态展现,更能帮助故障回溯和预测未知的风险。
场景描述
Prometheus是一款面向云原生应用程序的开源监控工具。本实践主要介绍基于阿里云容器服务Kubernetes集成部署Prometheus监控方案,通过grafana对监控数据进行可视化展示,通过Alertmanager配置统一的监控告警服务,轻松实现云原生监控运维。
解决问题
- Helm/Chart一键部署Prometheus监控套件
- 默认集成Alertmanager和grafana
- 支持钉钉以及邮件告警
- 支持自定义监控任务
产品列表
- 容器服务ACK
功能:提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力,打造云端最佳容器化应用运行环境。 - 时序数据库TSDB
功能:集压缩存储,实时计算能力为一体的数据库服务,实现对设备及业务服务的实时监控,实时预测告警。 - 云服务器ECS
功能:提供弹性可伸缩的计算服务,帮助客户降低 IT 成本,提升运维效率。 - 云监控CMS
功能:通过云监控管理控制台,您可以看到当前服务的监控项数据图表,清晰了解服务运行情况。同时可以通过设置报警规则,管理监控项状态,及时获取异常信息。