安利一款运维杀手锏,让监控部署不再尴尬!(附视频)

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 MongoDB,独享型 2核8GB
推荐场景:
构建全方位客户视图
简介:

作者介绍

贺春旸金融MySQL专家,《MySQL管理之道》第一版、第二版作者。曾任职于中国移动飞信、机锋安卓市场,拥有丰富的数据库管理经验。目前致力于MySQL、Linux等开源技术的研究。

 

一、痛点

 

目前DBA团队和运维团队是单独部署的监控系统,我用Nagios监控DB,运维用Zabbix监控应用,早期我是用Cacti+Percona的模板做画图,由于MySQL/MongoDB服务的增多,每次人肉在网页里加监控项太累,后接在Zabbix里实现画图,结果造成Zabbix的监控表变大,Zabbix开始变得卡顿产生大量的误报警,导致运维在春节年会饭桌上收到了上百个报警短信,后直接切表才得以解决,固我决定需要拆分出去,实现微服务思想,让运维可以安心吃顿饭 ^_^

 

二、介绍

 

Percona Monitoring and Management (PMM)是一款开源的用于管理和监控MySQL和MongoDB性能的开源平台,通过PMM客户端收集到的DB监控数据用第三方软件Grafana画图展示出来。在这个产品之前,Percona提供了Zabbix和Cacti的图形模板,也许是考虑到了用户部署起来繁琐等问题,索性在春节前Percona发布了PMM Docker镜像,用户只需要下载镜像运行就全部搞定,开箱即用相当easy!

 

PMM架构如下图所示:

 

 

模块说明:

  • Query Analytics (QAN):用来展示MySQL慢查询日志。

  • Prometheus:是一个开源的服务监控系统和时间序列数据库,用来聚集DB的监控数据。

  • Grafana:将Prometheus里面的数据画图展示出来。

 

三、部署

 

系统:CentOS-7.3

 

1、Docker安装

 

# yum install docker -y

 

2、PMM Server安装

 

(1)下载PMM Server Docker镜像

 

# docker create   \

   -v /opt/prometheus/data \

   -v /opt/consul-data \

   -v /var/lib/mysql \

   -v /var/lib/grafana \

   --name pmm-data \

   percona/pmm-server:1.0.7 /bin/true

 

(2)启动

 

# docker run -d   \

   -p 80:80 \

   --volumes-from pmm-data \

   --name pmm-server \

   --restart always \

   percona/pmm-server:1.0.7

 

(3)查看Docker运行状态

 

 

(4)打开浏览器http://yourip即可

 

 

Component

URL

PMM首页

http://yourip

Query Analytics (慢日志分析)

http://yourip/qan/

Metrics Monitor (Grafana)

http://yourip/graph/

user name: admin

password: admin

Orchestrator

http://yourip/orchestrator

 

3、PMM Client安装

 

(1)下载PMM Client

 

# wget

https://www.percona.com/downloads/pmm-client/LATEST/binary/tarball/pmm-client-1.0.7.tar.gz

# tar zxvf pmm-client-1.0.7.tar.gz

# cd pmm-client-1.0.7

# ./install

 

(2)连接PMM Server

 

# pmm-admin config --server yourip

 

(3)增加MySQL和MongoDB监控服务

 

# pmm-admin add mysql --user admin --password 123456 --host 192.168.148.21

# pmm-admin add mongodb --cluster rs1 --uri

mongodb://admin:123456@localhost:27017

 

(4)查看

 

# pmm-admin list

 

 

 

五、监控页面展示

 

OS系统

 

 

MySQL

 

 

MySQL慢查询分析

 

 

MongoDB

 

 

 

六、Email报警

 

报警是通过Grafana发出的,内置有Email、Webhook、slack、pagerduty,可惜没有微信,老外应该没听过这个玩意,所以这里我介绍一下Email报警是如何配置的。

 

1、首先进入docker shell里,见下面截图:

 

# docker ps

# docker exec -it 75d3be875849 /bin/bash

 

2、修改/etc/grafana/grafana.ini配置文件:

 

####################################   SMTP / Emailing ##########################

[smtp]

enabled = true

host =   smtp.126.com:25

user =   chunyang_he@126.com

password =   123456

;cert_file =

;key_file =

;skip_verify =   false

from_address =   chunyang_he@126.com

 

3、重启Docker生效

 

# docker stop 75d3be875849

# docker start 75d3be875849

 

4、页面配置

 

 

这一步步骤繁琐,具体请参考视频演示:http://pan.baidu.com/s/1i4OyGo1

 

效果如下图:

 

原文发布时间为:2017-02-21

本文来自云栖社区合作伙伴DBAplus

相关实践学习
通过可观测可视化Grafana版进行数据可视化展示与分析
使用可观测可视化Grafana版进行数据可视化展示与分析。
相关文章
|
3月前
|
运维 监控 安全
构建高效运维体系:从监控到自动化的全方位实践
本文深入探讨了构建高效运维体系的关键要素,从监控、日志管理、自动化工具、容器化与微服务架构、持续集成与持续部署(CI/CD)、虚拟化与云计算以及安全与合规等方面进行了全面阐述。通过引入先进的技术和方法,结合实际案例和项目经验,为读者提供了一套完整的运维解决方案,旨在帮助企业提升运维效率,降低运营成本,确保业务稳定运行。
|
1月前
|
Prometheus 运维 监控
智能运维实战:Prometheus与Grafana的监控与告警体系
【10月更文挑战第26天】Prometheus与Grafana是智能运维中的强大组合,前者是开源的系统监控和警报工具,后者是数据可视化平台。Prometheus具备时间序列数据库、多维数据模型、PromQL查询语言等特性,而Grafana支持多数据源、丰富的可视化选项和告警功能。两者结合可实现实时监控、灵活告警和高度定制化的仪表板,广泛应用于服务器、应用和数据库的监控。
259 3
|
4月前
|
运维 Prometheus 监控
OceanBase 的运维与监控最佳实践
【8月更文第31天】随着分布式数据库解决方案的需求日益增长,OceanBase 作为一种高性能的分布式数据库系统,在众多场景下得到了广泛应用。为了确保 OceanBase 集群的稳定运行,合理的运维与监控是必不可少的。本文将探讨 OceanBase 的日常运维管理与监控策略,并提供相应的代码示例。
260 2
|
4天前
|
Prometheus 运维 监控
Prometheus+Grafana+NodeExporter:构建出色的Linux监控解决方案,让你的运维更轻松
本文介绍如何使用 Prometheus + Grafana + Node Exporter 搭建 Linux 主机监控系统。Prometheus 负责收集和存储指标数据,Grafana 用于可视化展示,Node Exporter 则采集主机的性能数据。通过 Docker 容器化部署,简化安装配置过程。完成安装后,配置 Prometheus 抓取节点数据,并在 Grafana 中添加数据源及导入仪表盘模板,实现对 Linux 主机的全面监控。整个过程简单易行,帮助运维人员轻松掌握系统状态。
44 3
|
1月前
|
消息中间件 数据采集 运维
一份运维监控的终极秘籍!监控不到位,宕机两行泪
【10月更文挑战第25天】监控指标的采集分为基础监控和业务监控。基础监控涉及CPU、内存、磁盘等硬件和网络信息,而业务监控则关注服务运行状态。常见的监控数据采集方法包括日志、JMX、REST、OpenMetrics等。Google SRE提出的四个黄金指标——错误、延迟、流量和饱和度,为监控提供了重要指导。错误监控关注系统和业务错误;延迟监控关注服务响应时间;流量监控关注系统和服务的访问量;饱和度监控关注服务利用率。这些指标有助于及时发现和定位故障。
155 1
|
2月前
|
运维 Prometheus 监控
运维之眼:监控的艺术与实践
在信息技术飞速发展的今天,运维监控已成为保障系统稳定运行的关键。本文将探讨运维监控的重要性,介绍常用的监控工具和方法,并通过实际案例分析,展示如何有效地实施监控策略,以确保系统的高可用性和性能。
|
2月前
|
运维 监控 测试技术
构建高效运维体系:从监控到自动化的实践之路
【10月更文挑战第9天】 在当今信息技术飞速发展的时代,运维作为保障系统稳定性与效率的关键角色,正面临前所未有的挑战。本文将探讨如何通过构建一个高效的运维体系来应对这些挑战,包括监控系统的搭建、自动化工具的应用以及故障应急处理机制的制定。我们将结合具体案例,分析这些措施如何帮助提升系统的可靠性和运维团队的工作效率。
62 1
|
2月前
|
运维 监控 安全
构建高效运维体系:从监控到自动化的全面指南在当今数字化时代,运维作为保障系统稳定性和效率的重要环节,其重要性不言而喻。本文将深入探讨如何构建一个高效的运维体系,从监控系统的搭建到自动化运维的实施,旨在为读者提供一套完整的解决方案。
本文详细介绍了高效运维体系的构建过程,包括监控系统的选择与部署、日志分析的方法、性能优化的策略以及自动化运维工具的应用。通过对这些关键环节的深入剖析,帮助运维人员提升系统的可靠性和响应速度,降低人工干预成本,实现业务的快速发展和稳定运行。
|
1月前
|
Prometheus 运维 监控
智能运维实战:Prometheus与Grafana的监控与告警体系
【10月更文挑战第27天】在智能运维中,Prometheus和Grafana的组合已成为监控和告警体系的事实标准。Prometheus负责数据收集和存储,支持灵活的查询语言PromQL;Grafana提供数据的可视化展示和告警功能。本文介绍如何配置Prometheus监控目标、Grafana数据源及告警规则,帮助运维团队实时监控系统状态,确保稳定性和可靠性。
218 0
|
3月前
|
存储 弹性计算 运维
自动化监控和响应ECS系统事件
阿里云提供的ECS系统事件用于记录云资源信息,如实例启停、到期通知等。为实现自动化运维,如故障处理与动态调度,可使用云助手插件`ecs-tool-event`。该插件定时获取并转化ECS事件为日志存储,便于监控与响应,无需额外开发,适用于大规模集群管理。详情及示例可见链接文档。

热门文章

最新文章