年底了,给MySQL做个例行巡检吧

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS PostgreSQL,集群系列 2核4GB
简介: 前言: 例行巡检是节假日来临之前的必做项目,对服务器做一轮全面的健康检查,一方面可以确保节假日期间服务器的稳定,另外还可以检查一下平时监控没覆盖到的地方。 连《炉石传说》这么强大的运维团队都能把数据弄丢,你还有什么理由不做一次巡检呢? 巡检主要分如下4个层面: 1.硬件 2.操作系统 3.数据库 4.架构 5.ETL 巡检项目: 如需详细大图与备注请直接联系我,站内不允许上传mindmanger格式的文件。

前言:

例行巡检是节假日来临之前的必做项目,对服务器做一轮全面的健康检查,一方面可以确保节假日期间服务器的稳定,另外还可以检查一下平时监控没覆盖到的地方。
连《炉石传说》这么强大的运维团队都能把数据弄丢,你还有什么理由不做一次巡检呢?

巡检主要分如下4个层面:

1.硬件

2.操作系统

3.数据库

4.架构

5.ETL

巡检项目:


如需详细大图与备注请直接联系我,站内不允许上传mindmanger格式的文件。

巡检脚本:

点击(此处)折叠或打开

  1. #!/bin/bash
  2. #这个脚本的功能是对MySQL进行巡检
  3. #Written by LiHui
  4. #Version 1.1
  5. #Data:2017-01-19

  6. echo -e "\033[33m========================= 硬件检查 =========================\033[0m"

  7. echo -e "\033[31m=====显示开机信息===== \033[0m"
  8. dmesg | tail -20

  9. echo -e "\033[31m=====查看RAID阵列信息===== \033[0m"
  10. /opt/MegaRAID/MegaCli/MegaCli64 -LDInfo -Lall -aALL

  11. echo -e "\033[31m=====检查物理磁盘SMART信息===== \033[0m"
  12. /opt/MegaRAID/MegaCli/MegaCli64 -PDList -aALL|egrep 'Slot|S.M.A.R.T'

  13. echo -e "\033[31m=====检查RAID电池状态===== \033[0m"
  14. /opt/MegaRAID/MegaCli/MegaCli64 -AdpBbuCmd -a0|grep -E 'Charger|isSOHGood|Cycle Count|Max Error'


  15.  
  16. echo -e "\033[33m========================= 操作系统检查 =========================\033[0m"

  17. echo -e "\033[31m=====启动项检查===== \033[0m"
  18. chkconfig --list |grep -E "lvs|iptables|zabbix_agentd"

  19. echo -e "\033[31m=====MySQL启动项检查===== \033[0m"
  20. cat /etc/rc.d/rc.local |grep mysql

  21. echo -e "\033[31m=====IO性能检查===== \033[0m"
  22. vmstat 1 5

  23. echo -e "\033[31m=====内存检查===== \033[0m"
  24. free -m

  25. echo -e "\033[31m=====操作系统日志检查===== \033[0m"
  26. tail -50 /var/log/messages

  27. echo -e "\033[31m=====磁盘空间检查===== \033[0m"
  28. df -h

  29. echo -e "\033[31m=====网络情况检查===== \033[0m"
  30. ifconfig|grep errors



  31. echo -e "\033[33m========================= 数据库检查 =========================\033[0m"

  32. for i in `netstat -nult |grep 33|awk -F ':' '{print $2}'|awk '{print $1}'`;do echo -e "\033[31m=====THIS SECTION IS BUFFER POOL FOR PORT " $i "===== \033[0m"; mysql -uxxx -pxxx -S /data0/mysqldata/$i/mysql.sock -e 'show engine innodb status \G' |grep 'Free buffers';done

  33. for i in `netstat -nult |grep 33|awk -F ':' '{print $2}'|awk '{print $1}'`; do echo -e "\033[31m=====THIS SECTION IS ERROR LOG FOR PORT " $i "===== \033[0m"; tail -50 /data0/mysqldata/$i/mysql-error.log; done



  1. echo -e "\033[33m========================= 架构检查 =========================\033[0m"

  2. for i in `netstat -nult |grep 33|awk -F ':' '{print $2}'|awk '{print $1}'`;do echo -e "\033[31m=====THIS SECTION IS SLAVE STATUS FOR PORT " $i "===== \033[0m"; mysql -uxxx -pxxx -S /data0/mysqldata/$i/mysql.sock -e 'show slave status \G' |grep -E 'Slave_IO_Running|Slave_SQL_Running|Master_Log_File|Read_Master_Log_Pos|Relay_Master_Log_File|Exec_Master_Log_Pos|Seconds_Behind_Master';done

  3. echo -e "\033[31m=====虚拟IP检查===== \033[0m"
  4. ip addr|grep lo |grep -v eth1



相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
SQL 监控 关系型数据库
【巡检问题分析与最佳实践】RDS PostgreSQL 实例IO高问题
实例的磁盘IO负载是RDS PostgreSQL用户日常应重点关注的监控项之一,如果磁盘IO压力过大,很容易导致数据库性能问题。
【巡检问题分析与最佳实践】RDS PostgreSQL 实例IO高问题
|
2月前
|
SQL 数据可视化 关系型数据库
MySQL 备份可视化巡检系统
MySQL 备份可视化巡检系统
|
2月前
|
缓存 关系型数据库 MySQL
分享一个实用的MySQL一键巡检脚本
分享一个实用的MySQL一键巡检脚本
24 0
|
5月前
|
NoSQL Java 关系型数据库
处理Redis与MySQL数据不一致的Java定期巡检方案
处理Redis与MySQL数据不一致的Java定期巡检方案
54 0
QGS
|
关系型数据库 MySQL 数据库
mysql数据库巡检脚本
记mysql数据库巡检脚本
QGS
741 0
mysql数据库巡检脚本
|
SQL 缓存 NoSQL
【巡检问题分析与最佳实践】PolarDB MySQL CPU高问题
CPU做为数据库资源最核心的资源,是日常最重点需要关注的指标,CPU用满,会导致应用RT增高、业务卡顿,更严重会导致数据库实例hang死发生ha等问题,严重影响日常生产业务。 一般对于CPU的监控需要设定安全水位,超出安全水位要及时处理,否则会引发不可预期的严重后果。
【巡检问题分析与最佳实践】PolarDB MySQL CPU高问题
|
SQL 缓存 监控
【巡检问题分析与最佳实践】RDS SQL Server 空间使用问题
实例的空间使用率是RDS SQL Server用户日常需要重点关注的监控项之一。如果实例的存储空间完全打满,将会导致严重的影响,包括:数据库无法写入、数据库备份无法正常完成、存储空间扩容任务的执行耗时可能更长等。
【巡检问题分析与最佳实践】RDS SQL Server 空间使用问题
|
SQL 存储 缓存
【巡检问题分析与最佳实践】RDS SQL Server CPU高问题
CPU使用率过高问题是RDS SQL Server用户遇到的性能问题中较常见的一类。当RDS SQL Server实例的CPU使用率持续较高时,很容易导致数据库访问卡慢的情况,例如一些很简单的查询请求的响应时间也会很久甚至超时失败。
【巡检问题分析与最佳实践】RDS SQL Server CPU高问题
|
SQL 缓存 弹性计算
【巡检问题分析与最佳实践】RDS SQL Server 磁盘IO吞吐高问题
实例的磁盘IO负载是RDS SQL Server用户日常应重点关注的监控项之一,如果磁盘IO压力过大,很容易导致数据库性能问题。
【巡检问题分析与最佳实践】RDS SQL Server 磁盘IO吞吐高问题
|
SQL 监控 关系型数据库
【巡检问题分析与最佳实践】RDS PostgreSQL CPU高问题
当RDS PostgreSQL实例的CPU使用率持续较高时,很容易导致数据库访问卡慢的情况,例如一些很简单的查询请求的响应时间也会很久甚至超时失败。
下一篇
无影云桌面