【MySQL】搜集慢sql分析工具

本文涉及的产品
云数据库 RDS MySQL Serverless,0.5-2RCU 50GB
简介: 基于slowquery.log分析并提供sql脱敏聚合能力


浅谈慢SQL


相信每个做业务的程序员都会受到过慢sql的困扰,开发新功能的时候库里总共没几条数据,毫秒级查询笑嘻嘻,上线之后各种页面loading卡顿。。。



通常每个公司都应该有对应的搜集分析慢sql的工具,尤其是做saas服务的要实时监控慢sql及时推送预警并改正。不过并不是每家公司都会有。毕竟现在大部分公司的首要功能是活下去。


image.png


不是以saas产品为主线的公司都让寒气吹傻了,疯狂迭代需求还来不及,谁还管这些不痛不痒的小工具(不要误会,我在自我介绍)。


就拿我们公司来说,很早期从saas转型成私有化,一直缺这么个小工具。直到有一天saas个人版出现了卡顿情况,组长最后从阿里云mysql监控平台上琳琅满目的慢sql图表里得出结论,罪魁祸首是几条慢sql导致的。



于是做了个决定一定要搞一个工具,低配版的也行,起码要有抽象sql聚合的能力(**脱敏处理,sql的参数替换成问号可以类比orm中正向操作是在执行sql前用参数替换掉问号,反向就是把要执行的sql参数再替换成问号**)


效果如下`:


image.png

实现思路


搭建慢SQL分析工具首先要有数据源,得想办法拦截sql并分析它,摆在面前的总共两个大方向,服务层拦截数据库层拦截


服务层拦截


  • 如果是Java服务的化比较好处理,毕竟可以从orm框架上做一些文章,搞一些intercepter拦截sql分析。
  • 问题是我们的服务经过漫长的迭代并不是只有Java语言,还有一些老旧的Python服务怎么处理,Python的服务都是自己封装的一些公用curd方法,并没有用开源框架,必然需要手动处理,工作量暴增。


数据库层拦截


mysql自带了慢日志查询,可以打开慢查询设置,分析mysql打出来的慢sql日志

showvariableslike'%query%'


image.png



所有符合查询耗时条件的sql都会被收集到指定的路径下,不断追加写入到slow-query.log文件中。如此一来监听这个slow-query.log就可以了。日志格式如下:


/opt/bitnami/mysql/bin/mysqld, Version: 5.7.26-log (MySQLCommunityServer (GPL)). startedwith:\Tcpport: 3306Unixsocket: /opt/bitnami/mysql/tmp/mysql.sock\TimeIdCommandArgument\\#Time: 2021-06-26T00:00:05.250595+08:00\#User@Host: calarm[calarm] @  [10.244.0.176]  Id: 405911\#Query_time: 4.977888Lock_time: 0.000123Rows_sent: 1Rows_examined: 15973877\usecalarm;\SETtimestamp=1624636805;\selectcount(1) FROMmsg_infowheretrigger_time<date_add(DATE_FORMAT(CURDATE(),'%Y-%m-%d %H:%i:%s'), interval-1DAY);\#Time: 2021-06-26T00:00:08.236660+08:00\#User@Host: calarm[calarm] @  [10.244.0.176]  Id: 405815\#Query_time: 2.170010Lock_time: 0.000138Rows_sent: 0Rows_examined: 100000\SETtimestamp=1624636808;\deleteFROMmsg_infowheretrigger_time<date_add(DATE_FORMAT(CURDATE(),'%Y-%m-%d %H:%i:%s'), interval-1DAY) limit100000;

落地方案


首先这个需求按理说应该非常常见才是,于是乎花了将近一下午游走在各大代码平台,github、gitee、google、stackoverflow去找现成的方案。找来找去就两个比较靠谱。



PHP称霸武林


源代码地址:https://github.com/hcymysql/slowquery


这个工具核心还是Percona pt-query-digest的一个分析SQL的工具结合一些php实现的图形化界面实现的,效果应该算是最好的


image.png



image.png


image.png


各方各面都挺好,唯独没用脱敏SQL功能,而且部署起来是真滴费死劲了,一来php系统从来没接触过,搜了搜发现部署php还要搞一套专属运行环境,实验的时候搞了个php-nginx的容器疯狂操作也没操作明白。就暂时当作一个备选方案吧,实在没有办法再来用这个。


GO吗? GO!


源代码地址:https://github.com/qieangel2013/SqlReview



image.png


虽然没有华丽的图表,但是就脱敏sql而言,看起来非常吻合我们的需求,但是开源出来的源代码相当臃肿的,甚至有一些kafka的推送功能、格式化后的数据会持久化到数据库、提供了打分功能。


本来就不会Golang,根本跑不起来服务,看的我晕头转向的,之前倒是想学一手golang来着,后来也没能坚持下来,所以决定正好可以借此机会过一遍。把里面重要的功能摘出来。



最终实现


这个需求最重要就是根据脱敏后的抽象sql聚合,图形化界面之类的都好说,于是决定用gin框架打一个小服务,通过一点一点的拆解,拿到了核心抽象sql的方法`fingerprint.go`这个文件。


用文件流一行一行的读取慢sql,通过方法转成抽象sql,统计各项指标,画一个前端页面就能实现比较简单版的功能了,抽象sql和真实sql做一层下转。


自从大学毕业之后已经很久很久没碰前端代码了。打开layui官网发现竟然已经停止运营了!

image.png



泪目了,这么经典的前端组件库。最后用layui画了个简单页面。


代码仓库: https://github.com/SplitfireUptown/azeroth.git


image.png

image.png


是不是还可以,虽然界面很丑陋,但是五脏俱全,后续有时间需要再完善一下。。。提供下折线图、筛选日期(现在是分析整个文件)、优化分析速度之类的。总之做一个好用的工具还是很不容易的。





相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
24天前
|
SQL 关系型数据库 MySQL
mysql一条sql查询出多个统计结果
mysql一条sql查询出多个统计结果
14 0
|
2天前
|
SQL 关系型数据库 MySQL
:“You have an error in your SQL syntax; check the manual that corresponds to your MySQL server versi
:“You have an error in your SQL syntax; check the manual that corresponds to your MySQL server versi
10 0
|
11天前
|
SQL 关系型数据库 数据库
【后端面经】【数据库与MySQL】SQL优化:如何发现SQL中的问题?
【4月更文挑战第12天】数据库优化涉及硬件升级、操作系统调整、服务器/引擎优化和SQL优化。SQL优化目标是减少磁盘IO和内存/CPU消耗。`EXPLAIN`命令用于检查SQL执行计划,关注`type`、`possible_keys`、`key`、`rows`和`filtered`字段。设计索引时考虑外键、频繁出现在`where`、`order by`和关联查询中的列,以及区分度高的列。大数据表改结构需谨慎,可能需要停机、低峰期变更或新建表。面试中应准备SQL优化案例,如覆盖索引、优化`order by`、`count`和索引提示。优化分页查询时避免大偏移量,可利用上一批的最大ID进行限制。
38 3
|
17天前
|
SQL 存储 关系型数据库
【MySQL实战笔记】02.一条SQL更新语句是如何执行的-2
【4月更文挑战第5天】两阶段提交是为确保`redo log`和`binlog`逻辑一致,避免数据不一致。若先写`redo log`, crash后数据可能丢失,导致恢复后状态错误;若先写`binlog`,crash则可能导致重复事务,影响数据库一致性。一天一备相较于一周一备,能缩短“最长恢复时间”,但需权衡额外的存储成本。
16 1
|
24天前
|
SQL 关系型数据库 MySQL
【MySQL】慢SQL分析流程
【4月更文挑战第1天】【MySQL】慢SQL分析流程
|
27天前
|
SQL 关系型数据库 MySQL
【MySQL技术之旅】(7)总结和盘点优化方案系列之常用SQL的优化
【MySQL技术之旅】(7)总结和盘点优化方案系列之常用SQL的优化
42 1
|
2天前
|
SQL 存储 关系型数据库
MySQL Cluster集群安装及使用
MySQL Cluster集群安装及使用
|
17天前
|
关系型数据库 MySQL 数据库
mysql卸载、下载、安装(window版本)
mysql卸载、下载、安装(window版本)
|
1月前
|
关系型数据库 MySQL 数据库
rds安装数据库客户端工具
安装阿里云RDS的数据库客户端涉及在本地安装对应类型(如MySQL、PostgreSQL)的客户端工具。对于MySQL,可选择MySQL Command-Line Client或图形化工具如Navicat,安装后输入RDS实例的连接参数进行连接。对于PostgreSQL,可以使用`psql`命令行工具或图形化客户端如PgAdmin。首先从阿里云控制台获取连接信息,然后按照官方文档安装客户端,最后配置客户端连接以确保遵循安全指引。
86 1
|
6天前
|
关系型数据库 MySQL 数据库
《MySQL 简易速速上手小册》第1章:MySQL 基础和安装(2024 最新版)
《MySQL 简易速速上手小册》第1章:MySQL 基础和安装(2024 最新版)
28 4