开发者社区> 牧原> 正文

记一次mysql客户端执行sql后hung住

简介: 背景: 客户反馈,执行sql后无返回,同时抓包没有抓到对应的sql发起访问(实际复现的时候抓到了报文),以及mysql客户端加不加-A 速度不一(不加 -A 要在本地创建一个库表缓存,加了就不创建这个),实际分析下来并没有很难,本文主要为了分享一下该类问题分析的小技巧 1,需要循环执行sql,.
+关注继续查看
 近期遇到一个新的case,执行sql后无返回,同时抓包没有抓到对应的sql发起访问(实际复现的时候抓到了报文)
,以及mysql客户端加不加-A 速度不一(不加 -A 要在本地创建一个库表缓存,加了就不创建这个),
实际分析下来并没有很难,本文主要为了分享一下该类问题分析的小技巧

1,需要循环执行sql,写个循环配置免密登陆,,如下所示的配置后,就可以直接 mysql -A 登陆成功了

[root@Ad****s-143 ~]# cat .my.cnf
[client]
host=rm-t********e3eo.mysql.si****re.rds.aliyuncs.com
user='p***b'
password='vk7m*****x%ta'
[root@Ad****s-143 ~]# mysql -A
Welcome to the MySQL monitor.  Commands end with ; or \g.
Your MySQL connection id is 12571135
Server version: 5.6.16-log Source distribution
Copyright (c) 2000, 2013, Oracle and/or its affiliates. All rights reserved.
Oracle is a registered trademark of Oracle Corporation and/or its
affiliates. Other names may be trademarks of their respective
owners.
Type 'help;' or '\h' for help. Type '\c' to clear the current input statement.
mysql>

2, 配置循环sql,并抓包(构造一个特殊的sql,并追踪mysql命令行的执行过程)

抓包用这个sql就足够了
# for i in {1..100};do echo $i;mysql -A -e "select guid, name, 0 from pa.industry limit $i ;";sleep 1s;done
循环一百次           输出本伦次序号   mysql指向sql,同时limit指定为前面的i变量,便于提取sql           间隔1秒
strace跟踪的话用这个
# for i in {1..100};do echo $i;strace -F -ff -t -tt -s 4096 -o m.out mysql -A -e "select guid, name, 0 from pa.industry limit $i ;";sleep 1s;done

3, 复现问题,并分析
输出效果

[root@Ad*****s-143 ~]# for i in {1..100};do echo $i;mysql -A -e "select guid, name, 0 from pa.industry limit $i ;";sleep 1s;done
1
+--------------------------------------+------+---+
| guid                                 | name | 0 |
+--------------------------------------+------+---+
| 965EADB8-C88E-83B2-325C-0DD04D5612DA | ???? | 0 |
+--------------------------------------+------+---+
2
+--------------------------------------+------+---+
| guid                                 | name | 0 |
+--------------------------------------+------+---+
| 965EADB8-C88E-83B2-325C-0DD04D5612DA | ???? | 0 |
| 0DFECEC8-9348-75F1-5B7C-2EE050FB0186 | ???? | 0 |
+--------------------------------------+------+---+
......中间省略一万字
29
+--------------------------------------+---------+---+
| guid                                 | name    | 0 |
+--------------------------------------+---------+---+
| 965EADB8-C88E-83B2-325C-0DD04D5612DA | ????    | 0 |
| 0DFECEC8-9348-75F1-5B7C-2EE050FB0186 | ????    | 0 |
| 4184E44C-E829-E3F3-5D75-1B488B3953A6 | ??      | 0 |
| 7FB961D6-EE07-2E67-447B-E1DDB2C2A2E0 | ??      | 0 |
| F7D1588D-9961-E01E-4C3E-228752504C0C | ????    | 0 |
| 07AD88F0-4546-10B1-040F-89C1773E2C52 | ??      | 0 |
| 451DB2F6-170B-7BEC-5DF9-2C3643204CA8 | ??      | 0 |
| FC67E100-F77B-165A-3202-23DF76BB1120 | ??      | 0 |
| 4C5AEA5F-AD45-E04B-59A8-22AC3CC6BDF9 | ????    | 0 |
| BB3EF523-762E-D38A-7ACC-CBAEA027A2E2 | ????    | 0 |
| 0C331B61-A650-4178-9153-2FAD8402492B | ????    | 0 |
| A85AD107-8A6D-22DD-4854-86DB0AD5A0E1 | ????    | 0 |
| 758D3D24-8725-8FD2-21DC-E58CE7F790B0 | ????    | 0 |
| 1D0DE78E-DE69-8DEA-187F-80762F918CAF | ??????  | 0 |
| 86820362-D8FB-BF3E-D1AE-BEA9F22DF131 | ????    | 0 |
| 4561EF83-C1F9-3EC3-EB5B-B829D8E1B652 | ????    | 0 |
| F552AF90-792C-39CC-E201-CD97C9681A38 | ????    | 0 |
| A8B0CEDA-5B2B-A231-4414-5EA41E37B680 | ????    | 0 |
| AA5E6908-9DF6-17CD-EEB8-4EB877A65F80 | ????    | 0 |
| 220B5BDD-019B-B13D-4518-259A9BF33A84 | ????    | 0 |
| 00F55DEA-15D1-BFC0-EF96-8FA57464A036 | ?????   | 0 |
| 9877703F-B2C1-E5BE-2A85-CF76CE944FC8 | ????    | 0 |
| BCB3CB52-37FB-2F99-C330-FBDC4C7E5949 | ????    | 0 |
| 5CF8E33B-0936-C2C4-0763-3880943D1461 | ????    | 0 |
| AF5941E7-56D5-4D56-B24D-8DA026A76B49 | ????    | 0 |
| E204689F-A318-E53E-FDF2-7FB942CA4D80 | ????    | 0 |
| BAB81C78-BC1C-33F5-81A5-CE9811F4F4E6 | ??????? | 0 |
| 6BD47A46-0CDE-5B95-1701-560BF2A8BBB7 | ????    | 0 |
| C098145A-F21B-033B-52D6-35A4BD7C83A4 | ????    | 0 |
+--------------------------------------+---------+---+
30 
^CCtrl-C -- sending "KILL QUERY 12569784" to server ...
Ctrl-C -- query aborted.
^CCtrl-C -- sending "KILL 12569784" to server ...
Ctrl-C -- query aborted.
^CCtrl-C -- exit!

4,strace 看到的结果,可以看出来发出的sql是 limit 33(多次复现保留的现场不一,不用纠结序号对不对得上的问题)
image

5,查看wireshark结果,客户端发出query的sql 已经被server端确认了,但是没有给返回response的结果
不正常返回的截图
image

正常返回的截图
image

6,登陆mysql查看processlist发现新问题,server把query给ack(确认)后,客户端没有收到response,但是server记录的是sleep,说明server返回了response并进入sleep状态,server端认为客户端没有结束连接,说明response丢在了中间链路上

mysql的会话
mysql> select * from INFORMATION_SCHEMA.PROCESSLIST where HOST like '101.*.*.143%';
+----------+--------+-----------------------+------+---------+------+-----------+---------------------------------------------------------------------------------+
| ID       | USER   | HOST                  | DB   | COMMAND | TIME | STATE     | INFO                                                                            |
+----------+--------+-----------------------+------+---------+------+-----------+---------------------------------------------------------------------------------+
| 12569201 | pa_web | 101.*.*.143:41580 | NULL | Sleep   |  734 |           | NULL                                                                            |
这一条这一条
| 12569784 | pa_web | 101.*.*.143:53000 | NULL | Sleep   |  161 |           | NULL  

ecs的tcp连接
image

7,客户端在国内,rds在新加坡,怀疑是跨境走的国际链路中间某一跳路由有问题导致报文被丢弃,建议跨境链路可以考虑使用高速通道打通内网调用

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
QGS
(linux-x86-ARM)麒麟V10安装DBeaver21.3通用的数据库管理工具和 SQL 客户端
记(linux-x86-ARM)麒麟V10安装DBeaver21.3通用的数据库管理工具和 SQL 客户端
41 0
Flink SQL 客户端查询Hive配置及问题解决
Flink SQL 客户端查询Hive配置及问题解决
158 0
PL/SQL 工具远程连接Oracle数据库方法,plsql免安装oracle客户端直接配置oci实战演示
PL/SQL 工具远程连接Oracle数据库方法,plsql免安装oracle客户端直接配置oci实战演示
193 0
Oracle 查看数据库字符集和客户端字符集 SQL 语句
Oracle 数据库分为数据库字符集和客户端字符集两种!
74 0
20180427通过SQL_ID查出执行该SQL客户端IP
[20180427]通过SQL_ID查出执行该SQL的客户端IP.txt --//论坛上链接http://www.itpub.net/thread-2101733-1-1.
1283 0
javascript + sql编写SQL客户端工具tabris
祝大家2018新年快乐, 前不久发现了一个创意的脚本JtSQL(java编写) 开源地址为:https://github.com/noear/JtSQL JtSQL 特点:*.结合了JS、SQL、模板理念;*.
943 0
【MS SQL】通过执行计划来分析SQL性能
原文:【MS SQL】通过执行计划来分析SQL性能 如何知道一句SQL语句的执行效率呢,只知道下面3种: 1、通过SQL语句执行时磁盘的活动量(IO)信息来分析:SET STATISTICS IO ON (开启) / SET STATISTICS IO OFF (关闭) 2、通过SQL语句执行时...
821 0
+关注
牧原
努力减肥中~
文章
问答
来源圈子
更多
作为全球云计算的领先者,阿里云为全球230万企业提供着云计算服务,服务范围覆盖200多个国家和地区。我们致力于为企业、政府等组织机构提供安全可靠的云计算服务,给用户带来极速愉悦的服务体验。
+ 订阅
相关文档: 迁云实施服务
文章排行榜
最热
最新
相关电子书
更多
用SQL做数据分析
立即下载
阿里云流计算 Flink SQL 核心功能解密
立即下载
Comparison of Spark SQL with Hive
立即下载