MySQLTransactionRollbackException问题排查

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS PostgreSQL,集群系列 2核4GB
简介: MySQLTransactionRollbackException: Lock wait timeout exceeded; try restarting transactionMySQL error 1129

这两天业务系统出了一点问题,本来系统运行正常的,但是近三天系统访问很慢,但是系统没有太多消耗资源的业务,也没有很大的并发量,感觉很奇怪,于是开启了排查之路。

首先看了一下应用日志,发现报了大量的MySQLTransactionRollbackException: Lock wait timeout exceeded; try restarting transaction异常,大多数是有个推送接收数据的接口在做数据更新插入的时候报的,于是就开始去排查数据库问题,数据库使用客户端工具连接,发现连接还不慢,说明网络没问题。但是随便执行一张小用户量的表查询的时候发现输出结果非常慢,包括报错的业务接口操作的表。从这个英文的异常描述就是“事务回滚异常,锁等待超时超过了,尝试重启事务”,作为开发人员感觉很不知所措,难道锁表了?dba查看也没有锁表。大概过了几分钟的排查时间,数据库突然变快了。想想感觉好了吧,于是还是怀疑网络问题,ping了一会发现速度还可以,没啥抖动,但是业务系统过了一会又变慢。

再次详细的看应用服务日志,发现还报了MySQL error 1129,有具体错误码了,这个时候感觉是数据库出问题了,于是dba用hdparm做了磁盘检测,发现i/o速度很慢。观察了一段时间发现这个磁盘i/o的速度时快时慢,很不稳定。所以初步估计上述的两个异常都是因为数据库磁盘读写速度慢引起的,系统也是间歇性的快和慢。

最后联系虚拟化厂家做磁盘更换,至此系统暂时恢复正常。


相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
5月前
|
SQL
线上问题排查日志实战
线上问题排查日志实战
40 1
|
JavaScript
开发遇到的问题排查
开发遇到的问题排查
|
5月前
日志 问题排查
日志 问题排查
35 1
|
监控 网络协议 前端开发
502问题怎么排查?
502问题怎么排查?
166 0
|
运维 PHP Perl
总结一些线上问题排查的命令,可能用得到!
开发运维,统计所遇到的运维问提。运维问提排查,以下场景,你可能遇到?
165 0
总结一些线上问题排查的命令,可能用得到!
|
Web App开发 安全 前端开发
前端SameSiteCookie问题排查分享
近期排查客户上报的问题时,遇到了一个比较费解的问题,在这边梳理一下排查的流程、遇到的难点、找到的一些相关资料,来对整一个问题进行一个总结,也借此机会做一个分享SameSiteCookie相关的疑难问题处理
376 0
前端SameSiteCookie问题排查分享
|
SQL 缓存 自然语言处理
常见问题排查方法|学习笔记(一)
快速学习常见问题排查方法
134 0
常见问题排查方法|学习笔记(一)
|
运维 监控 Serverless
部署失败问题排查|学习笔记
快速学习部署失败问题排查
226 0
部署失败问题排查|学习笔记
|
Kubernetes Docker 容器
问题排查
问题排查
98 0
|
SQL 缓存 监控
聊聊什么是慢查、如何监控?如何排查?
今天我要跟你分享的话题是:“聊聊什么是慢查、如何监控?如何排查?”
282 0