问题排查:线上MySQL启动报错:Job for mysqld.service failed because the control process exite

本文涉及的产品
RDSClaw,2核4GB
RDS MySQL DuckDB 分析主实例,基础系列 4核8GB
RDS MySQL DuckDB 分析主实例,集群系列 4核8GB
简介: 问题排查:线上MySQL启动报错:Job for mysqld.service failed because the control process exite

背景


操作系统:CentOS 7


突然,用户反映线上页面刷不出数据了,排查了ElasticSearch以及对应的后端服务之后,可能的原因只有数据库了。。


首先看了下数据库状态:

image.png

数据库挂了!!正常情况下service mysqld status返回应该是:

image.png

接着尝试重启MySQL,service mysqld start,数据库服务启动报错:


Job for mysqld.service failed because the control process exited with error code. See "systemctl status mysqld.service" and "journalctl -xe" for details.


word天,数据库服务起不来了。。


解决思路


显然,报错提示查看MySQL的日志,进行问题排查,但是仔细一想,近期并未做过线上环境、DB、配置的更新,也就是说服务本身正常运行,是突然不能正常工作了。。可能的原因:


  • 服务所处的环境发生了变化,eg:资源不足:CPU算力、内存、磁盘空间不足;


  • 服务器遭受攻击了,这种可能性比较小。


另外,由于当前机器上除了数据库服务之外还有其他的业务服务,所以先排查CPU、内存以及磁盘空间。


  1. 查看进程:top -c
  2. 查看磁盘:df -h


问题排查


  1. 查看进程:top -c


一切正常:CPU、内存均处于正常状态;


  1. 查看磁盘:df -h

image.png

问题暴露了:dev/vda1的磁盘空间100%了。。


问题解决


  • 先要排查是哪些文件堆满了磁盘,极大的可能是由于日志文件持续累积导致的,查看软件目录的大小信息du -sh *


  • 经过逐步排查,发现是nginx的日志文件,尤其是access.log,达到了2.4G。。这个文件是nginx自带的访问记录日志,先直接清空该文件,释放空间,保证线上服务正常:cp /dev/null access.log


  • 再次查看磁盘空间使用情况:df -h,发现恢复了部分可用空间

image.png

  • 启动MySQL服务,service mysqld start

Done~


事故总结


  • 几条常用的Linux命令,帮助解决了问题:
service mysqld status
service mysqld start
top -c # 查看进程情况:CPU、内存、pid等
df -h # 查看磁盘空间信息,-h表示以KB, MB, GB, TB格式进行人性化显示
du -sh * | sort -hr # 查看文件夹、文件大小,-s表示汇总,-h表示以KB, MB, GB, TB格式进行人性化显示,-r 逆序
cp /dev/null access.log # 不删除,清空文件


  • 事后查看了MySQL的日志,确认了是磁盘空间不足导致无法写入的问题;


image.png

  • 数据库服务使用单独的服务器进行独立部署,或者至少应将数据库的数据存储至数据盘而不是直接放到系统盘;


  • 这次出事故幸亏是白天,能够及时解决,然而暴露出的问题是当前缺乏一套有效的监控系统,无法对服务器的负载情况(CPU、内存、磁盘、IO等)进行实时的监测,并及时预警。。


相关实践学习
自建数据库迁移到云数据库
本场景将引导您将网站的自建数据库平滑迁移至云数据库RDS。通过使用RDS,您可以获得稳定、可靠和安全的企业级数据库服务,可以更加专注于发展核心业务,无需过多担心数据库的管理和维护。
MySQL数据库入门学习
本课程通过最流行的开源数据库MySQL带你了解数据库的世界。   相关的阿里云产品:云数据库RDS MySQL 版 阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务,提供容灾、备份、恢复、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼。 了解产品详情: https://www.aliyun.com/product/rds/mysql 
目录
相关文章
|
10月前
|
关系型数据库 MySQL 数据库
MySQL报错:未知系统变量'tx_isolation'及隔离级别查询
记住,选择合适的隔离级别,就像是在风平浪静的湖面上找到适合的划船速度——既要快到能赶上午饭(性能),又不至于翻船(数据一致性问题)。
397 3
|
安全 关系型数据库 MySQL
【YashanDB知识库】YMP从mysql迁移到崖山,报错:服务器错误
【YashanDB知识库】YMP从mysql迁移到崖山,报错:服务器错误
|
SQL Oracle 关系型数据库
【YashanDB知识库】MySQL和YashanDB 隐式转换不一致引起的报错
本文分析了在YashanDB中执行特定SQL语句时出现的类型转换错误问题,并对比了YashanDB、Oracle和MySQL 5.7的行为差异。问题源于隐式类型转换,当数值字段与非法数字字符串(如'1,2')进行比较时,YashanDB和Oracle会报错,而MySQL 5.7虽不报错但会引发警告。通过调整SQL语句,避免数值与字符串直接比较,可有效解决问题。文章还详细解析了不同值表现不一致的原因,涉及执行计划和过滤条件的实际运行细节。
|
安全 关系型数据库 MySQL
【YashanDB知识库】YMP从mysql迁移到崖山,报错:服务器错误
【YashanDB知识库】YMP从mysql迁移到崖山,报错:服务器错误
【YashanDB知识库】YMP从mysql迁移到崖山,报错:服务器错误
|
SQL Oracle 关系型数据库
【YashanDB 知识库】MySQL 和 YashanDB 隐式转换不一致引起的报错
【YashanDB 知识库】MySQL 和 YashanDB 隐式转换不一致引起的报错
|
7月前
|
缓存 关系型数据库 BI
使用MYSQL Report分析数据库性能(下)
使用MYSQL Report分析数据库性能
491 158
|
7月前
|
关系型数据库 MySQL 数据库
自建数据库如何迁移至RDS MySQL实例
数据库迁移是一项复杂且耗时的工程,需考虑数据安全、完整性及业务中断影响。使用阿里云数据传输服务DTS,可快速、平滑完成迁移任务,将应用停机时间降至分钟级。您还可通过全量备份自建数据库并恢复至RDS MySQL实例,实现间接迁移上云。
|
7月前
|
关系型数据库 MySQL 数据库
阿里云数据库RDS费用价格:MySQL、SQL Server、PostgreSQL和MariaDB引擎收费标准
阿里云RDS数据库支持MySQL、SQL Server、PostgreSQL、MariaDB,多种引擎优惠上线!MySQL倚天版88元/年,SQL Server 2核4G仅299元/年,PostgreSQL 227元/年起。高可用、可弹性伸缩,安全稳定。详情见官网活动页。
1228 152
|
7月前
|
关系型数据库 MySQL 数据库
阿里云数据库RDS支持MySQL、SQL Server、PostgreSQL和MariaDB引擎
阿里云数据库RDS支持MySQL、SQL Server、PostgreSQL和MariaDB引擎,提供高性价比、稳定安全的云数据库服务,适用于多种行业与业务场景。
914 156
|
7月前
|
缓存 监控 关系型数据库
使用MYSQL Report分析数据库性能(中)
使用MYSQL Report分析数据库性能
513 156

推荐镜像

更多