云MSP服务案例丨高压高并发环境下的数据库运维解决方案

简介: 近年来,随着电商产业的不断发展,越来越多的传统企业加入电商战场,根据《中国电子商务行业市场前瞻与投资战略规划分析报告》,预测2019年全国电子商务交易规模将达37.75万亿元。未来五年(2019-2023)年均复合增长率约为11.52%,并预测在2023年全国电子商务交易规模将达到58.38万亿元。

近年来,随着电商产业的不断发展,越来越多的传统企业加入电商战场,根据《中国电子商务行业市场前瞻与投资战略规划分析报告》,预测2019年全国电子商务交易规模将达37.75万亿元。未来五年(2019-2023)年均复合增长率约为11.52%,并预测在2023年全国电子商务交易规模将达到58.38万亿元。

IMG_2193

每个节假日都成为各大电商平台、社群网站、分享社区进行引流、大促、活动的战场,保障每一次高压高并发环境下业务能够稳定运行,是这类电商网站和信息流网站的强需求。

01、客户背景

某款查询化妆品成分的手机APP企业,主打“化妆品成分表查询”帮助更多消费者理智挑选适合自己的护肤品。作为一个工具型APP,该公司更加关注于产品成分的安全性,所以在“3.15”消费者权益日准备了一系列的化妆品安全活动,让更多消费者理性看待化妆品,通过科学的化妆品成分分析,合理规避风险。

因该APP目前在App Store健康排行榜第一位,流量较大,为了更好的完成此次活动,该APP希望有专注于企业大促运维的团队协助完成整个高压高并发环境下的活动维稳护航。

云掣科技是一家专注于企业云托管(MSP)服务的公司,现拥有多年淘宝双十一大促维稳实践,服务了方太厨卫、阿吉豆、老板电器等电商企业。本次将会在活动期间保障该客户业务的稳定运行,使得CPU占比较之前下降64%。

02、项目方案

在315活动前,该企业的数据库实例突然出现一次夯机,影响业务正常运行,在排查了故障后,客户预想到“3.15”流量上涨可能会再次出现业务无法访问的情况,遂寻求云掣科技数据库团队的协助。

_

大促护航专项服务方案图

云掣数据库团队根据该企业的现状进行大促护航专项服务方案制定,预设活动环境下数据量情况,对性能进行评估检测。

由于时间紧急,业务方没有时间来做压测,当前数据库可承受最大压力上限无法得知。所以数据库团队使用日志信息寻找数据库中出现的慢SQL,通过日志数据分析与开发同学进行沟通优化,完成了整个活动前期的准备。

03、客户收益

云掣科技数据库团队帮助该企业完成了以下目标:

1、评估当前数据库资源使用情况以及活动预计流量后,建议业务方对实例进行升配

2、现场支持期间对数据库存在的慢SQL进行优化

3_11_3_12cpu
优化前

3_14_3_15cpu
优化后

活动优化前后CPU占比图,较优化前下降了64%

_3
图为活动前cpu状态
活动前该企业的CPU被打满,严重影响业务使用。云掣科技数据库团队帮助该企业进行了深度的检索分析,从数据库入手,发现数据库查询队列与活跃会话堆积严重。针对数据库情况进行紧急排查故障原因,故障处理,并且针对此次情况对MongoDB、MySQL、Redis进行升配,并对数据库中存在的慢SQL进行优化。
在整个活动期间,数据库整体运行正常,各负载均处于低水位,未因运维原因导致服务中断。

后记:

云掣数据库团队会继续为用户提供云上数据库的运维服务,帮助客户从繁杂的数据库运维中解脱出来,专注于企业核心业务发展。

数据库是企业的核心,企业的身家性命都存在一个个的数据库中,云掣科技希望可以通过数据库的能力,帮助更多企业在云时代管理好数据库,让业务稳定运行。

目录
相关文章
|
17天前
|
消息中间件 运维 Kafka
运维排查 | Systemd 之服务停止后状态为 failed
运维排查 | Systemd 之服务停止后状态为 failed
|
7天前
|
SQL 存储 数据挖掘
数据库数据恢复—RAID5上层Sql Server数据库数据恢复案例
服务器数据恢复环境: 一台安装windows server操作系统的服务器。一组由8块硬盘组建的RAID5,划分LUN供这台服务器使用。 在windows服务器内装有SqlServer数据库。存储空间LUN划分了两个逻辑分区。 服务器故障&初检: 由于未知原因,Sql Server数据库文件丢失,丢失数据涉及到3个库,表的数量有3000左右。数据库文件丢失原因还没有查清楚,也不能确定数据存储位置。 数据库文件丢失后服务器仍处于开机状态,所幸没有大量数据写入。 将raid5中所有磁盘编号后取出,经过硬件工程师检测,没有发现明显的硬件故障。以只读方式将所有磁盘进行扇区级的全盘镜像,镜像完成后将所
数据库数据恢复—RAID5上层Sql Server数据库数据恢复案例
|
21天前
|
运维 Kubernetes 监控
构建高效稳定的容器化运维环境
在现代IT基础设施中,容器技术以其轻量级、快速部署和易于管理的特性成为企业数字化转型的重要支撑。本文将深入探讨如何构建一个高效且稳定的容器化运维环境,涵盖从容器选择、集群管理到持续集成与持续部署(CI/CD)的最佳实践。文章旨在为运维工程师提供一套系统的解决方案,以应对日益复杂的业务需求和技术挑战。
|
26天前
|
人工智能 运维 监控
自动化运维在云计算环境下的应用与挑战
随着云计算技术的不断发展,自动化运维在云环境中扮演着越来越重要的角色。本文将探讨自动化运维在云计算环境下的应用和所面临的挑战,并分析其对企业运维工作的影响,以及未来的发展趋势。
21 8
|
29天前
|
运维 负载均衡 监控
提升运维效率:自动化工具在云端环境中的应用
随着云计算技术的快速发展,运维工作面临着更加复杂和繁重的挑战。本文将探讨如何利用自动化工具在云端环境中提升运维效率,从而降低成本、减少人为错误,并实现更高水平的运维管理。
|
1月前
|
Oracle 关系型数据库 数据库
Oracle数据恢复—Oracle数据库误truncate table的数据恢复案例
北京某国企客户Oracle 11g R2数据库误truncate table CM_CHECK_ITEM_HIS,表数据丢失,业务查询到该表时报错,数据库的备份不可用,无法查询表数据。 Oracle数据库执行Truncate命令的原理:在执行Truncate命令后ORACLE会在数据字典和Segment Header中更新表的Data Object ID,但不会修改实际数据部分的块。由于数据字典与段头的DATA_OBJECT_ID与后续的数据块中的并不一致,所以ORACLE服务进程在读取全表数据时不会读取到已经被TRUNCATE的记录,但是实际数据未被覆盖。
Oracle数据恢复—Oracle数据库误truncate table的数据恢复案例
|
1月前
|
运维 应用服务中间件 调度
|
1月前
|
网络协议 关系型数据库 MySQL
安卓手机termux上安装MariaDB数据库并实现公网环境下的远程连接
安卓手机termux上安装MariaDB数据库并实现公网环境下的远程连接
|
2月前
|
关系型数据库 MySQL Linux
Linux环境下定时备份mysql数据库
Linux环境下定时备份mysql数据库
|
2月前
|
数据库 对象存储 数据安全/隐私保护
在oceanbase数据库中,有没有遇到备份到oss环境,备份进度到98%就一直卡着的问题?
在oceanbase数据库中,有没有遇到备份到oss环境,备份进度到98%就一直卡着的问题?
27 6