云MSP服务案例丨高压高并发环境下的数据库运维解决方案

简介: 近年来,随着电商产业的不断发展,越来越多的传统企业加入电商战场,根据《中国电子商务行业市场前瞻与投资战略规划分析报告》,预测2019年全国电子商务交易规模将达37.75万亿元。未来五年(2019-2023)年均复合增长率约为11.52%,并预测在2023年全国电子商务交易规模将达到58.38万亿元。

近年来,随着电商产业的不断发展,越来越多的传统企业加入电商战场,根据《中国电子商务行业市场前瞻与投资战略规划分析报告》,预测2019年全国电子商务交易规模将达37.75万亿元。未来五年(2019-2023)年均复合增长率约为11.52%,并预测在2023年全国电子商务交易规模将达到58.38万亿元。

IMG_2193

每个节假日都成为各大电商平台、社群网站、分享社区进行引流、大促、活动的战场,保障每一次高压高并发环境下业务能够稳定运行,是这类电商网站和信息流网站的强需求。

01、客户背景

某款查询化妆品成分的手机APP企业,主打“化妆品成分表查询”帮助更多消费者理智挑选适合自己的护肤品。作为一个工具型APP,该公司更加关注于产品成分的安全性,所以在“3.15”消费者权益日准备了一系列的化妆品安全活动,让更多消费者理性看待化妆品,通过科学的化妆品成分分析,合理规避风险。

因该APP目前在App Store健康排行榜第一位,流量较大,为了更好的完成此次活动,该APP希望有专注于企业大促运维的团队协助完成整个高压高并发环境下的活动维稳护航。

云掣科技是一家专注于企业云托管(MSP)服务的公司,现拥有多年淘宝双十一大促维稳实践,服务了方太厨卫、阿吉豆、老板电器等电商企业。本次将会在活动期间保障该客户业务的稳定运行,使得CPU占比较之前下降64%。

02、项目方案

在315活动前,该企业的数据库实例突然出现一次夯机,影响业务正常运行,在排查了故障后,客户预想到“3.15”流量上涨可能会再次出现业务无法访问的情况,遂寻求云掣科技数据库团队的协助。

_

大促护航专项服务方案图

云掣数据库团队根据该企业的现状进行大促护航专项服务方案制定,预设活动环境下数据量情况,对性能进行评估检测。

由于时间紧急,业务方没有时间来做压测,当前数据库可承受最大压力上限无法得知。所以数据库团队使用日志信息寻找数据库中出现的慢SQL,通过日志数据分析与开发同学进行沟通优化,完成了整个活动前期的准备。

03、客户收益

云掣科技数据库团队帮助该企业完成了以下目标:

1、评估当前数据库资源使用情况以及活动预计流量后,建议业务方对实例进行升配

2、现场支持期间对数据库存在的慢SQL进行优化

3_11_3_12cpu
优化前

3_14_3_15cpu
优化后

活动优化前后CPU占比图,较优化前下降了64%

_3
图为活动前cpu状态
活动前该企业的CPU被打满,严重影响业务使用。云掣科技数据库团队帮助该企业进行了深度的检索分析,从数据库入手,发现数据库查询队列与活跃会话堆积严重。针对数据库情况进行紧急排查故障原因,故障处理,并且针对此次情况对MongoDB、MySQL、Redis进行升配,并对数据库中存在的慢SQL进行优化。
在整个活动期间,数据库整体运行正常,各负载均处于低水位,未因运维原因导致服务中断。

后记:

云掣数据库团队会继续为用户提供云上数据库的运维服务,帮助客户从繁杂的数据库运维中解脱出来,专注于企业核心业务发展。

数据库是企业的核心,企业的身家性命都存在一个个的数据库中,云掣科技希望可以通过数据库的能力,帮助更多企业在云时代管理好数据库,让业务稳定运行。

目录
相关文章
|
13天前
|
Prometheus 运维 监控
Prometheus+Grafana+NodeExporter:构建出色的Linux监控解决方案,让你的运维更轻松
本文介绍如何使用 Prometheus + Grafana + Node Exporter 搭建 Linux 主机监控系统。Prometheus 负责收集和存储指标数据,Grafana 用于可视化展示,Node Exporter 则采集主机的性能数据。通过 Docker 容器化部署,简化安装配置过程。完成安装后,配置 Prometheus 抓取节点数据,并在 Grafana 中添加数据源及导入仪表盘模板,实现对 Linux 主机的全面监控。整个过程简单易行,帮助运维人员轻松掌握系统状态。
100 3
|
5天前
|
运维 监控 Cloud Native
云原生之运维监控实践:使用 taosKeeper 与 TDinsight 实现对 时序数据库TDengine 服务的监测告警
在数字化转型的过程中,监控与告警功能的优化对保障系统的稳定运行至关重要。本篇文章是“2024,我想和 TDengine 谈谈”征文活动的三等奖作品之一,详细介绍了如何利用 TDengine、taosKeeper 和 TDinsight 实现对 TDengine 服务的状态监控与告警功能。作者通过容器化安装 TDengine 和 Grafana,演示了如何配置 Grafana 数据源、导入 TDinsight 仪表板、以及如何设置告警规则和通知策略。欢迎大家阅读。
23 0
|
2月前
|
运维 监控 安全
云计算环境下的运维挑战与解决方案
本文探讨了云计算环境中运维面临的主要挑战,包括资源管理、自动化部署、安全性问题等,并提出了相应的解决策略。通过案例分析和最佳实践,为云环境下的运维工作提供了指导和参考。
44 1
|
2月前
|
运维 监控 持续交付
云计算环境下的运维自动化实践
本文探讨了在云计算环境下实施运维自动化的必要性、挑战及解决方案,重点介绍了如何利用现代技术工具实现高效的云资源管理和监控。通过具体案例分析,展示了自动化运维在提升系统稳定性、降低人力成本方面的优势。
|
2月前
|
运维 监控 关系型数据库
数据库管理中的自动化运维:挑战与解决方案
数据库管理中的自动化运维:挑战与解决方案
|
2月前
|
存储 运维 安全
Spring运维之boot项目多环境(yaml 多文件 proerties)及分组管理与开发控制
通过以上措施,可以保证Spring Boot项目的配置管理在专业水准上,并且易于维护和管理,符合搜索引擎收录标准。
52 2
|
2月前
|
机器学习/深度学习 人工智能 运维
智能化运维:提升IT服务效率的新引擎###
本文深入浅出地探讨了智能化运维(AIOps)如何革新传统IT运维模式,通过大数据、机器学习与自动化技术,实现故障预警、快速定位与处理,从而显著提升IT服务的稳定性和效率。不同于传统运维依赖人工响应,AIOps强调预测性维护与自动化流程,为企业数字化转型提供强有力的支撑。 ###
|
2月前
|
运维 Serverless 数据处理
Serverless架构通过提供更快的研发交付速度、降低成本、简化运维、优化资源利用、提供自动扩展能力、支持实时数据处理和快速原型开发等优势,为图像处理等计算密集型应用提供了一个高效、灵活且成本效益高的解决方案。
Serverless架构通过提供更快的研发交付速度、降低成本、简化运维、优化资源利用、提供自动扩展能力、支持实时数据处理和快速原型开发等优势,为图像处理等计算密集型应用提供了一个高效、灵活且成本效益高的解决方案。
103 1
|
3月前
|
运维 Serverless 数据处理
Serverless架构通过提供更快的研发交付速度、降低成本、简化运维、优化资源利用、提供自动扩展能力、支持实时数据处理和快速原型开发等优势,为图像处理等计算密集型应用提供了一个高效、灵活且成本效益高的解决方案。
Serverless架构通过提供更快的研发交付速度、降低成本、简化运维、优化资源利用、提供自动扩展能力、支持实时数据处理和快速原型开发等优势,为图像处理等计算密集型应用提供了一个高效、灵活且成本效益高的解决方案。
68 3
|
3月前
|
运维 Linux Apache
,自动化运维成为现代IT基础设施的关键部分。Puppet是一款强大的自动化运维工具
【10月更文挑战第7天】随着云计算和容器化技术的发展,自动化运维成为现代IT基础设施的关键部分。Puppet是一款强大的自动化运维工具,通过定义资源状态和关系,确保系统始终处于期望配置状态。本文介绍Puppet的基本概念、安装配置及使用示例,帮助读者快速掌握Puppet,实现高效自动化运维。
70 4

热门文章

最新文章