阿里云 SAE 助力修正商城 3 周内提升系统承载能力 20 倍,轻松应对春晚流量

本文涉及的产品
简介: 在 2024 年春节前夕,修正电商事业部面临了前所未有的技术挑战,修正将参与春晚的全民健康好礼派发的活动,且在央视及各大平台进行广告投放,预计流量激增至 16 亿,系统需要承载保底 5 万 QPS,目标 10 万 QPS。修正技术团队迫切需要升级 APP 架构以应对即将到来的超高并发场景。这一挑战不仅是对技术的考验,更是对修正品牌实力的一次展示。为了应对这次巨大的技术挑战,修正技术团队选择与阿里云云原生团队合作,进行 APP 架构的升级。

作者:赵世振、刘松伟、朱坪

"从了解阿里云 SAE 到使用 SAE 进行应用架构升级共经历 3 周,这 3 周我们系统能承载的 QPS 从 5000 增强到 10 万提升 20 倍,轻松应对了春晚大促流量洪波。并且,SAE 还帮助我们降低了 20% 的使用成本,研发效率提升 40%,应用上线周期缩短 40%

———修正集团副总裁,修程


修正集团于 1995 年 5 月由董事长修涞贵先生创立,是集中成药、化学制药、生物制药的科研生产营销、药品连锁经营、中药材标准栽培于一体的大型现代化民营制药企业。旗下业务涵盖医药、健康等多个核心板块,建百年修正,创民族品牌,修正集团连续 12 年蝉联医药制造业百强前十,2023 年度世界品牌 500 强、民营企业 500 强。


项目背景


修正商城,是修正集团电商事业部旗下的 B2C 医药健康类交易平台,以修正药品、健康类食品及保健品为主要交易商品,为用户提供安全放心的网上购物环境。


在 2024 年春节前夕,修正电商事业部面临了前所未有的技术挑战,修正将参与春晚的全民健康好礼派发的活动,且在央视及各大平台进行广告投放,预计流量激增至 16 亿,系统需要承载保底 5 万 QPS,目标 10 万 QPS。修正技术团队迫切需要升级 APP 架构以应对即将到来的超高并发场景。这一挑战不仅是对技术的考验,更是对修正品牌实力的一次展示。为了应对这次巨大的技术挑战,修正技术团队选择与阿里云云原生团队合作,进行 APP 架构的升级。


流量激增对原有架构的挑战

image.png

修正商城原有架构图


尽管修正商城的技术架构在日常运营和小规模节假日期间表现出色,确保了服务的流畅性和稳定性,但在应对春节晚会等大规模流量高峰时,仍然面临明显的性能和扩展性挑战。具体来说,技术挑战主要包括以下几点:


单体应用架构的挑战

  • 扩展性挑战:
  • 原有商城系统是基于单体架构开发的 PHP 应用,所有功能模块全部耦合在一个代码库和一个部署单元中,且原有云主机暂未提供灵活地按需扩展或者缩减资源能力。
  • 基于服务器的部署方式限制了系统的扩展性,紧耦合的单体架构,流量洪峰时,仅增加服务器数量系统性能提升有限,非常耗时也保证不了系统 SLA。
  • 可靠性挑战:
  • 单点故障风险高,系统中单点故障的隐患犹如脆弱的链环,哪怕是最细微的差池,也可能引发连锁反应,致使整个服务体系陷入瘫痪。
  • 当前系统设计上缺省了关键的冗余防护与高可用性策略,这意味着在面临大规模流量洪峰的紧要关头,系统的抗压能力显得尤为脆弱。任何突发故障,都可能导致服务中断,并伴以较长的恢复周期,这对于追求无缝体验与持续运营的目标而言,无疑是一大隐忧。


系统可观测性不足

  • 应用日志存储及实时分析挑战:面对高达十万次每秒的查询需求,随之而来的海量业务日志对现有的服务器存储能力及日志管理方式提出了严峻挑战。传统的磁盘存储方案与手动日志审查手段,在如此庞大的数据量面前显得捉襟见肘,难以胜任快速定位与诊断系统问题的重任,亟需一场革新以适配更高的效率需求。
  • 缺乏系统可观测性:
  • 缺乏完善的监控与报警体系,系统实际运行状态难以实时掌握。
  • 无法对流量、性能、错误等关键指标进行有效监测与分析,无法提前预警,存在极大的运维风险。


QPS目标的巨大差距

  • 现有 5000 QPS(查询每秒请求数)能力,与春节期间需要承载的预计保底 5 万 QPS、目标 10 万 QPS 仍有较大差距,需要迅速提升约 20 倍的处理能力。


所以修正技术团队面临着重构架构的紧迫任务,不仅要解决现有的可靠性和扩展性问题,还要优化系统的监控、日志处理能力,以保证在春节高峰期间提供良好的用户体验,维护品牌形象。


阿里云解决方案

image.png

架构升级图


为了应对修正商城在 2024 年春节期间面临的高流量冲击,阿里云提供了全面的架构升级方案,具体解决方案如下:


1. 基础架构迁移与应用拆分

  • Serverless 应用引擎(SAE)应用全托管:
  • 针对原有的云主机方案存在的不足,采用阿里云的 Serverless 应用引擎(SAE)进行全面替代。SAE 无需管理底层服务器,可以根据实际流量需求自动调整资源分配,确保在高并发场景下系统的平稳运行。相比云上虚拟机部署方式,SAE 能够快速响应流量波动,提高资源利用效率,极大简化了运维复杂性。
  • 通过 SAE 的多实例部署,增强了应用的冗余能力,提高了系统的可靠性。
  • 镜像管理与拉取:
  • SAE 支持通过阿里云 ACREE(企业级容器镜像库)拉取应用镜像,简化了部署流程,保证了应用的快速迭代和更新。
  • 开通镜像加速服务,优化弹性效率。


2. 系统可观测性与监控

  • SAE 集成系统监控:
  • 提供基础的系统监控能力,实时监测应用的健康状态和性能指标。
  • SAE 统一日志管理:
  • 使用 SLS(日志服务)进行日志的统一采集和存储,实现集中管理和实时分析,提升问题定位和解决效率。


业务价值


阿里云提供的解决方案,尤其是 Serverless 应用引擎(SAE)的应用,为修正商城带来了显著的价值。通过架构升级和优化,解决了现有系统中的主要瓶颈,满足了高并发场景的需求,确保了系统的高可用性和稳定性。以下是具体的价值体现:


  • 通过 SAE 弹性策略解决方案,可以从容应对固定周期的业务洪峰,一键启停业务运行环境,极大地提升了资源利用率,比云主机方案节省 20% 以上的硬件成本。同时省去了原来预估资源、临时部署应用的操作,极大减轻了运维团队的工作量,整体效率提升 40%。
  • 通过 SAE 自带的监控解决方案以及与 ARMS 监控的无缝集成,帮助客户快速、精准定位问题,整体 Bug 处理速度提升 30%。
  • SAE 极致扩缩容的背后是极致的资源利用率,帮助客户整体资源利用率提升近 50%。
  • 通过 SAE 平台对微服务生命周期的管理,上线周期缩短达 40%,满足业务的快速迭代要求。


修正集团与阿里云合作展望


在修正电商事业部的全面技术革新之旅中,修正电商以阿里云 Serverless 应用引擎(SAE)为核心,成功实现了系统架构的飞跃式升级,这不仅标志着修正自研系统在扩展性、可靠性和灵活性上的重大突破,也开启了运维管理与资源利用效率的新篇章。通过这次升级,修正电商事业部大幅削减了运营成本,同时显著增强了用户的交互体验,巩固了修正品牌在健康市场中的领先地位,并在节假日期间高流量的考验下,依旧确保了交易流程的流畅与高效,稳固了用户对修正电商的信赖。


此番变革深刻启示了云计算技术对于修正集团战略发展的重要性。修正集团视阿里云不仅是技术供应商,更是携手共进的创新伙伴。展望未来,修正集团将深化与阿里云的合作广度与深度,充分利用云计算的弹性伸缩、高效成本控制等优势,为修正自研系统的持续创新与智能化演进注入动力,旨在开创个性化、智能化健康管理服务的新纪元,为消费者带来覆盖更全面、体验更便捷的健康解决方案。


不仅如此,修正电商事业部将以此次成功转型为契机,积极探索云计算在医药健康产业的广泛应用与深度融合,力求在数字化转型的宽广大道上,不断突破边界,引领行业新风向,实现技术与健康的完美交汇,共绘医药健康行业的未来蓝图。

相关实践学习
日志服务之数据清洗与入湖
本教程介绍如何使用日志服务接入NGINX模拟数据,通过数据加工对数据进行清洗并归档至OSS中进行存储。
相关文章
|
21天前
|
网络协议 安全 调度
阿里云公共DNS发布支持鸿蒙系统版的SDK
阿里云公共DNS发布支持鸿蒙系统版SDK,赋能鸿蒙开发者快速接入阿里云公共DNS服务。公共DNS将帮助接入的鸿蒙应用免除LocalDNS劫持困扰、解析加速、精准调度。
|
4天前
|
敏捷开发 测试技术 持续交付
阿里云云效产品使用问题之在流水线中无法运行已在系统环境变量中配置的可执行命令,是什么导致的
云效作为一款全面覆盖研发全生命周期管理的云端效能平台,致力于帮助企业实现高效协同、敏捷研发和持续交付。本合集收集整理了用户在使用云效过程中遇到的常见问题,问题涉及项目创建与管理、需求规划与迭代、代码托管与版本控制、自动化测试、持续集成与发布等方面。
|
2月前
|
弹性计算 监控 安全
【阿里云弹性计算】ECS实例监控与告警系统构建:利用阿里云监控服务保障稳定性
【5月更文挑战第23天】在数字化时代,阿里云弹性计算服务(ECS)为业务连续性提供保障。通过阿里云监控服务,用户可实时监控ECS实例的CPU、内存、磁盘I/O和网络流量等指标。启用监控,创建自定义视图集中显示关键指标,并设置告警规则(如CPU使用率超80%),结合多种通知方式确保及时响应。定期维护和优化告警策略,利用健康诊断工具,能提升服务高可用性和稳定性,确保云服务的卓越性能。
73 1
|
2月前
|
安全 小程序 网络安全
阿里云腾讯云免费SSL证书托管系统的开发初衷
由于Google等公司推动,互联网安全趋势将SSL证书期限统一缩短至3个月,阿里云和腾讯云相继跟进。对于管理多个站点的小公司而言,手动维护变得繁琐。为自动化此过程,作者探索使用API解决方案。通过研究腾讯云API,成功实现证书的自动创建、审核和下载。为应对无免费到期提醒服务,作者创建计划任务,在证书到期前7天发送提醒,初期采用短信提醒,并增设公众号模板消息作为备选方案,完成到期提醒系统的构建。接下来的文章将讨论SSL证书的申请和下载流程。
65 2
|
2月前
|
弹性计算 监控 数据库
【阿里云弹性计算】企业级应用上云实战:基于阿里云 ECS 的 ERP 系统迁移案例
【5月更文挑战第25天】制造企业将面临资源不足、维护成本高和数据安全问题的ERP系统迁移到阿里云ECS,实现业务上云。通过数据迁移、应用部署、网络配置和性能优化等步骤,企业享受到弹性计算资源、高可靠性和数据安全优势,降低维护成本。阿里云提供24小时支持,助力企业数字化转型。此案例展示企业级应用上云的可行性,鼓励更多企业借助云计算实现创新发展。
48 0
|
2月前
|
运维 监控 Serverless
Serverless 应用引擎产品使用之在使用阿里云函数计算部署网站时,网站打开不稳定如何解决
阿里云Serverless 应用引擎(SAE)提供了完整的微服务应用生命周期管理能力,包括应用部署、服务治理、开发运维、资源管理等功能,并通过扩展功能支持多环境管理、API Gateway、事件驱动等高级应用场景,帮助企业快速构建、部署、运维和扩展微服务架构,实现Serverless化的应用部署与运维模式。以下是对SAE产品使用合集的概述,包括应用管理、服务治理、开发运维、资源管理等方面。
637 1
|
2月前
|
弹性计算 运维 Serverless
Serverless 应用引擎产品使用之在阿里函数计算中,使数据库和阿里云函数计算位于同一个内网中如何解决
阿里云Serverless 应用引擎(SAE)提供了完整的微服务应用生命周期管理能力,包括应用部署、服务治理、开发运维、资源管理等功能,并通过扩展功能支持多环境管理、API Gateway、事件驱动等高级应用场景,帮助企业快速构建、部署、运维和扩展微服务架构,实现Serverless化的应用部署与运维模式。以下是对SAE产品使用合集的概述,包括应用管理、服务治理、开发运维、资源管理等方面。
1594 0
Serverless 应用引擎产品使用之在阿里函数计算中,使数据库和阿里云函数计算位于同一个内网中如何解决
|
2月前
|
运维 Serverless 应用服务中间件
Serverless 应用引擎产品使用之在阿里云Serverless中函数计算FC nginx 部署上去之后放置静态页面如何解决
阿里云Serverless 应用引擎(SAE)提供了完整的微服务应用生命周期管理能力,包括应用部署、服务治理、开发运维、资源管理等功能,并通过扩展功能支持多环境管理、API Gateway、事件驱动等高级应用场景,帮助企业快速构建、部署、运维和扩展微服务架构,实现Serverless化的应用部署与运维模式。以下是对SAE产品使用合集的概述,包括应用管理、服务治理、开发运维、资源管理等方面。
300 0
|
12天前
|
存储 弹性计算 Linux
阿里云账号注册、完成实名认证、试用云服务器和购买云服务器流程参考
本文为大家介绍新手用户从注册阿里云账号,完成实名认证,然后试用云服务器和购买云服务器的主要流程,适合初次购买和试用阿里云服务器的新手用户参考。
阿里云账号注册、完成实名认证、试用云服务器和购买云服务器流程参考
|
3天前
|
弹性计算 安全 前端开发
阿里云服务器ECS通用型、计算型和内存型详细介绍和性能参数表
阿里云ECS实例有计算型(c)、通用型(g)和内存型(r)三种,主要区别在于CPU和内存比例。计算型CPU内存比1:2,如2核4G;通用型为1:4,如2核8G;内存型为1:8,如2核16G。随着技术迭代,有第五代至第八代产品,如c7、g5、r8a等。每代实例在CPU型号和主频上相同,但性能有所提升。实例性能参数包括网络带宽、收发包能力、连接数等。具体应用场景如计算型适合高网络包收发、通用型适合企业级应用,内存型适合内存数据库等。详细信息可参阅阿里云ECS页面。

热门文章

最新文章

相关产品

  • Serverless 应用引擎