【云故事探索】NO.15:阿里云云原生加速鸣鸣很忙数字化

本文涉及的产品
可观测可视化 Grafana 版,10个用户账号 1个月
函数计算FC,每月15万CU 3个月
Serverless 应用引擎免费试用套餐包,4320000 CU,有效期3个月
简介: 鸣鸣很忙集团作为中国最大休闲食品饮料连锁零售商,通过数字化与云原生技术实现快速扩张,4年完成其他企业10年的数字化进程。其采用阿里云全栈云原生方案,实现弹性扩容、智能补货、模块化开店等创新实践,支撑日均超430万交易数据稳定运行。未来将深化AI应用,推动供应链智能化与业务全面升级。

继现制茶饮、咖啡、餐饮等行业后,量贩零食成为消费领域又一个跑出万店的赛道,这些线下零售起家的连锁企业,正以另一种范式诠释着什么是后互联网时代的新零售。本文整理自鸣鸣很忙集团数字化中心总经理孙浩和运维服务部经理黄奖的视频采访稿。

鸣鸣很忙集团是中国最大的休闲食品饮料连锁零售商,亦是中国食品饮料量贩模式的引领者,旗下现有“零食很忙”、“赵一鸣零食”两大品牌。截至 2024 年 12 月 31 日,鸣鸣很忙全国门店数量 14394 家,覆盖中国 28 个省份和各线城市,是中国零食连锁行业首个达到万店规模的企业,并稳居行业第一。

一、鸣鸣很忙数字化:4 年多时间走完其他企业 10 多年的路程

鸣鸣很忙的数字化建设,要从零食很忙说起。

零食很忙的数字化建设是从 2021 年开始的,到目前为止,鸣鸣很忙集团已经搭建起一整套业务数字化体系,我们在 4 年多的时间差不多走过了很多企业 10 多年的数字化进程。

我们一方面做加盟商和门店相关的数字化,让加盟商、门店的管理简单化和傻瓜化,完成前端的人、货、场的数字化管理。另一方面做企业内部的数字化,让人、财、物的管理在线化和一体化。这两大方面的数字化建设,是鸣鸣零食规模化的坚实基础。

特别需要说一下的,是关于“人货场"这三个零售命脉。

首先,在“人”的方向。去年,集团代言人发布活动期间,订单流量呈现爆炸式增长。若采用传统系统模式,这种突如其来的大量订单将难以应对。幸运的是,我们采用了阿里云的弹性计算技术,配合负载均衡和弹性容器实例,就像给收银台开了 1000 个临时窗口,系统自动扩容扛住流量洪峰,并在活动结束后自动“回收包装袋”,避免了资源的浪费。

接下来是“货”的智能化问题。过去,补货完全依赖店长的经验判断,薯片怕压、巧克力怕热、坚果怕过期,每个仓库都像布满了定时炸弹。因此,我们开始利用大数据计算平台,分析天气、节庆甚至社交媒体的热门话题,结合供应能力、仓储条件和销售预测,自动生成补货清单。

还有就是在“场”的转型上。我们内部常说,如今开设新店必须做到“复制粘贴”。通过企业级分布式应用服务,我们将开店流程模块化,从而大幅缩短了新店从签约到开业的周期。一些超级加盟商能够同时开设多家店铺,仅需携带 1、2 名运营督导,其余事宜均可在云端完成。

二、云原生是企业数字化建设的最短路径

在数字化建设的道路中,鸣鸣很忙凭借阿里云的全栈云原生方案,成功实现了从 “传统单体架构”到 “敏捷云原生架构”的华丽转身。这一转型有力地支撑了其在促销活动期间应对流量洪峰,以及快速迭代业务功能的需求。

我们的核心业务使用了阿里云的诸多云原生产品,包括微服务引擎 MSE、消息队列 RocketMQ、应用实时监控 ARMS、日志服务 SLS、容器服务 ACK、云原生数据库 PolarDB/PolarDB-X,还有一些云安全产品等。

选择阿里云的云产品,主要基于以下的考量:

  • 全栈的技术整合能力,从容器、微服务到监控,提供了一站式方案,极大地避免了多平台集成的复杂性,有效降低了技术栈碎片化的风险。
  • 从可靠性、成本效益性以及安全合规性等多维度出发,阿里云的产品组合为我们全面打造了一个坚实可靠的基础设施服务平台,助力我们在数字化道路上稳步前行。

在应对业务快速增长过程中,我们通过容器化和微服务化实现技术架构升级,其中,整体资源利用率提升 40%,研发迭代效率提高 30% 以上。通过 MSE 云原生网关统一多层网关架构(原流量/微服务/安全网关),实现 QPS 较 Nginx 提升 40% 以上,HTTPS 性能提升 80%,故障排查效率提升 50%。

由于业务全面容器化和微服务化过程中,给业务带来了更多的运维复杂度,为了更及时、高效的观测整个 IT 系统,鸣鸣零食借助阿里云应用实时监控服务 ARMS、日志服务 SLS、云监控 CMS 的全栈可观测方案,构建完整了的端到端可观测体系,实现四层监控覆盖:用户体验层→应用服务层→中间件层→资源层;实现了分钟分故障定位能力,告警准确率提升至 98%。

除了日常运营,我们还有大量的营销活动,比如我们去年举办的「周杰伦代言」的营销活动中,全网曝光超过 25 亿次。百万级 QPS 的情况下,整体平稳运行抗住流量峰值,这个过程我们获得了阿里云的大力支持。

在活动筹备初期,我们借助 PTS 模拟千万级用户行为,提前发现 12 处性能瓶颈且提前验证服务可用性与资源容量预估。在活动过程中,Grafana 驾驶舱实时监控 200+ 核心指标。完整的可视化大盘和驾驶舱,以及 MSE 网关的自动弹性扩容等技术,为活动的顺利落地保驾护航,让业务稳定性“看得见”、“摸得到”。

三、上万家门店的数据同步和一致性,如何保障

鸣鸣很忙为了实现总部管理万家门店的经营模式,采用"中心化管控+分布式业务"混合架构的数字化体系。其中,会员、订单、商品、库存等核心业务系统,通过阿里云的保障,可以支撑日均 500 万级的交易数据。

我们的关键事务场景有订单支付、库存扣减、积分变更等强一致性业务,鸣鸣很忙采用了云消息队列 RocketMQ 事务消息实现跨服务最终一致性。基于数据强一致性的要求,我们做了 3 层保障体系:

  • 业务层:本地事务+消息表机制。
  • 消息层:自动重试/死信队列/消息轨迹追踪。
  • 监控层:基于云消息队列 RocketMQ 的实时追踪消息积压与消费延迟监控能力。

从而进一步提升了整个系统的稳定性和性能。

四、日均 >430 万级交易数据下的消费者体验,如何保障

在大数据与智能化的背景下,鸣鸣很忙通过以下 3 个方式提升消费者体验:

  • 数字化门店管理:借助数字化系统,实现门店从品类分析到营运管理的标准化,缩短开店周期,简化陈列流程,量化采购规模,降低运营成本。数字化门店管理采用微服务架构,并托管在阿里云微服务引擎 MSE 上,提升性能和稳定性。
  • 数图可视化品类管理系统:利用大数据分析优化陈列,结合门店资源与销售能力生成陈列图,经门店执行后反馈总部核验。面对大规模数据处理需求,采用阿里云的云消息队列 Kafka 版与 Spark 流计算引擎,实现数据实时捕捉与处理,提升系统响应速度与灵活性。
  • 终端应用监控优化:通过阿里云应用实时监控服务 ARMS - 用户体验监控,实时掌握 Web、H5、小程序的 PV/UV、首次渲染耗时等性能指标,及时发现并解决 JS 错误、API 请求错误等问题,从页面打开速度、稳定性和外部服务调用成功率三个方面提升用户体验。

五、规模越大,越关注 IT 成本和运营效率

IT 成本优化上,主要基于 Kubernetes 的智能弹性(如 AHPA 预测扩缩容)弹性资源管理降低冗余成本 30% 以上,并结合 ECI 的弹性容器实例,实现秒级资源响应,资源利用率提升 30%-50%。基于阿里云智能化成本治理工具,实现资源水位分析和多维度成本洞察和优化实现成本趋势预测,给出优化建议降低成本。

运营效率上,基于云原生的开发范式(如容器化、DevOps 流水线),标准化应用交付流程提升研发效率提升达 30% 以上、业务连续性保障我们系统可用性达到 99.95 以上。

此外,我们在技研发团队全面启用通义灵码。研发团队使用覆盖率超过 60% 以上了,代码生成占比超过 30% 以上,智能补全采纳率超过 40% 以上。核心的场景主要在:单元测试场景、代码注释、代码优化、研发智能问答文档生产等场景;

  • 提升编码效率:通过代码大模型辅助编程,大幅提升研发人员的工作效率,实现人效提升。
  • 代码质量增强:借助单元测试AI自动生成技术,将质量管控左移,显著提高代码质量。
  • 盘活研发资产:激活数字化转型过程中沉淀的规范文档和代码样例库,提高代码规范性,减少重复开发,进一步提升研发效率。

六、AI 时代,鸣鸣很忙数字化的未来规划

产研发团队的需求分析、设计、编码环节,会逐步提升智能化的覆盖率,通过阿里云通义系列模型来协助数字化产品和研发来理解需求、更高效的设计产品方案,甚至自动生成部分代码片段,提高研发效率。我们还会将智能化的技术应用于终端门店,例如通过 AI 智能秤实现商品的快速识别与称重,整合运营平台,实现商品的批量及大小码管理,门店运营和收银效率。其他技术规划还包括:

  • 深化 AI 应用:鸣鸣零食已经在门店收银结算、收货、远程巡店等环节应用了 AI 技术,如智能秤、AI 视频巡检等,未来将继续深化 AI 在业务中的应用,提升运营效率。例如,智能秤可以识别散称商品的 SKU,无需手动输入编码,大幅提高收银效率。
  • 智能化供应链:利用 AI 技术实现供应链的智能化决策和精细化管理,如智能订货功能,通过对门店销售情况的预测,智能规划采购时间和数量,优化库存周转和商品满足率。
  • 技术融合:强调 IT、DT 和 AI 的融合,推动技术与业务的深度融合,实现从数字化到智能化的转型升级。
相关文章
|
8月前
|
消息中间件 人工智能 Kafka
【云故事探索】NO.14:乐言科技——云原生加速电商行业赋能,云消息队列助力降本 37%
上海乐言科技股份有限公司专注于AI技术,提供电商、金融等领域的整体解决方案。其核心产品“乐语助人”智能客服机器人日均服务超千万人次,助力六万余家电商客户数智化转型。为解决自建消息队列痛点,乐言科技采用阿里云消息队列RocketMQ版Serverless系列,实现业务稳定、开发成本降低、运维效率提升及资源弹性降本37%。通过云原生架构,乐言科技推动AI与电商深度融合,助力行业创新突破。
|
4月前
|
运维 监控 Cloud Native
【云故事探索】NO.17:国诚投顾的云原生 Serverless 实践
国诚投顾携手阿里云,依托Serverless架构实现技术全面升级,构建高弹性、智能化技术底座,提升业务稳定性与运行效率。通过云原生API网关、微服务治理与智能监控,实现流量精细化管理与系统可观测性增强,打造安全、敏捷的智能投顾平台,助力行业数字化变革。
【云故事探索】NO.17:国诚投顾的云原生 Serverless 实践
|
4月前
|
运维 监控 Cloud Native
【云故事探索】NO.17:国诚投顾的云原生 Serverless 实践
国诚投顾携手阿里云,依托Serverless架构实现技术全面升级,构建高弹性、智能化技术底座,提升业务稳定性与运维效率,赋能智能投顾服务创新,引领行业数字化变革。
175 10
【云故事探索】NO.17:国诚投顾的云原生 Serverless 实践
|
8月前
|
人工智能 弹性计算 运维
阿里云 MCP Server 开箱即用!
本文介绍了如何通过alibaba-cloud-ops-mcp-server和MCP(Model Context Protocol)实现AI助手对阿里云资源的复杂任务操作。内容涵盖背景、准备步骤(如使用VS Code与Cline配置MCP Server)、示例场景(包括创建实例、监控实例、运行命令、启停实例等),以及支持的工具列表和参考文档。借助这些工具,用户可通过自然语言与AI助手交互,完成ECS实例管理、VPC查询、云监控数据获取等运维任务,实现高效“掌上运维”。
|
5月前
|
存储 弹性计算 监控
阿里云顶会论文 OSDI'25 VIO 弹性直通
本文介绍阿里云团队发表于OSDI顶会的论文《To PRI or Not To PRI, That’s the question》,探讨云计算中虚拟化设备内存管理难题。论文提出纯软件方案VIO,通过内存预检、智能模式切换和自适应锁页设计,实现无需硬件支持的高效内存管理。该方案已在阿里云大规模部署,显著提升资源利用率,兼顾性能与兼容性。
240 0
阿里云顶会论文 OSDI'25 VIO 弹性直通
|
3月前
|
人工智能 缓存 安全
阿里云发布《AI 原生应用架构白皮书》
阿里云联合阿里巴巴爱橙科技,共同发布《AI 原生应用架构白皮书》,围绕 AI 原生应用的 DevOps 全生命周期,从架构设计、技术选型、工程实践到运维优化,对概念和重难点进行系统的拆解,并尝试提供一些解题思路。白皮书覆盖 AI 原生应用的 11 大关键要素,获得 15 位业界专家联名推荐,来自 40 多位一线工程师实践心的,全书合计超 20w 字,分为 11 章。
2195 24
|
5月前
|
消息中间件 人工智能 监控
【云故事探索】NO.15:阿里云云原生加速鸣鸣很忙数字化
鸣鸣很忙集团作为中国最大休闲食品饮料连锁零售商,通过数字化与云原生技术实现快速扩张,4年完成其他企业10年的数字化进程。其采用阿里云全栈云原生方案,实现弹性扩容、智能补货、模块化开店等创新实践,支撑日均超430万交易数据稳定运行。未来将深化AI应用,推动供应链智能化与业务全面升级。
|
4月前
|
人工智能 弹性计算 监控
【云故事探索】NO.16:阿里云弹性计算加速精准学 AI 教育普惠落地
智能精准学联合阿里云打造全球首个K12教育超级智能体“寒雪老师”,通过弹性计算实现AI一对一教学,助力教育普惠。
【云故事探索】NO.16:阿里云弹性计算加速精准学 AI 教育普惠落地
|
9月前
|
存储 分布式计算 安全
数据生命周期管理:从生成到销毁,数据的“生死”之旅
数据生命周期管理:从生成到销毁,数据的“生死”之旅
1769 6
|
6月前
|
弹性计算 运维 监控
资源利用率提升50%:Serverless 驱动国诚投顾打造智能投顾新范式
通过与阿里云深度合作,国诚投顾完成了从传统 ECS 架构向云原生 Serverless 架构的全面转型。新的技术架构不仅解决了原有系统在稳定性、弹性、运维效率等方面的痛点,还在成本控制、API 治理、可观测性、DevOps 自动化等方面实现了全方位升级。
471 19