云快充云原生稳定性建设之路

本文涉及的产品
容器镜像服务 ACR,镜像仓库100个 不限时长
简介: “在阿里云的帮助下,云快充通过全面容器化与稳定性建设,极大地促进了业务的快速迭代。希望新能源行业的其他技术团队可以和我们一起共同探索云原生稳定性方面的技术路径。”

客户背景

云快充成立于2016年,以充电服务和能源管理为核心,业务涵盖九个方向。截止到2022年11月,业务覆盖370个城市,接入电桩运营商 7400人,接入充电终端31万家,与640个桩企达成合作。

客户痛点

为确保业务的稳定运行,自2019年起,云快充采用百分百容器化的技术路线。然而,在容器化改造的过程中,云快充遇到了两个挑战:
自建 Kubernetes 集群维护困难: Kubernetes 是一个大型复杂的分布式系统,云快充曾经遇到过节点异常、Pod 异常、网络不通、etcd 性能瓶颈等问题,解决这些问题非常耗费精力,尤其是遇到 Kubernetes 本身的 bug 时更是无能为力。
业务变更带来稳定性风险:随着微服务架构的不断演进,业务变更越来越频繁。由于应用上下线不够优雅以及缺少精细化和灰度策略,80%以上的线上业务故障都与版本发布有关。

方案亮点

高稳定性的托管版 Kubernetes 集群:容器服务 ACK 在确保 API 和标准完全兼容开源 Kubernetes 的前提下,提供了一系列稳定性提升手段,如 master 节点托管、智能巡检诊断、跨可用区的高可用等等。这些手段都经过阿里双十一大规模场景和阿里云大型客户的实战验证,升级集群版本也变得足够简单。
基于 eBPF 技术的应用诊断技术:一键开启应用诊断能力,不需要对应用进行任何修改。它提供全局视角的应用拓扑,并从请求数、错误数、延误三个黄金指标出发,发现异常的服务个体。
通过微服务治理实现应用稳定性提升:采用基于 Java-Agent 字节码增强的技术,实现无侵入式微服务治理增强,让微服务应用获得无损上下线和全链路灰度能力,从而将版本发布对正常业务的影响降到最低。

image.png

建设成功

生产事故率显著降低:云快充在一条业务线上落地了全链路灰度技术,将应用变更导致的生产事故降低了70%,后续还会将这项技术推广到整个企业。
业务高峰期系统稳定运行:从网关到微服务应用,到第三方依赖,每一层都配置流量防护规则,确保在业务高峰期不会有任何系统被用户流量所压垮。
研发效率提升:通过云原生稳定性建设,云快充接入的电桩数量完成了20万到30万的增长,平均需求迭代周期从7日降低到4日,极大地促进了业务的快速迭代。

客户证言

“在阿里云的帮助下,云快充通过全面容器化与稳定性建设,极大地促进了业务的快速迭代。希望新能源行业的其他技术团队可以和我们一起共同探索云原生稳定性方面的技术路径。”

相关产品

阿里云容器服务ACK(Alibaba Cloud Container Service for Kubernetes)
阿里云实时监控服务(ARMS)

相关实践学习
深入解析Docker容器化技术
Docker是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的Linux机器上,也可以实现虚拟化,容器是完全使用沙箱机制,相互之间不会有任何接口。Docker是世界领先的软件容器平台。开发人员利用Docker可以消除协作编码时“在我的机器上可正常工作”的问题。运维人员利用Docker可以在隔离容器中并行运行和管理应用,获得更好的计算密度。企业利用Docker可以构建敏捷的软件交付管道,以更快的速度、更高的安全性和可靠的信誉为Linux和Windows Server应用发布新功能。 在本套课程中,我们将全面的讲解Docker技术栈,从环境安装到容器、镜像操作以及生产环境如何部署开发的微服务应用。本课程由黑马程序员提供。     相关的阿里云产品:容器服务 ACK 容器服务 Kubernetes 版(简称 ACK)提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力,打造云端最佳容器化应用运行环境。 了解产品详情: https://www.aliyun.com/product/kubernetes
相关文章
|
Cloud Native 关系型数据库 分布式数据库
掌阅科技采用云原生数据库PolarDB,大幅降低使用成本,提升业务稳定性和扩展性
掌阅科技将数据库迁移到PolarDB后,数据压缩到之前的30%,整体成本节省50%。
355 0
|
12月前
|
运维 Cloud Native Java
从 IDC 到云原生:稳定性提升 100%,成本下降 50%,热联集团的数字化转型与未来展望
热联集团在进行了云原生架构的升级与探索后,显著提升了业务系统的稳定性和敏捷性。这一转变不仅为公司冲击更高的销售目标奠定了坚实的技术基础,也标志着热联在数字化转型道路上迈出了关键一步。通过采用微服务、容器化等先进技术手段,热联能够更加灵活地响应市场变化,快速迭代产品和服务,满足客户日益增长的需求。
497 143
|
运维 Kubernetes Cloud Native
《云原生架构容器&微服务优秀案例集》——05 金融—— 费芮互动 通过 MSE 完成移动支付应用稳定性和安全性双提升
《云原生架构容器&微服务优秀案例集》——05 金融—— 费芮互动 通过 MSE 完成移动支付应用稳定性和安全性双提升
463 0
《云原生架构容器&微服务优秀案例集》——05 金融—— 费芮互动 通过 MSE 完成移动支付应用稳定性和安全性双提升
|
弹性计算 运维 Kubernetes
|
Prometheus Kubernetes 监控
《云原生架构容器&微服务优秀案例集》——02 汽车/制造——云快充 云原生稳定性建设之路
《云原生架构容器&微服务优秀案例集》——02 汽车/制造——云快充 云原生稳定性建设之路
335 0
|
Prometheus Kubernetes 监控
《2023云原生实战案例集》——01 汽车/制造——云快充 云原生稳定性建设之路
《2023云原生实战案例集》——01 汽车/制造——云快充 云原生稳定性建设之路
|
运维 Kubernetes Cloud Native
《2023云原生实战案例集》——05 金融服务——费芮互动 通过MSE完成移动支付应用,稳定性和安全性双提升
《2023云原生实战案例集》——05 金融服务——费芮互动 通过MSE完成移动支付应用,稳定性和安全性双提升
|
存储 Cloud Native 数据处理
从嵌入式状态管理到云原生架构:Apache Flink 的演进与下一代增量计算范式
本文整理自阿里云资深技术专家、Apache Flink PMC 成员梅源在 Flink Forward Asia 新加坡 2025上的分享,深入解析 Flink 状态管理系统的发展历程,从核心设计到 Flink 2.0 存算分离架构,并展望未来基于流批一体的通用增量计算方向。
206 0
从嵌入式状态管理到云原生架构:Apache Flink 的演进与下一代增量计算范式
|
3月前
|
运维 监控 Cloud Native
从本土到全球,云原生架构护航灵犀互娱游戏出海
本文内容整理自「 2025 中企出海大会·游戏与互娱出海分论坛」,灵犀互娱基础架构负责人朱晓靖的演讲内容,从技术层面分享云原生架构护航灵犀互娱游戏出海经验。
334 15
|
3月前
|
运维 监控 Cloud Native
从本土到全球,云原生架构护航灵犀互娱游戏出海
内容整理自「 2025 中企出海大会·游戏与互娱出海分论坛」,灵犀互娱基础架构负责人朱晓靖的演讲内容,从技术层面分享云原生架构护航灵犀互娱游戏出海经验。
下一篇
开通oss服务