云快充云原生稳定性建设之路

本文涉及的产品
容器镜像服务 ACR,镜像仓库100个 不限时长
简介: “在阿里云的帮助下,云快充通过全面容器化与稳定性建设,极大地促进了业务的快速迭代。希望新能源行业的其他技术团队可以和我们一起共同探索云原生稳定性方面的技术路径。”

客户背景

云快充成立于2016年,以充电服务和能源管理为核心,业务涵盖九个方向。截止到2022年11月,业务覆盖370个城市,接入电桩运营商 7400人,接入充电终端31万家,与640个桩企达成合作。

客户痛点

为确保业务的稳定运行,自2019年起,云快充采用百分百容器化的技术路线。然而,在容器化改造的过程中,云快充遇到了两个挑战:
自建 Kubernetes 集群维护困难: Kubernetes 是一个大型复杂的分布式系统,云快充曾经遇到过节点异常、Pod 异常、网络不通、etcd 性能瓶颈等问题,解决这些问题非常耗费精力,尤其是遇到 Kubernetes 本身的 bug 时更是无能为力。
业务变更带来稳定性风险:随着微服务架构的不断演进,业务变更越来越频繁。由于应用上下线不够优雅以及缺少精细化和灰度策略,80%以上的线上业务故障都与版本发布有关。

方案亮点

高稳定性的托管版 Kubernetes 集群:容器服务 ACK 在确保 API 和标准完全兼容开源 Kubernetes 的前提下,提供了一系列稳定性提升手段,如 master 节点托管、智能巡检诊断、跨可用区的高可用等等。这些手段都经过阿里双十一大规模场景和阿里云大型客户的实战验证,升级集群版本也变得足够简单。
基于 eBPF 技术的应用诊断技术:一键开启应用诊断能力,不需要对应用进行任何修改。它提供全局视角的应用拓扑,并从请求数、错误数、延误三个黄金指标出发,发现异常的服务个体。
通过微服务治理实现应用稳定性提升:采用基于 Java-Agent 字节码增强的技术,实现无侵入式微服务治理增强,让微服务应用获得无损上下线和全链路灰度能力,从而将版本发布对正常业务的影响降到最低。

image.png

建设成功

生产事故率显著降低:云快充在一条业务线上落地了全链路灰度技术,将应用变更导致的生产事故降低了70%,后续还会将这项技术推广到整个企业。
业务高峰期系统稳定运行:从网关到微服务应用,到第三方依赖,每一层都配置流量防护规则,确保在业务高峰期不会有任何系统被用户流量所压垮。
研发效率提升:通过云原生稳定性建设,云快充接入的电桩数量完成了20万到30万的增长,平均需求迭代周期从7日降低到4日,极大地促进了业务的快速迭代。

客户证言

“在阿里云的帮助下,云快充通过全面容器化与稳定性建设,极大地促进了业务的快速迭代。希望新能源行业的其他技术团队可以和我们一起共同探索云原生稳定性方面的技术路径。”

相关产品

阿里云容器服务ACK(Alibaba Cloud Container Service for Kubernetes)
阿里云实时监控服务(ARMS)

相关实践学习
容器服务Serverless版ACK Serverless 快速入门:在线魔方应用部署和监控
通过本实验,您将了解到容器服务Serverless版ACK Serverless 的基本产品能力,即可以实现快速部署一个在线魔方应用,并借助阿里云容器服务成熟的产品生态,实现在线应用的企业级监控,提升应用稳定性。
云原生实践公开课
课程大纲 开篇:如何学习并实践云原生技术 基础篇: 5 步上手 Kubernetes 进阶篇:生产环境下的 K8s 实践 相关的阿里云产品:容器服务 ACK 容器服务 Kubernetes 版(简称 ACK)提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力,打造云端最佳容器化应用运行环境。 了解产品详情: https://www.aliyun.com/product/kubernetes
相关文章
|
4月前
|
Cloud Native 关系型数据库 分布式数据库
掌阅科技采用云原生数据库PolarDB,大幅降低使用成本,提升业务稳定性和扩展性
掌阅科技将数据库迁移到PolarDB后,数据压缩到之前的30%,整体成本节省50%。
103 0
|
12月前
|
Prometheus Kubernetes 监控
《云原生架构容器&微服务优秀案例集》——02 汽车/制造——云快充 云原生稳定性建设之路
《云原生架构容器&微服务优秀案例集》——02 汽车/制造——云快充 云原生稳定性建设之路
181 0
|
12月前
|
运维 Kubernetes Cloud Native
《云原生架构容器&微服务优秀案例集》——05 金融—— 费芮互动 通过 MSE 完成移动支付应用稳定性和安全性双提升
《云原生架构容器&微服务优秀案例集》——05 金融—— 费芮互动 通过 MSE 完成移动支付应用稳定性和安全性双提升
250 0
《云原生架构容器&微服务优秀案例集》——05 金融—— 费芮互动 通过 MSE 完成移动支付应用稳定性和安全性双提升
|
12月前
|
Prometheus Kubernetes 监控
《2023云原生实战案例集》——01 汽车/制造——云快充 云原生稳定性建设之路
《2023云原生实战案例集》——01 汽车/制造——云快充 云原生稳定性建设之路
|
12月前
|
运维 Kubernetes Cloud Native
《2023云原生实战案例集》——05 金融服务——费芮互动 通过MSE完成移动支付应用,稳定性和安全性双提升
《2023云原生实战案例集》——05 金融服务——费芮互动 通过MSE完成移动支付应用,稳定性和安全性双提升
|
存储 运维 监控
数据密集型系统的云原生架构与稳定性保障
本文是参加QCon全球软件开发大会(2023·北京站)专题分享后的一些总结。参加此次大会的最大感受是疫情后的快速恢复,到现场的听众座无虚席,一些场次甚至出现无座。同时也学习了其他多个专题分享,总体感觉是整个大会专业度很高,无论是从专题分享的内容、还是Q&A环节的听众互动。
225 0
数据密集型系统的云原生架构与稳定性保障
|
2月前
|
人工智能 监控 Cloud Native
iLogtail 2.0 来了;通义灵码下载量破百万丨阿里云云原生 2 月产品月报
iLogtail 2.0 来了;通义灵码下载量破百万丨阿里云云原生 2 月产品月报
|
3月前
阿里云云原生恭祝大家新年快乐!
阿里云云原生恭祝大家新年快乐!
|
4月前
|
Cloud Native 关系型数据库 分布式数据库
阿里云瑶池助力九州通B2B电商平台,完成100%云原生架构升级
九州通数字化转型,通过引入阿里云云原生数据库PolarDB,云原生内存数据库Tair等产品,完美支撑了医药电商平台数据库100%云原生化,实现了统一、高效、标准化和可跟踪的B2B医药平台。
385 4