云快充云原生稳定性建设之路

本文涉及的产品
容器服务 Serverless 版 ACK Serverless,952元额度 多规格
容器镜像服务 ACR,镜像仓库100个 不限时长
容器服务 Serverless 版 ACK Serverless,317元额度 多规格
简介: “在阿里云的帮助下,云快充通过全面容器化与稳定性建设,极大地促进了业务的快速迭代。希望新能源行业的其他技术团队可以和我们一起共同探索云原生稳定性方面的技术路径。”

客户背景

云快充成立于2016年,以充电服务和能源管理为核心,业务涵盖九个方向。截止到2022年11月,业务覆盖370个城市,接入电桩运营商 7400人,接入充电终端31万家,与640个桩企达成合作。

客户痛点

为确保业务的稳定运行,自2019年起,云快充采用百分百容器化的技术路线。然而,在容器化改造的过程中,云快充遇到了两个挑战:
自建 Kubernetes 集群维护困难: Kubernetes 是一个大型复杂的分布式系统,云快充曾经遇到过节点异常、Pod 异常、网络不通、etcd 性能瓶颈等问题,解决这些问题非常耗费精力,尤其是遇到 Kubernetes 本身的 bug 时更是无能为力。
业务变更带来稳定性风险:随着微服务架构的不断演进,业务变更越来越频繁。由于应用上下线不够优雅以及缺少精细化和灰度策略,80%以上的线上业务故障都与版本发布有关。

方案亮点

高稳定性的托管版 Kubernetes 集群:容器服务 ACK 在确保 API 和标准完全兼容开源 Kubernetes 的前提下,提供了一系列稳定性提升手段,如 master 节点托管、智能巡检诊断、跨可用区的高可用等等。这些手段都经过阿里双十一大规模场景和阿里云大型客户的实战验证,升级集群版本也变得足够简单。
基于 eBPF 技术的应用诊断技术:一键开启应用诊断能力,不需要对应用进行任何修改。它提供全局视角的应用拓扑,并从请求数、错误数、延误三个黄金指标出发,发现异常的服务个体。
通过微服务治理实现应用稳定性提升:采用基于 Java-Agent 字节码增强的技术,实现无侵入式微服务治理增强,让微服务应用获得无损上下线和全链路灰度能力,从而将版本发布对正常业务的影响降到最低。

image.png

建设成功

生产事故率显著降低:云快充在一条业务线上落地了全链路灰度技术,将应用变更导致的生产事故降低了70%,后续还会将这项技术推广到整个企业。
业务高峰期系统稳定运行:从网关到微服务应用,到第三方依赖,每一层都配置流量防护规则,确保在业务高峰期不会有任何系统被用户流量所压垮。
研发效率提升:通过云原生稳定性建设,云快充接入的电桩数量完成了20万到30万的增长,平均需求迭代周期从7日降低到4日,极大地促进了业务的快速迭代。

客户证言

“在阿里云的帮助下,云快充通过全面容器化与稳定性建设,极大地促进了业务的快速迭代。希望新能源行业的其他技术团队可以和我们一起共同探索云原生稳定性方面的技术路径。”

相关产品

阿里云容器服务ACK(Alibaba Cloud Container Service for Kubernetes)
阿里云实时监控服务(ARMS)

相关实践学习
通过Ingress进行灰度发布
本场景您将运行一个简单的应用,部署一个新的应用用于新的发布,并通过Ingress能力实现灰度发布。
容器应用与集群管理
欢迎来到《容器应用与集群管理》课程,本课程是“云原生容器Clouder认证“系列中的第二阶段。课程将向您介绍与容器集群相关的概念和技术,这些概念和技术可以帮助您了解阿里云容器服务ACK/ACK Serverless的使用。同时,本课程也会向您介绍可以采取的工具、方法和可操作步骤,以帮助您了解如何基于容器服务ACK Serverless构建和管理企业级应用。 学习完本课程后,您将能够: 掌握容器集群、容器编排的基本概念 掌握Kubernetes的基础概念及核心思想 掌握阿里云容器服务ACK/ACK Serverless概念及使用方法 基于容器服务ACK Serverless搭建和管理企业级网站应用
相关文章
|
3月前
|
Cloud Native 关系型数据库 分布式数据库
掌阅科技采用云原生数据库PolarDB,大幅降低使用成本,提升业务稳定性和扩展性
掌阅科技将数据库迁移到PolarDB后,数据压缩到之前的30%,整体成本节省50%。
155 0
|
运维 Kubernetes Cloud Native
《云原生架构容器&微服务优秀案例集》——05 金融—— 费芮互动 通过 MSE 完成移动支付应用稳定性和安全性双提升
《云原生架构容器&微服务优秀案例集》——05 金融—— 费芮互动 通过 MSE 完成移动支付应用稳定性和安全性双提升
276 0
《云原生架构容器&微服务优秀案例集》——05 金融—— 费芮互动 通过 MSE 完成移动支付应用稳定性和安全性双提升
|
Prometheus Kubernetes 监控
《云原生架构容器&微服务优秀案例集》——02 汽车/制造——云快充 云原生稳定性建设之路
《云原生架构容器&微服务优秀案例集》——02 汽车/制造——云快充 云原生稳定性建设之路
201 0
|
Prometheus Kubernetes 监控
《2023云原生实战案例集》——01 汽车/制造——云快充 云原生稳定性建设之路
《2023云原生实战案例集》——01 汽车/制造——云快充 云原生稳定性建设之路
|
运维 Kubernetes Cloud Native
《2023云原生实战案例集》——05 金融服务——费芮互动 通过MSE完成移动支付应用,稳定性和安全性双提升
《2023云原生实战案例集》——05 金融服务——费芮互动 通过MSE完成移动支付应用,稳定性和安全性双提升
|
存储 运维 监控
数据密集型系统的云原生架构与稳定性保障
本文是参加QCon全球软件开发大会(2023·北京站)专题分享后的一些总结。参加此次大会的最大感受是疫情后的快速恢复,到现场的听众座无虚席,一些场次甚至出现无座。同时也学习了其他多个专题分享,总体感觉是整个大会专业度很高,无论是从专题分享的内容、还是Q&A环节的听众互动。
250 0
数据密集型系统的云原生架构与稳定性保障
|
7天前
|
Kubernetes Cloud Native 持续交付
云原生技术浪潮下的微服务架构实践
在数字化转型的今天,云原生技术成为推动企业IT革新的关键力量。本文将通过浅显易懂的语言和实际案例,带领读者了解云原生的核心概念、微服务架构的设计原则以及如何在云平台上高效部署和管理微服务。我们将从基础概念出发,逐步深入到微服务的生命周期管理,探讨如何在云原生生态中实现快速迭代和持续交付。无论你是云原生技术的初学者,还是希望深化理解的开发者,这篇文章都将为你提供有价值的指导和思考。
|
1天前
|
机器学习/深度学习 分布式计算 Cloud Native
云原生架构下的高性能计算解决方案:利用分布式计算资源加速机器学习训练
【8月更文第19天】随着大数据和人工智能技术的发展,机器学习模型的训练数据量和复杂度都在迅速增长。传统的单机训练方式已经无法满足日益增长的计算需求。云原生架构为高性能计算提供了新的可能性,通过利用分布式计算资源,可以在短时间内完成大规模数据集的训练任务。本文将探讨如何在云原生环境下搭建高性能计算平台,并展示如何使用 PyTorch 和 TensorFlow 这样的流行框架进行分布式训练。
7 2
|
2天前
|
Cloud Native API 云计算
云原生架构:企业数字化转型的催化剂
【8月更文挑战第18天】在数字化浪潮不断推进的今天,云原生技术已成为推动企业IT转型的核心力量。通过深入探讨云原生架构的基本原理、优势以及实施策略,本文旨在为企业提供一个清晰的云原生应用路线图,帮助它们在竞争激烈的市场环境中获得灵活性和创新能力。文章将详细阐述云原生如何助力企业实现资源的最优配置,加速产品上市时间,并提高系统的可维护性和扩展性。