货拉拉使用 ACK 轻松应对容器管理难题,实现精细化成本治理

简介: 货拉拉已应用100%容器化,这是全面云原生转型的第一步。通过建设坚实的容器基础设施,货拉拉为容灾系统建设、大数据云原生化、混部系统建设等奠定了坚实的基础。

客户背景

货拉拉于2013年创立,成长于粤港澳大湾区,是一家从事同城/跨城货运、企业版物流服务、搬家、零担、汽车租售及车后市场服务的互联网物流商城。

客户痛点

  • 自建集群稳定性差:货拉拉内部运行大量微服务系统,错综复杂,对 Kubernetes 稳定性要求高。自建容易出现稳定性问题,运维成本高。
  • IT成本治理难:IT 成本治理往往需要对 Kubernetes 进行扩展。基于容器的能力构建需要进行一些核心能力的定制开发,比如在调度器、监控数据链路等方面的扩展,自建难以推进这些扩展。

核心系统无备份容灾:由于应用架构复杂,很多系统没有单元化,核心系统容灾备份系统建设难。

方案亮点

  • 简化云运维复杂度:货拉拉基于阿里云容器服务 ACK,已经将大部分应用进行了容器化改造并迁移。容器服务 ACK 提供了高可靠稳定的基础设施,与裸金属实例、SLB、ALB/NLB 和 SLB 的集成,极大地简化了用云复杂度。
  • 提供多种工具优化成本治理:容器服务 ACK 帮助用户在使用裸金属实例时,能够直达物理性能。同时,通过 ACK 差异化 SLO koordinator 容器调度,进行 cpuset 调度、绑核和负载感知调度等,有效地提升了应用性能和节点资源利用率。货拉拉业务具有明显的波峰波谷特征,同城货运白天高峰期比较稳定,晚上低峰期流量会降低。用户可以通过 HPA 和 CronHPA 进行定时扩缩容,满足这类可预期的弹性场景。结合 ACK 提供的监控数据链路,货拉拉实现了容器成本的计量和分账,有效地管理各团队用云成本。

核心系统异地备份:通过 ACK 备份中心,实现货拉拉在 ACK 中运行的核心系统的异地备份,并通过 ACR EE 实现跨 Region 镜像同步。
image.png

建设成果

  • 稳定、低成本的容器基础设施:货拉拉使用阿里云容器服务,极大地增加了资源弹性能力和稳定性,实现了增效降本,成为稳定且低成本的容器基础设施。
  • 为全面云原生转型奠定坚实基础:货拉拉已应用100%容器化,这是全面云原生转型的第一步。通过建设坚实的容器基础设施,货拉拉为容灾系统建设、大数据云原生化、混部系统建设等奠定了坚实的基础。

相关产品

阿里云容器服务ACK(Alibaba Cloud Container Service for Kubernetes)
阿里云容器镜像服务ACR(Alibaba Cloud Container Registry

相关实践学习
深入解析Docker容器化技术
Docker是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的Linux机器上,也可以实现虚拟化,容器是完全使用沙箱机制,相互之间不会有任何接口。Docker是世界领先的软件容器平台。开发人员利用Docker可以消除协作编码时“在我的机器上可正常工作”的问题。运维人员利用Docker可以在隔离容器中并行运行和管理应用,获得更好的计算密度。企业利用Docker可以构建敏捷的软件交付管道,以更快的速度、更高的安全性和可靠的信誉为Linux和Windows Server应用发布新功能。 在本套课程中,我们将全面的讲解Docker技术栈,从环境安装到容器、镜像操作以及生产环境如何部署开发的微服务应用。本课程由黑马程序员提供。     相关的阿里云产品:容器服务 ACK 容器服务 Kubernetes 版(简称 ACK)提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力,打造云端最佳容器化应用运行环境。 了解产品详情: https://www.aliyun.com/product/kubernetes
相关文章
|
5月前
|
存储 Kubernetes 网络安全
关于阿里云 Kubernetes 容器服务(ACK)添加镜像仓库的快速说明
本文介绍了在中国大陆地区因网络限制无法正常拉取 Docker 镜像的解决方案。作者所在的阿里云 Kubernetes 集群使用的是较旧版本的 containerd(1.2x),且无法直接通过 SSH 修改节点配置,因此采用了一种无需更改 Kubernetes 配置文件的方法。通过为 `docker.io` 添加 containerd 的镜像源,并使用脚本自动修改 containerd 配置文件中的路径错误(将错误的 `cert.d` 改为 `certs.d`),最终实现了通过多个镜像站点拉取镜像。作者还提供了一个可重复运行的脚本,用于动态配置镜像源。虽然该方案能缓解镜像拉取问题,
586 2
|
人工智能 弹性计算 运维
ACK Edge与IDC:高效容器网络通信新突破
本文介绍如何基于ACK Edge以及高效的容器网络插件管理IDC进行容器化。
|
存储 监控 对象存储
ACK 容器监控存储全面更新:让您的应用运行更稳定、更透明
针对本地存储和 PVC 这两种容器存储使用方式,我们对 ACK 的容器存储监控功能进行了全新升级。此次更新完善了对集群中不同存储类型的监控能力,不仅对之前已有的监控大盘进行了优化,还针对不同的云存储类型,上线了全新的监控大盘,确保用户能够更好地理解和管理容器业务应用的存储资源。
690 262
|
Prometheus Kubernetes 监控
OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性
聚焦近日OpenAI的大规模K8s集群故障,介绍阿里云容器服务与可观测团队在大规模K8s场景下我们的建设与沉淀。以及分享对类似故障问题的应对方案:包括在K8s和Prometheus的高可用架构设计方面、事前事后的稳定性保障体系方面。
|
存储 运维 Kubernetes
正式开源,Doris Operator 支持高效 Kubernetes 容器化部署方案
飞轮科技推出了 Doris 的 Kubernetes Operator 开源项目(简称:Doris Operator),并捐赠给 Apache 基金会。该工具集成了原生 Kubernetes 资源的复杂管理能力,并融合了 Doris 组件间的分布式协同、用户集群形态的按需定制等经验,为用户提供了一个更简洁、高效、易用的容器化部署方案。
616 16
正式开源,Doris Operator 支持高效 Kubernetes 容器化部署方案
|
12月前
|
人工智能 Prometheus 监控
容器化AI模型的监控与治理:确保模型持续稳定运行
在前几篇文章中,我们探讨了AI模型的容器化部署及构建容器化机器学习流水线。然而,将模型部署到生产环境只是第一步,更重要的是确保其持续稳定运行并保持性能。为此,必须关注容器化AI模型的监控与治理。 监控和治理至关重要,因为AI模型在生产环境中面临数据漂移、概念漂移、模型退化和安全风险等挑战。全面的监控涵盖模型性能、数据质量、解释性、安全性和版本管理等方面。使用Prometheus和Grafana可有效监控性能指标,而遵循模型治理最佳实践(如建立治理框架、定期评估、持续改进和加强安全)则能进一步提升模型的可信度和可靠性。总之,容器化AI模型的监控与治理是确保其长期稳定运行的关键。
|
11月前
|
存储 监控 对象存储
ACK 容器监控存储全面更新:让您的应用运行更稳定、更透明
ACK 容器监控存储全面更新:让您的应用运行更稳定、更透明
319 0
ACK 容器监控存储全面更新:让您的应用运行更稳定、更透明
|
12月前
|
存储 监控 对象存储
ACK 容器监控存储全面更新:让您的应用运行更稳定、更透明
ACK 容器监控存储全面更新:让您的应用运行更稳定、更透明
244 1
|
12月前
|
监控 Kubernetes Cloud Native
基于阿里云容器服务Kubernetes版(ACK)的微服务架构设计与实践
本文介绍了如何基于阿里云容器服务Kubernetes版(ACK)设计和实现微服务架构。首先概述了微服务架构的优势与挑战,如模块化、可扩展性及技术多样性。接着详细描述了ACK的核心功能,包括集群管理、应用管理、网络与安全、监控与日志等。在设计基于ACK的微服务架构时,需考虑服务拆分、通信、发现与负载均衡、配置管理、监控与日志以及CI/CD等方面。通过一个电商应用案例,展示了用户服务、商品服务、订单服务和支付服务的具体部署步骤。最后总结了ACK为微服务架构提供的强大支持,帮助应对各种挑战,构建高效可靠的云原生应用。
|
12月前
|
弹性计算 人工智能 资源调度
DeepSeek大解读系列公开课上新!阿里云专家主讲云上智能算力、Kubernetes容器服务、DeepSeek私有化部署
智猩猩「DeepSeek大解读」系列公开课第三期即将开讲,聚焦阿里云弹性计算助力大模型训练与部署。三位专家将分别讲解智能算力支撑、Kubernetes容器服务在AI场景的应用实践、以及DeepSeek一键部署和多渠道应用集成,分享云计算如何赋能大模型发展。欲观看直播,可关注【智猩猩GenAI视频号】预约。 (239字符)

相关产品

  • 容器服务Kubernetes版
  • 推荐镜像

    更多