《2023云原生实战案例集》——01 汽车/制造——VIVO AI计算平台的ACK One混合云实践-阿里云开发者社区

《2023云原生实战案例集》——01 汽车/制造——VIVO AI计算平台的ACK One混合云实践

2023-05-22 387

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 《2023云原生实战案例集》——01 汽车/制造——VIVO AI计算平台的ACK One混合云实践

客户简介

vivo是一家以设计驱动创造产品/以智能终端和智慧服务为核心的科技公司。

客户痛点

•资源交付周期长：此前使用自建机房/新增资源的采购流程复杂/周期长/无法及时响应业务临时的大量算力需求,例如大规模参数模型的训练和在线服务的节假日活动扩容。同时由于服务器供应链形势严峻,网卡、硬盘、GPU卡等硬件设备都缺货/采购交付存在较大风险。

•需要更高性能的基础设施：AI计算平台对网络、存储有更高的性能要求/在私有IDC 里落地需要很高的时间和金钱成本。

方案亮点

采用ACK One方案，将云主机当做裸金属/物理机，加入到客户自有容器集群，集群使用人员体验感无差异，无需额外开发。云主机通过客户云平台申请，不改变当前资源申请流程。

实施简单，成本低：客户原有集群无需改动，功能兼容，无需额外开发。

提供一致性的体验：将云主机加入集群的流程和物理机基本一致。先通过公司云平台申请云主机，然后通过自动化平台将云主机初始化并加到集群中。

提供更好的混合云网络：Kubernetes的容器网络要求pod和pod、pod和宿主机之间通讯正常。该平台采用了 CaUco+Te「vvay的网络方案，主要表现为在客户机房内的工作节点采用CaLico BGP,阿里云上的工作节点采用Terway共享网卡模式，以获取更好的性能。

建设成果

通过ACK One混合云的能力，该平台可将阿里云上的GPU主机加入到客户自有集群，提供给用户在深度学习训练平台上使用，及时满足业务的算力需求。用户的使用习惯和之前保持一致。公共云资源根据不同业务的情况，使用周期在一个月到数个月。使用费用大大低于自行采购物理机的费用，有效降低成本。

相关实践学习

深入解析Docker容器化技术

Docker是一个开源的应用容器引擎，让开发者可以打包他们的应用以及依赖包到一个可移植的容器中，然后发布到任何流行的Linux机器上，也可以实现虚拟化，容器是完全使用沙箱机制，相互之间不会有任何接口。Docker是世界领先的软件容器平台。开发人员利用Docker可以消除协作编码时“在我的机器上可正常工作”的问题。运维人员利用Docker可以在隔离容器中并行运行和管理应用，获得更好的计算密度。企业利用Docker可以构建敏捷的软件交付管道，以更快的速度、更高的安全性和可靠的信誉为Linux和Windows Server应用发布新功能。在本套课程中，我们将全面的讲解Docker技术栈，从环境安装到容器、镜像操作以及生产环境如何部署开发的微服务应用。本课程由黑马程序员提供。     相关的阿里云产品：容器服务 ACK 容器服务 Kubernetes 版（简称 ACK）提供高性能可伸缩的容器应用管理能力，支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力，打造云端最佳容器化应用运行环境。了解产品详情: https://www.aliyun.com/product/kubernetes

《2023云原生实战案例集》——01 汽车/制造——VIVO AI计算平台的ACK One混合云实践

云原生

热门文章

最新文章

相关产品

相关课程

相关电子书

推荐镜像