客户背景
小鹏汽车成立于2014年,是一家专注未来出行的科技公司。一直坚持饱和式研发投入,构建全栈自研的核心能力,今天小鹏汽车已经成为中国领先的智能电动汽车公司之一。
客户痛点
数据处理链路复杂:自动驾驶车联网数据链路长且数据增长快,因此数据时效性要求高。
自动驾驶 AI 服务资源利用率低:缺乏有效的 AI 模型 GPU 训练和推理优化。
可观测系统不完善:前端 Web 和后端服务缺乏有效的监控和分析,同时自建 Prometheus 稳定性不佳。
支撑平台技术栈复杂:技术平台需要支持多种业务,并且需要建设如 Workflow CI 工作流、SRE 等工具平台,技术栈较为复杂。
方案亮点
阿里云云原生产品支持了小鹏汽车多个业务的技术平台建设。小鹏数据处理、AI 训练与推理服务、工作流、SRE 运维设施均通过 ACK 统一容器技术栈进行承载。
弹性算力支持复杂数据处理:通过容器服务 ACK 运行数据处理和数据脱敏任务,容器为实时任务提供了弹性算力。
提升训练和仿真资源利用率 :ACK 云原生 AI 套件支持了小鹏自动驾驶大规模训练和仿真任务的调度和管理,提高了训练和仿真资源的利用率。同时,AI 套件还支持了小鹏互联网技术中台和鹏行业务的 NLP、ASR 等推理业务。ACK GPU 共享调度和隔离能力,成倍地提高了 GPU 资源的利用率。
全链路可观测保障业务稳定:小鹏基于托管在 ACK 上的全量业务,采用 ARMS Prometheus 服务、前端监控和 APM 等工具实现全链路监控系统,有效洞察业务稳定性风险,保障业务稳定性。
统一云原生技术栈简化运维:除了通过容器服务 ACK 支持仿真、音视频转码、视频截图、图片处理、数据处理等相关业务外,小鹏还支持 Airflow/Argo workflow、Kubeflow/Arena 等工作流平台。采用统一的技术栈运行各业务及其支撑系统,简化了运维的复杂度。
客户证言
“小鹏汽车和阿里云携手共建自动驾驶智算中心‘扶摇’, 为小鹏全场景智能辅助驾驶系统的训练奠定算力基础,我们相信跟阿里云一起能够更快更好更强的发挥作用。阿里云的技术支持, 使我们的成本降低,在过去及未来的时间里,阿里云的可靠性和稳定性,都是小鹏汽车最好的选择。”
相关产品
阿里云容器服务ACK(Alibaba Cloud Container Service for Kubernetes)
阿里云容器镜像服务ACR(Alibaba Cloud Container Registry
阿里云监控服务 Prometheus(Aliyun Cloud Monitor Prometheus)
阿里云实时监控服务(ARMS)