直达最佳实践:【 弹性裸金属AI训练】
最佳实践频道:【点击查看更多上云最佳实践】
这里有丰富的企业上云最佳实践,从典型场景入门,提供一系列项目实践方案,降低企业上云门槛的同时满足您的需求!
场景描述
本方案适用于AI图片训练场景,尤其是对性能要求苛刻,业务交付紧迫的场景。例如自动驾驶的模型训练(图片)等AI模型训练的场景。本方案使用了SCC超级计算集群,采用弹性裸金属GPU服务器+并行文件系统CPFS+RDMA网络+阿里云容器服务Kubernetes版+飞天AI加速训练工具,提供极致性能稳定的训练环境,保障业务能力。
解决问题
- 搭建AI图片训练基础环境。
- 使用CPFS存储训练数据
- 使用飞天AI加速训练工具加速训练
- 使用Arena一键提交作业
产品列表
- 容器服务Kubernetes版
- CPFS
- 超级计算集群SCC
- 神龙GPU服务器