免责声明:
- 阿里云不对第三方模型的合法性、安全性、准确性进行任何保证,阿里云不对由此引发的任何损害承担责任。
- 您应自觉遵守第三方模型的用户协议、使用规范和相关法律法规,并就使用第三方模型的合法性、合规性自行承担相关责任。
本实验指导您如何基于容器服务ACK,使用云原生AI套件实现文生图模型Stable Diffusion微调。体验在容器Kubernetes平台上实现模型训练和推理。
背景知识
容器服务 Kubernetes 版(简称 ACK)提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理;2021年成为国内唯一连续三年入选Gartner公共云容器报告的产品,2022年国内唯一进入Forrester领导者象限。其整合了阿里云虚拟化、存储、网络和安全能力,助力企业高效运行云端Kubernetes容器化应用。
基于标准 Kubernetes,通过可组装、可扩展架构,加速AI平台构建,提高资源效率和交付速度。在公共云,专有云,混合云,以及边缘场景下,均可实现统一运维CPU、GPU、NPU等异构算力,高效调度AI和大数据作业,加速数据访问和计算,管理AI任务生命周期,全栈优化AI工程效率。
GPU 云服务器(GPU Cloud Computing,GPU)是提供 GPU 算力的弹性计算服务,具有超强的计算能力,服务于深度学习、科学计算、图形可视化、视频处理多种应用场景。
阿里云资源编排服务(Resource Orchestration Service 简称 ROS)是一种简单易用的云计算资源自动化部署服务。用户可以通过使用Json/Yaml格式的模版描述多个云计算资源(如ECS、RDS、SLB)的配置、依赖关系等,并自动完成所有云资源在多个不同地域以及多个账户中的部署和配置,实现基础设施即代码。