备案控制台

开发者社区云原生 Serverless 正文

函数计算FC尝试跑 SDXL，直接报错了，目前函数计算是不是不支持 SDXL？

函数计算FC尝试跑 SDXL，直接报错了，目前函数计算是不是不支持 SDXL？torch.cuda.OutOfMemoryError: CUDA out of memory. Tried to allocate 390.00 MiB (GPU 0; 22.05 GiB total capacity; 21.33 GiB already allocated; 53.12 MiB free; 21.70 GiB reserved in total by PyTorch) If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation. See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF

展开

收起

三分钟热度的鱼 2023-08-15 13:47:17 356 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

算精通

北京阿里云ACE会长

函数计算（FC）本身并不直接支持 Synthetic Data XL (SDXL)。SDXL 是一种基于 PyTorch 的 Synthetic Data 扩展，它利用多个 GPU 和分布式计算资源来加速 Synthetic Data 的生成和训练过程。然而，函数计算的资源限制和运行环境的特性可能不适合直接运行 SDXL。

在您提供的错误信息中，报错信息为 "torch.cuda.OutOfMemoryError: CUDA out of memory"，表示在运行过程中 CUDA 内存不足。这是因为函数计算实例的资源限制，包括 GPU 内存的容量限制，无法满足 SDXL 所需的大规模模型训练和数据生成。

如果您希望在函数计算中利用 Synthetic Data 进行模型训练，可以考虑以下替代方案：

数据集缩减：减小输入数据集的规模，以减少内存占用。可以使用更小的图像尺寸、采样更少的数据样本等方式来降低内存需求。

单 GPU 训练：在函数计算实例上使用单个 GPU 进行训练，以适应较小的资源限制。可以调整模型大小、批处理大小和训练参数等，以确保在单个 GPU 上能够顺利运行。

分布式训练：如果您的任务要求更高的计算资源，可以考虑使用其他云平台的资源（如云服务器、容器服务等）进行分布式训练。这样可以充分利用多个 GPU 和计算节点来完成大规模 Synthetic Data 训练。

优化模型和算法：优化模型结构和算法，以减少模型对内存的需求。例如，减少模型的层数、参数量或使用更轻量级的模型架构。

2023-08-17 19:30:49

赞同展开评论
圆不溜秋的小猫猫

不支持，这个已经在测试了。此回答整理自钉群“【答疑群】函数计算 AIGC 场景技术交流”

2023-08-15 13:57:32

赞同展开评论

问答分类：

并行计算 Serverless PyTorch 算法框架/工具异构计算函数计算 GPU云服务器

问答标签：

函数计算函数计算函数计算报错函数计算fc函数计算报错函数计算 fc报错函数计算

问答地址：

开发者社区 > 云原生 > Serverless > 问答

相关问答

FC函数计算自定义运行时可以加入java 22吗？

106

1

0

函数计算FC完整的4o训练代码和基础模型，请问这个可以在fc部署吗？

93

1

0

在阿里函数计算中，调用阿里云百炼的应用，是不是一定要在函数计算FC里创建应用才能调用？

202

2

0

在函数计算FC为啥我的应用详情里面没有Serverless API 这个tab？

90

1

0

函数计算（FC）架构是如何解决提到的运维、弹性和成本问题的？

97

1

0

阿里云函数计算（FC）如何帮助用户解决北京冬奥会赛事直播视频实时处理的问题？

112

1

0

函数计算FC下的python需要多线程，如何设置FC的多线程支持？

160

1

0

函数计算这个异常怎么处理？FC Invoke End

81

1

0

使用serverless devs部署函数计算fc时，maven没有构建jar包文件，怎么回事？

112

0

0

通过serverless部署函数计算fc应用时如何配置maven构建？

100

1

0

云原生

Serverless

快速交付实现商业价值。

我要提问

相关文章

PyTorch 和 YOLO 是什么关系？一文讲清框架与模型的本质区别

从零实现3D Gaussian Splatting:完整渲染流程的PyTorch代码详解

从零开始用 PyTorch 训练你的第一个深度学习模型（完整教程）

openEuler 与 eBPF：精确定位 AI 程序 I/O 卡顿根因

具身机器人落地工厂 OpenAI联手亚马逊电力取代算力成AI新瓶颈

热门讨论

热门文章

函数计算一键部署ComfyUI绘画平台的优势有哪些？

请问主域名备案了，子域名还要备案吗？

在终端怎么升级python？

求助下大家，sd云端跑的时候报这个错误

如何利用阿里云AI唱歌

域名解析到国外ip没问题吧？

哪位大佬知道stable diffusion生成的图片存在哪个文件夹?

函数计算FC为什么会出现"Unexpected end of JSON input"的报错？

ots是啥我了解一下？

函数计算中, GPU应用突然就报错了，之前运行的好好的，这个错误有人遇到过吗？

展开全部

轻松搭建基于 SpringBoot + Vue 的 Web 商城应用

十分钟上线-函数计算玩转 WordPress

快速搭建 Serverless 实时按需图像处理服务

移植 Python 量化交易 TA-Lib 库到函数计算

Serverless在游戏、电商行业的一个运用场景示例

你还在生产环境改代码么？函数计算版本管理（一）版本和别名简介

Automated operation of Function Compute

阿里云发布新一代容器、Serverless等云原生产品，加速企业向现代IT架构演进

Aliyun Serverless VSCode Extension v1.13.0 发布

当 MCP 遇上 Serverless，AI 时代的最佳搭档

展开全部

还有其他疑问?