最近 AI 生图圈子里流行一种玩法:把自家宠物、喜欢的角色甚至表情包,用 AI 生成超写实毛绒玩具风格。效果大概是这样——毛茸茸的质感、圆润的比例、微微反光的塑料眼珠,萌得让人想立刻下单实物。
但玩过 ComfyUI 的人都知道,本地部署的门槛不低:显卡要够好(至少 8G 显存)、环境配置一堆坑、还得忍受风扇起飞般的噪音。更别提那些只是想偶尔生成几张图试试水的朋友——为了一时的兴趣配一台高配机器,怎么看都不划算。
最近发现阿里云的函数计算(FC)推出了一键部署 ComfyUI 的方案,内置 Flux 模型 + Lora,按量付费、免运维、不开机不花钱。正好适合我们这种不想折腾又想尝鲜的人。这个方案的入口在这里,有兴趣可以先去瞄一眼:阿里云函数计算(FC)一键部署 ComfyUI。
下面我从零开始,完整记录一下部署和使用过程。
一、为什么选 Serverless GPU?
在动手之前,先聊聊选型逻辑——为什么不用传统的 GPU 云服务器?
| 维度 | 传统 GPU 服务器 | 函数计算 Serverless GPU |
|---|---|---|
| 启动成本 | 包月几百起步 | 按调用付费,不调用不花钱 |
| 运维 | 自己装驱动、配环境、打补丁 | 平台托管,免运维 |
| 弹性 | 固定配置,扩容需手动 | 自动弹性,波峰波谷自适应 |
| 冷启动 | 无(一直开着) | 首次约 60s,后续秒级 |
| 适用场景 | 7×24 持续训练/推理 | 间歇性使用、调试、Demo |
对于"偶尔生成几张图""做个 Demo 验证想法""不想维护服务器"这类场景,Serverless GPU 的成本优势非常明显:
- AI 生图(512×512, Flux 模型):0.02~0.2 元/张
- AI 语音生成(3~8s 语音复刻):0.017~0.045 元/次
对比包一台 GPU 服务器每月大几百到上千的成本,按量付费让个人开发者也能低成本玩转大模型。
二、实战:部署毛绒萌宠 AI 生图应用
Step 1:开通函数计算服务
登录阿里云控制台,进入函数计算。如果之前没用过,首次开通是免费的(只在实际调用时产生费用)。
Step 2:一键部署 ComfyUI 应用
在函数计算控制台,找到"AI 应用"或"模板应用",搜索 ComfyUI。阿里云提供了预置的工作流模板——内置了 Flux 模型和专门的毛绒萌宠 Lora,不需要自己下载模型、调参数。
选择部署后,函数计算会自动完成以下操作:
创建流程(自动):
1. 分配 GPU 实例(16GB GPU + 8核 vCPU + 32GB 内存)
2. 加载 Flux 基础模型
3. 挂载毛绒萌宠 Lora 权重
4. 配置 ComfyUI WebUI 访问入口
5. 输出公网访问地址
整个过程大约 3-5 分钟,你什么都不用做,等着就行。
Step 3:打开 ComfyUI,开始生图
部署完成后会得到一个公网访问地址,浏览器打开就是 ComfyUI 的界面。工作流已经预设好了——一个完整的"文生图→Lora 风格化→输出"管线。
关键参数参考:
模型: Flux.1-dev
Lora: plush_toy_v2 (权重 0.8)
分辨率: 512×512 (出图快) 或 768×768 (细节多)
采样步数: 20-30
提示词引导系数 (CFG): 4.0-7.0
一个实测可用的提示词示例:
A cute fluffy plush toy of a golden retriever puppy, ultra-realistic plush texture, soft fuzzy fur material, round shiny plastic eyes, sitting pose, studio lighting, white background, 8k resolution, plush toy photography
生成一张图大约 5 秒(热启动),效果相当惊艳——毛绒的纹理、缝合线、微微的反光都处理得很自然。
Step 4:用完记得关(省钱技巧)
这是 Serverless 模式最需要注意的一点:函数计算是按调用量和 GPU 使用时长计费的。如果你的 ComfyUI 实例一直开着 WebUI 但不生图,实例会在一段时间无调用后自动缩容到零(具体超时时间看配置),所以一般不需要手动关。
但如果你设置了较长的实例保留时间,建议在控制台手动停止不用���实例,避免产生不必要的预留费用。
三、进阶:AI 语音复刻
页面里还有一个很有意思的应用——基于 GPT-Sovits 的声音复刻。
原理不复杂:上传一小段目标人物的语音样本(3-8 秒就够),模型提取声纹特征后,就能用这个声音读任意文本。这在内容创作、虚拟主播、个性化语音助手等场景都有实际应用。
成本也非常低:冷启动约 0.045 元/次,活跃调用约 0.017 元/次。也就是说,花不到 5 分钱就能复刻一个声音。
四、成本实测
我跑了一轮完整测试,记录如下:
| 操作 | 调用次数 | 单价 | 费用 |
|---|---|---|---|
| 毛绒萌宠生图(冷启动) | 1 次 | ~0.2 元 | 0.2 元 |
| 毛绒萌宠生图(热调用 ×50) | 50 次 | ~0.02 元 | 1.0 元 |
| 语音复刻(8s 冷启动) | 1 次 | 0.045 元 | 0.045 元 |
| 语音复刻(3s 热调用 ×10) | 10 次 | 0.017 元 | 0.17 元 |
| 合计 | — | — | 1.415 元 |
一块五不到,体验了全套 AI 生图 + 语音复刻。这个成本对于个人开发者来说几乎可以忽略不计。
五、还能玩什么?
同一个页面里,除了生图和语音,还有其他几个值得一试的应用:
- 通义千问文生文:输入主题,自动生成文章大纲或广告文案,适合内容创作者
- 通义灵码:AI 编码助手,根据上下文预测并补全代码,支持主流 IDE
- 多模态信息处理:图文识别 + 内容生成,适合教育和知识管理场景
这些应用都是同样的 Serverless 架构,按量付费,不用了就不花钱。
总结
回想几年前,跑一个 Stable Diffusion 至少需要一块中高端显卡、折腾一晚上的环境配置、以及忍受持续不断的电费和风扇噪音。
现在的体验已经完全不同——打开网页、点几下按钮、等几分钟,就能用上最前沿的 AI 模型,而且成本低到可以忽略。
对于个人开发者和 AI 爱好者来说,Serverless GPU 确实把"尝鲜"的门槛降到了最低。如果你也想试试从零到一部署自己的 AI 应用,可以从这个入口开始:阿里云函数计算(FC)一键部署 ComfyUI。