函数计算fc-stable-diffusion-v3 部署失败,怎么解决?

函数计算fc-stable-diffusion-v3 部署失败,怎么解决?a2d5a0774e0a7485c9d8bcecc966f4d6.png

展开
收起
三分钟热度的鱼 2024-03-13 18:24:20 49 分享 版权
阿里云 AI 助理回答

函数计算 FC 部署 fc-stable-diffusion-v3 应用失败可能由多种原因引起。以下是根据知识库资料总结的常见问题及其解决方案,您可以根据实际情况逐一排查并解决问题。


1. 检查模型上传问题

现象

  • 应用启动时出现以下错误信息:
    • Can't run without a checkpoint. Find and place a .ckpt or .safetensors file into any of those locations. The program will exit.
    • Function instance health check failed on port 7860 in 120 seconds.

原因

  • 未上传模型文件。
  • 上传的模型文件后缀不正确(例如,不是以 .ckpt 结尾)。

解决方案

  1. 上传模型
    • 确保已上传正确的模型文件。可以通过一键部署功能上传模型,具体操作请参考相关文档。
  2. 检查模型后缀
    • 登录 KodBox 页面,确认模型是否成功上传,并检查模型文件后缀是否为 .ckpt
    • 如果从 Hugging Face 下载的模型后缀为 .txt,需手动修改为 .ckpt

2. 检查账户欠费问题

现象

  • 启动应用时出现以下错误信息:
    {"ErrorCode":"InvalidArgument","ErrorMessage":"Mount NFS:xxxxx-jlb79.cn-hangzhou.nas.aliyuncs.com:/fc-stable-diffusion-plus command failed with output = mount.nfs: Connection reset by peer\n, please make sure that the nas mount point address is correct and is accessible from the service VPC"}
    

原因

  • 当前账号存在欠费,导致 NAS 文件系统挂载失败。

解决方案

  • 检查当前账号余额,确保账户无欠费状态。
  • 充值后重试应用启动。

3. 检查 KodBox 是否存在隐藏目录

现象

  • 应用启动失败,但无明确错误提示。

原因

  • 模型文件所在目录中存在隐藏目录(如 .kodbox-1.35.031),干扰了应用的正常启动。

解决方案

  1. 登录函数实例,进入命令行操作界面。
  2. 执行以下命令,检查是否存在隐藏目录:
    cd /mnt/auto/sd
    ls -a
    
  3. 如果发现隐藏目录(如 .kodbox-1.35.031),执行以下命令删除:
    rm -rf .kodbox-1.35.031
    
  4. 重新安装应用并重启 KodBox。

4. 检查 KodBox 页面是否关闭

现象

  • 启动应用时出现以下错误信息:
    Stable diffusion model failed to load, exiting
    

原因

  • 模型未正常上传或 KodBox 页面未关闭,导致服务启动失败。

解决方案

  1. 确认模型上传
    • 至少上传一个符合要求的模型文件,并检查模型名称和大小是否正确。
  2. 关闭 KodBox 页面
    • 上传模型后,关闭 KodBox 页面,然后重新启动 Stable Diffusion 服务。

5. 检查 GPU 函数镜像加速状态

现象

  • 应用启动后无法正常使用,可能是镜像加速未完成。

原因

  • GPU 函数镜像加速未准备好,导致服务无法正常运行。

解决方案

  1. 登录函数计算控制台,进入应用详情页面。
  2. 在“环境详情”页签中,找到目标函数(如 sd)。
  3. 检查“镜像加速准备状态”,等待状态变更为“可用”。

6. 检查网络配置

现象

  • 应用启动失败,报错信息涉及网络连接问题。

原因

  • 专有网络 VPC 或 NAS 文件存储配置错误,导致服务无法访问资源。

解决方案

  1. 确认 VPC 配置是否正确,确保函数计算能够通过私网访问 NAS 文件存储。
  2. 检查 NAS 挂载点地址是否正确,并确保其在服务 VPC 中可访问。

7. 检查插件安装问题

现象

  • 无法在线安装插件。

原因

  • 容器镜像部署存在安全限制,不允许在线安装插件。

解决方案

  1. 将插件下载到本地。
  2. 通过管理后台将插件上传至 extensions 目录。
  3. 如果需要通过 WebUI 界面使用 URL 安装插件,请自行定制 Docker 镜像并修改相关参数。

8. 联系技术支持

如果以上方法均无法解决问题,建议联系阿里云技术支持团队,提供详细的错误日志和部署信息,以便进一步排查问题。


重要提醒
- 模型合法性:请确保使用的第三方模型符合相关法律法规,并遵守开源协议,避免商业化过程中可能存在的风险。
- 费用说明:部署 Stable Diffusion 可能涉及 GPU、NAS、OSS 等资源的费用,请提前了解计费规则并确保账户余额充足。

希望以上内容能够帮助您快速定位并解决部署失败的问题!您可以复制页面截图提供更多信息,我可以进一步帮您分析问题原因。

有帮助
无帮助
AI 助理回答生成答案可能存在不准确,仅供参考
0 条回答
写回答
取消 提交回答

快速交付实现商业价值。

还有其他疑问?
咨询AI助理