在函数计算FC部署Stable Diffusion启动失败原因是什么?

在函数计算FC部署Stable Diffusion启动失败原因是什么?

展开
收起
三分钟热度的鱼 2023-11-22 20:28:56 155 分享 版权
4 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    根据错误消息 Can't run without a checkpoint. Find and place a .ckpt or .safetensors file into any of those locations. The program will exit. 显示部署Stable Diffusion时遇到了Checkpoint文件缺失的问题。为了解决此问题,请确认:

    1. 模型是否包含了必要的ckpt或safetensors文件。
    2. 文件是否放置到了正确的目录中;
    3. 是否正确设置了环境变量;
    4. 网络状况是否良好;
    5. 按照官方文档中的配置完成相应配置。
    2023-11-23 14:06:56
    赞同 展开评论
  • 在函数计算FC部署Stable Diffusion启动失败的原因可能有多种。首先,如果报错信息为"Can't run without a checkpoint. Find and place a .ckpt or .safetensors file into any of the following directories:",这通常意味着没有找到检查点文件。在这种情况下,你需要找到一个.ckpt或.safetensors文件并将其放入指定的目录中。

    此外,其他常见的原因可能包括环境问题、依赖库问题等。例如,如果你的代码依赖于某些特定的Python模块或库,但在部署的环境中并没有安装这些模块或库,那么也可能会导致启动失败。在这种情况下,你可以尝试使用pip命令来升级或重新安装相应的模块或库。

    2023-11-23 09:13:42
    赞同 展开评论
  • 应用启动失败怎么办?https://help.aliyun.com/zh/fc/use-cases/faq-about-deploying-a-stable-diffusion-application?spm=a2c4g.11186623.0.0.15ec139aRNsbsl#section-30f-ht9-obk

    应用启动失败怎么办?
    检查上传的模型问题
    问题现象:应用启动时,出现下面的报错信息。

    Can't run without a checkpoint. Find and place a .ckpt or .safetensors file into any of those locations. The program will exit.

    Function instance health check failed on port 7860 in 120 seconds.

    问题原因:

    未上传模型:部署完Stable Diffusion服务后,没有上传模型,导致应用启动失败。

    当应用启动时,出现以下报错信息,请先排查模型是否没有上传。

    image.png
    模型后缀错误:上传的模型后缀不是以.ckpt结尾,导致应用启动失败。

    解决方案:

    上传模型:为了避免下载模型占用大量的时间,您可以直接上传对应的模型。具体操作,请参见一键部署Stable Diffusion。

    修改模型后缀:进入KodBox页面,确认是否已成功上传模型,并检查模型后缀是否为.ckpt。从huggingface源站下载的模型后缀为.txt,需手动修改为.ckpt。

    2023-11-23 09:03:06
    赞同 1 展开评论
  • 启动失败原因一:
    报错内容为 Can't run without a checkpoint. Find and place a .ckpt or .safetensors file into any of those locations. The program will exit. 此问题导致原因是由于部署完服务后未上传模型,导致的启动失败,可以参考如何用 Serverless 一键部署 Stable Diffusion中操作步骤将模型先上传再进行使用。

    启动失败原因二:
    如果您将模型上传后打开Stable Diffusion服务中没有上传的模型或同原因一启动超时,请检查上传的模型后缀是否正确,模型后缀要求为 .ckpt 结尾。在 KodBox 中下载完的模型地址后缀为 txt,您需要手动修改为 ckpt。
     
    启动失败原因三:
    如果您已正确上传模型后仍然启动失败报如下错误,请检查当前账号是否有欠费,如有欠费需充值恢复正常后使用。
    欠费原因可能由于使用Stable Diffusion服务中有用NAS服务但您并没有领取NAS试用额度,您可以在免费试用领取NAS试用额度。

    费用账单详情可以参考【为什么扣费】回答查看。
    {"ErrorCode":"InvalidArgument","ErrorMessage":"Mount NFS:xxxxx-jlb79.cn-hangzhou.nas.aliyuncs.com:/fc-stable-diffusion-plus command failed with output = mount.nfs: Connection reset by peer\n, please make sure that the nas mount point address is correct and is accessible from the service VPC"}
     
    启动失败原因四:
    如遇此问题需要登录实例,输入 cd /mnt/auto/sd 进入/mnt/auto/sd目录后输入 ls -a ,可以看到文件列表中有一个 .kodbox-1.35.031 的隐藏目录,输入 rm -rf .kodbox-1.35.031 将其删除后重新安装应用,重新安装完成后启动kodbox后台重新设置账号密码后即可恢复正常使用。

    启动失败原因五:

    启动报错信息:Stable diffusion model failed to load, exiting

    检查点1:请检查模型是否正常上传,注意模型名称、模型大小、至少需上传一个基础模型。
    检查点2:请在上传模型后关闭kodbox页面,再启动SD应用;如果不关闭kodbox页面,可能会导致SD无法正常启动。

     此回答整理自钉群“【答疑群】函数计算 AIGC 场景技术交流”

    2023-11-22 20:43:43
    赞同 1 展开评论

快速交付实现商业价值。

还有其他疑问?
咨询AI助理