开发者社区 > 云原生 > Serverless > 正文

函数计算FC部署Stable Diffusion启动失败原因是什么?

函数计算FC部署Stable Diffusion启动失败原因是什么?

展开
收起
三分钟热度的鱼 2023-11-15 22:01:14 54 0
2 条回答
写回答
取消 提交回答
  • 应用启动失败怎么办?https://help.aliyun.com/zh/fc/use-cases/faq-about-deploying-a-stable-diffusion-application?spm=a2c4g.11186623.0.i117#li-6qy-cz1-v2h

    检查上传的模型问题
    问题现象:应用启动时,出现下面的报错信息。

    Can't run without a checkpoint. Find and place a .ckpt or .safetensors file into any of those locations. The program will exit.

    Function instance health check failed on port 7860 in 120 seconds.

    问题原因:

    未上传模型:部署完Stable Diffusion服务后,没有上传模型,导致应用启动失败。

    当应用启动时,出现以下报错信息,请先排查模型是否没有上传。

    image.png
    模型后缀错误:上传的模型后缀不是以.ckpt结尾,导致应用启动失败。

    解决方案:

    上传模型:为了避免下载模型占用大量的时间,您可以直接上传对应的模型。具体操作,请参见一键部署Stable Diffusion。

    修改模型后缀:进入KodBox页面,确认是否已成功上传模型,并检查模型后缀是否为.ckpt。从huggingface源站下载的模型后缀为.txt,需手动修改为.ckpt。

    image.png
    检查账户是否欠费问题
    问题现象:应用启动时,出现报错信息{"ErrorCode":"InvalidArgument","ErrorMessage":"Mount NFS:xxxxx-jlb79.cn-hangzhou.nas.aliyuncs.com:/fc-stable-diffusion-plus command failed with output = mount.nfs: Connection reset by peer\n, please make sure that the nas mount point address is correct and is accessible from the service VPC"}。

    问题原因:模型正常上传后,启动仍然失败,可能是由于当前账号存在欠费。账号欠费后,在挂载NAS文件系统时会出现报错。

    解决方案:请在当前账号下充值,待账号恢复正常后重试。

    检查KodBox是否存在隐藏目录
    问题现象:应用启动时,出现以下报错信息。

    image.png
    问题原因:模型文件所在的目录下存在隐藏目录,导致应用启动失败。

    解决方案:

    登录函数实例,具体可参考函数实例命令行操作。

    执行命令cd /mnt/auto/sd,进入模型文件所在的目录。

    执行命令ls -a,查看是否存在隐藏目录。

    执行命令后,可以看到文件列表中包含隐藏目录.kodbox-1.35.031。

    执行命令rm -rf .kodbox-1.35.031,删除隐藏目录。

    重新安装应用,然后重启KodBox,设置账号密码即可恢复正常使用。

    检查KodBox页面是否关闭
    问题现象:应用启动时,出现报错信息Stable diffusion model failed to load, exiting。

    问题原因:

    模型没有正常上传:模型不正常导致应用启动失败。

    KodBox页面没有关闭:KodBox页面没有关闭,可能会导致Stable Diffusion服务启动失败。

    解决方案:

    模型正常上传:至少上传一个模型后,检查模型名称、模型大小符合要求。

    关闭KodBox页面:上传模型后关闭KodBox页面,然后再启动Stable Diffusion服务。

    2023-11-16 09:07:42
    赞同 展开评论 打赏
  • 启动失败原因一:
    报错内容为 Can't run without a checkpoint. Find and place a .ckpt or .safetensors file into any of those locations. The program will exit. 或如下图所示时,此问题导致原因是由于部署完服务后未上传模型,导致的启动失败,可以参考如何用 Serverless 一键部署 Stable Diffusion中操作步骤将模型先上传再进行使用。

    启动失败原因二:
    如果您将模型上传后打开Stable Diffusion服务中没有上传的模型或同原因一启动超时,请检查上传的模型后缀是否正确,模型后缀要求为 .ckpt 结尾。在 KodBox 中下载完的模型地址后缀为 txt,您需要手动修改为 ckpt。
     
    启动失败原因三:
    如果您已正确上传模型后仍然启动失败报如下错误,请检查当前账号是否有欠费,如有欠费需充值恢复正常后使用。
    欠费原因可能由于使用Stable Diffusion服务中有用NAS服务但您并没有领取NAS试用额度,您可以在免费试用领取NAS试用额度。

    费用账单详情可以参考【为什么扣费】回答查看。
    {"ErrorCode":"InvalidArgument","ErrorMessage":"Mount NFS:xxxxx-jlb79.cn-hangzhou.nas.aliyuncs.com:/fc-stable-diffusion-plus command failed with output = mount.nfs: Connection reset by peer\n, please make sure that the nas mount point address is correct and is accessible from the service VPC"}
     
    启动失败原因四:
    错误如下图所示,如遇此问题需要登录实例,输入 cd /mnt/auto/sd 进入/mnt/auto/sd目录后输入 ls -a ,可以看到文件列表中有一个 .kodbox-1.35.031 的隐藏目录,输入 rm -rf .kodbox-1.35.031 将其删除后重新安装应用,重新安装完成后启动kodbox后台重新设置账号密码后即可恢复正常使用。

    启动失败原因五:

    启动报错信息:Stable diffusion model failed to load, exiting

    检查点1:请检查模型是否正常上传,注意模型名称、模型大小、至少需上传一个基础模型,具体可参见下方截图。
    检查点2:请在上传模型后关闭kodbox页面,再启动SD应用;如果不关闭kodbox页面,可能会导致SD无法正常启动。

     此回答整理自钉群“【答疑群】函数计算 AIGC 场景技术交流”

    2023-11-15 22:13:01
    赞同 展开评论 打赏

快速交付实现商业价值。

相关产品

  • 函数计算
  • 相关电子书

    更多
    All in Serverless 阿里云核心产品全面升级 立即下载
    AIGC 浪潮之上,森马的 Serverless 实践之旅 立即下载
    极氪大数据 Serverless 应用实践 立即下载