函数计算FC部署Stable Diffusion启动失败原因是什么?
检查上传的模型问题
问题现象:应用启动时,出现下面的报错信息。
Can't run without a checkpoint. Find and place a .ckpt or .safetensors file into any of those locations. The program will exit.
Function instance health check failed on port 7860 in 120 seconds.
问题原因:
未上传模型:部署完Stable Diffusion服务后,没有上传模型,导致应用启动失败。
当应用启动时,出现以下报错信息,请先排查模型是否没有上传。
image.png
模型后缀错误:上传的模型后缀不是以.ckpt结尾,导致应用启动失败。
解决方案:
上传模型:为了避免下载模型占用大量的时间,您可以直接上传对应的模型。具体操作,请参见一键部署Stable Diffusion。
修改模型后缀:进入KodBox页面,确认是否已成功上传模型,并检查模型后缀是否为.ckpt。从huggingface源站下载的模型后缀为.txt,需手动修改为.ckpt。
image.png
检查账户是否欠费问题
问题现象:应用启动时,出现报错信息{"ErrorCode":"InvalidArgument","ErrorMessage":"Mount NFS:xxxxx-jlb79.cn-hangzhou.nas.aliyuncs.com:/fc-stable-diffusion-plus command failed with output = mount.nfs: Connection reset by peer\n, please make sure that the nas mount point address is correct and is accessible from the service VPC"}。
问题原因:模型正常上传后,启动仍然失败,可能是由于当前账号存在欠费。账号欠费后,在挂载NAS文件系统时会出现报错。
解决方案:请在当前账号下充值,待账号恢复正常后重试。
检查KodBox是否存在隐藏目录
问题现象:应用启动时,出现以下报错信息。
image.png
问题原因:模型文件所在的目录下存在隐藏目录,导致应用启动失败。
解决方案:
登录函数实例,具体可参考函数实例命令行操作。
执行命令cd /mnt/auto/sd,进入模型文件所在的目录。
执行命令ls -a,查看是否存在隐藏目录。
执行命令后,可以看到文件列表中包含隐藏目录.kodbox-1.35.031。
执行命令rm -rf .kodbox-1.35.031,删除隐藏目录。
重新安装应用,然后重启KodBox,设置账号密码即可恢复正常使用。
检查KodBox页面是否关闭
问题现象:应用启动时,出现报错信息Stable diffusion model failed to load, exiting。
问题原因:
模型没有正常上传:模型不正常导致应用启动失败。
KodBox页面没有关闭:KodBox页面没有关闭,可能会导致Stable Diffusion服务启动失败。
解决方案:
模型正常上传:至少上传一个模型后,检查模型名称、模型大小符合要求。
关闭KodBox页面:上传模型后关闭KodBox页面,然后再启动Stable Diffusion服务。
启动失败原因一:
报错内容为 Can't run without a checkpoint. Find and place a .ckpt or .safetensors file into any of those locations. The program will exit. 或如下图所示时,此问题导致原因是由于部署完服务后未上传模型,导致的启动失败,可以参考如何用 Serverless 一键部署 Stable Diffusion中操作步骤将模型先上传再进行使用。
启动失败原因二:
如果您将模型上传后打开Stable Diffusion服务中没有上传的模型或同原因一启动超时,请检查上传的模型后缀是否正确,模型后缀要求为 .ckpt 结尾。在 KodBox 中下载完的模型地址后缀为 txt,您需要手动修改为 ckpt。
启动失败原因三:
如果您已正确上传模型后仍然启动失败报如下错误,请检查当前账号是否有欠费,如有欠费需充值恢复正常后使用。
欠费原因可能由于使用Stable Diffusion服务中有用NAS服务但您并没有领取NAS试用额度,您可以在免费试用领取NAS试用额度。
费用账单详情可以参考【为什么扣费】回答查看。
{"ErrorCode":"InvalidArgument","ErrorMessage":"Mount NFS:xxxxx-jlb79.cn-hangzhou.nas.aliyuncs.com:/fc-stable-diffusion-plus command failed with output = mount.nfs: Connection reset by peer\n, please make sure that the nas mount point address is correct and is accessible from the service VPC"}
启动失败原因四:
错误如下图所示,如遇此问题需要登录实例,输入 cd /mnt/auto/sd 进入/mnt/auto/sd目录后输入 ls -a ,可以看到文件列表中有一个 .kodbox-1.35.031 的隐藏目录,输入 rm -rf .kodbox-1.35.031 将其删除后重新安装应用,重新安装完成后启动kodbox后台重新设置账号密码后即可恢复正常使用。
启动失败原因五:
启动报错信息:Stable diffusion model failed to load, exiting
检查点1:请检查模型是否正常上传,注意模型名称、模型大小、至少需上传一个基础模型,具体可参见下方截图。
检查点2:请在上传模型后关闭kodbox页面,再启动SD应用;如果不关闭kodbox页面,可能会导致SD无法正常启动。
此回答整理自钉群“【答疑群】函数计算 AIGC 场景技术交流”
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。