本人PAI新手,正在尝试Stable Diffusion阿里云部署教程:
“AIGC Stable Diffusion文生图Lora模型微调实现虚拟上装”教程在PAI-DSW中学习如何微调训练LoRA模型,在教程第二步第3点遇到RuntimeError情况,该步骤代码为:
safety_checker_url = f"{prefix}/aigc-data/hug_model/models--CompVis--stable-diffusion-safety-checker.tar.gz"
aria2(safety_checker_url, safety_checker_url.split("/")[-1], "./")
! tar -xf models--CompVis--stable-diffusion-safety-checker.tar.gz -C /root/.cache/huggingface/hub/
clip_url = f"{prefix}/aigc-data/hug_model/models--openai--clip-vit-large-patch14.tar.gz"
aria2(clip_url, clip_url.split("/")[-1], "./")
! tar -xf models--openai--clip-vit-large-patch14.tar.gz -C /root/.cache/huggingface/hub/
model_url = f"{prefix}/aigc-data/sd_models/chilloutmix_NiPrunedFp32Fix.safetensors"
aria2(model_url, model_url.split("/")[-1], "stable-diffusion-webui/models/Stable-diffusion/")
! python diffusers/scripts/convert_original_stable_diffusion_to_diffusers.py \
--checkpoint_path=stable-diffusion-webui/models/Stable-diffusion/chilloutmix_NiPrunedFp32Fix.safetensors \
--dump_path=chilloutmix-ni --from_safetensors
得到结果和报错内容为:
Download Results:
gid |stat|avg speed |path/URI
======+====+===========+=======================================================
c0a092|OK | 0B/s|.//models--CompVis--stable-diffusion-safety-checker.tar.gz
Status Legend:
(OK):download completed.
Download Results:
gid |stat|avg speed |path/URI
======+====+===========+=======================================================
ee42b3|OK | 0B/s|.//models--openai--clip-vit-large-patch14.tar.gz
Status Legend:
(OK):download completed.
Download Results:
gid |stat|avg speed |path/URI
======+====+===========+=======================================================
ee1e25|OK | 0B/s|stable-diffusion-webui/models/Stable-diffusion//chilloutmix_NiPrunedFp32Fix.safetensors
Status Legend:
(OK):download completed.
global_step key not found in model
Traceback (most recent call last):
File "/mnt/workspace/sdwebui_notebook_demo_lora_new/diffusers/scripts/convert_original_stable_diffusion_to_diffusers.py", line 131, in
pipe = download_from_original_stable_diffusion_ckpt(
File "/usr/local/lib/python3.10/dist-packages/diffusers/pipelines/stable_diffusion/convert_from_ckpt.py", line 1274, in download_from_original_stable_diffusion_ckpt
text_model = convert_ldm_clip_checkpoint(checkpoint)
File "/usr/local/lib/python3.10/dist-packages/diffusers/pipelines/stable_diffusion/convert_from_ckpt.py", line 740, in convert_ldm_clip_checkpoint
text_model.load_state_dict(text_model_dict)
File "/usr/local/lib/python3.10/dist-packages/torch/nn/modules/module.py", line 1671, in load_state_dict
raise RuntimeError('Error(s) in loading state_dict for {}:\n\t{}'.format(
RuntimeError: Error(s) in loading state_dict for CLIPTextModel:
Unexpected key(s) in state_dict: "text_model.embeddings.position_ids".
教程为DSW Gallery中的"AIGC Stable Diffusion文生图Lora模型微调实现虚拟上装",教程连接:https://help.aliyun.com/document_detail/2253191.html?spm=a2c4g.2384366.0.0.4fba3cf6qRDvs4
部署DSW实例规格:ecs.gn7i-c8g1.2xlarge
在教程的第二步中,你遇到了一个 RuntimeError。根据提供的代码,可能有几个原因导致这个错误:
运行时依赖项缺失:RuntimeError 可能是由于缺少某些运行时依赖项引起的。请确保你的环境中已经安装了所需的软件包和库,并且版本与教程要求相匹配。
文件下载失败:RuntimeError 可能是由于文件下载失败导致的。请确保从 safety_checker_url
、clip_url
和 model_url
下载的文件都成功获取并保存到正确的位置。
路径设置错误:RuntimeError 可能是由于路径设置不正确引起的。请检查路径变量(例如 prefix
)是否被正确设置,并且路径名是否存在拼写错误或缺失。
对于你遇到的具体 RuntimeError,建议你仔细检查错误消息和堆栈跟踪,以确定导致该错误的具体原因。如果可能,请提供更多的错误信息,以便我能够提供更精确的帮助。
这是一个关于如何在PAI-DSW中微调训练 AIGC Stable Diffusion Lora 模型并进行模型推理的教程。在第二步的第3点中,代码中使用了aria2函数下载models--CompVis--stable-diffusion-safety-checker.tar.gz文件,但是在下载时遇到了RuntimeError的错误。这可能是因为下载链接不正确或无法访问。
建议您检查以下几点:
确认您的实例网络是否正常,可以尝试使用ping命令测试网络连通性。
检查您的阿里云账号是否有访问链接的权限。
检查链接是否正确,您可以尝试手动访问该链接以确认它是否有效。
如果链接无效,您可以尝试在阿里云上搜索相关的资源或联系阿里云客服以获取帮助。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。