备案控制台

开发者社区 ModelScope模型即服务正文

按文档尝试运行训练一直失败

尝试按照文档训练时，运行PYTHONPATH=../../.. bash run_sft.sh一直失败，flash-attention等相关工具均已安装。

系统环境使用【魔搭平台免费实例】中的GPU环境。

错误原因：FlashAttention backward for head dim > 64 requires A100 or H100 GPUs as the implementation needs a large amount of shared memory.

网上查询相关信息后，可能是内存不足或者gpu不兼容等问题，尝试过按照flash-attention的github中方法MAX_JOBS=4 pip install .重新构建，但是均无法成功，错误信息一致。

请问这个问题可以在提供免费的GPU环境中解决吗，或者能否通过命令行手动关闭flash-attention的使用来先跑通示例呢。

展开

收起

通义千问-7B-预训练

manxiaqu 2023-08-08 16:27:38 303 版权

1 条回答

写回答

取消提交回答

清风拂袖

您好，您可以参考以下流程排查问题：

检查您使用的版本是否是最新的。
检查您使用的硬件是否符合要求。
检查您使用的代码是否有错误。
检查您使用的数据是否有问题。
检查您使用的模型是否有问题。
如果您按照上述流程排查后，问题仍然存在，请您提交工单反馈给我们，我们会尽快处理。

2023-09-26 10:54:00

赞同展开评论

相关问答

请问下我访问接口不通什么原因 Provisional headers are shown

2935

0

0

购买阿里国外的云服务器是否可以访问谷歌？

82327

47

0

通过www和不带www的网址输入最终都指向www.我的域名.com，求指教

131514

28

0

sql server的用户名和密码怎么查啊？

36736

21

0

this xml file does not appear to have any style in

50740

10

0

OSS的endpoint如何查看

37054

6

0

计算机网络的频带传输是什么意思？

2037

1

0

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

60340

30

0

配置了安全组规则，端口还是无法访问

32937

25

0

手机弹出支付风险问题

6839

2

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

相关文章

Transformer参数规模深度解析：从模型聪明说到实际影响

最新：阿里云服务器租用费用，个人、学生和企业账号价格清单

租用阿里云服务器一年要多少钱？2025年费用全解析

2025最新阿里云服务器租用费用：包年包月、按量付费价格整理

从“皮囊”到“灵魂”：构建实时交互型数字人的核心技术栈与实践

热门讨论

热门文章

我希望通过damo-YOLO训练1500*1500的图片

如何训练属于自己的AI大模型呢？有没有大佬有相关文档参考学习下

dataset的版本问题导致与modelscope不兼容

ModelScope中，模型下载默认路径在哪个路径？

ModelScope中，大佬们4卡跑lora时，遇到这样的错，怎么解决？

ModelScope下载速度慢怎么解决？

com/action/joingroup?code=v1是什么意思

如何下载modelscope模型？

qwen3-32b和qwen-2.5-32b-Instruct有什么区别

ModelScope qwen7b、14b、72b lora微调分别需要的显存和cpu内存是多少？

展开全部

Qwen3-VL新成员 2B、32B来啦！更适合开发者体质

嵌入式开发必看！Keil uVision5 MDK 5.39 详细安装步骤+汉化+安装包

AgentScope：阿里开源多智能体低代码开发平台，支持一键导出源码、多种模型API和本地模型部署

嵌入式开发必备！Keil uVision5 C51 V9.61 安装激活 + 汉化完整教程, 含（Keil MDK 5.39）

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

UI-Ins：让 GUI 智能体真正“看懂”用户指令的新范式

Dolphin：40语种+22方言！清华联合海天瑞声推出的语音识别大模型，识别精度超Whisper两代

Manga Image Translator：开源的漫画文字翻译工具，支持多语言翻译并嵌入原图，保持漫画的原始风格和布局

AnythingLLM：34K Star！一键上传文件轻松打造个人知识库，构建只属于你的AI助手，附详细部署教程

展开全部

还有其他疑问?