备案控制台

开发者社区 ModelScope模型即服务正文

通义千问本地部署成功，但flash-attn 1.0.8 安装不成功。

flash-attn 1.0.8 安装不成功，报错：
Error limit reached.
100 errors detected in the compilation of "ln_bwd_1024.cu".
Compilation terminated.
error: command 'C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.7\bin\nvcc.exe' failed with exit code 4294967295。

尝试安装flash-attn==1.0.9成功，但是提示import flash_attn rms_norm fail。

只支持flash-attn 1.0.8吗？还是CUDA版本问题？

使用python版本3.9.17。

展开

收起

通义千问-7B-Chat

4n2plqjmn6k74 2023-08-08 12:09:53 1595 版权

3 条回答

写回答

取消提交回答

游客c7rjykv7hp3ow

楼主，请问你的问题解决了吗？我也遇到同样的问题

2023-08-16 08:58:44

赞同展开评论
mqsoft

不用安装也行，我装的是pytorch2.0.1版本的，看介绍好像集成了flash-atten

2023-08-15 14:27:30

赞同展开评论
游客6itfah2ioe4kg

问也是白问，阿里云没人回复你

2023-08-11 10:13:12

赞同展开评论

相关问答

如何本地部署语言大模型？

40

1

0

请问MNN支持在高通或者MTK平台上部署大模型吗？

93

0

0

千问Qwen3 14B大模型部署最低配置GPU服务器要求？

740

1

0

千问Qwen3 32B大模型部署需要什么配置的GPU服务器？

680

1

0

Qwen3 32B,14B,8B大模型部署分别需要多少显存，GPU服务器如何选？

1739

1

0

千问大模型Qwen3-8B、4B、32B、235B、0.6B参数含义，需要什么配置的服务器部署？

451

1

0

部署大模型Qwen3 32B,14B,8B参数的大模型部署分别需要多少显存？

2054

1

0

阿里云部署DeepSeek 70B大模型配置推荐？

154

1

0

怎么使用vllm部署最新的qwen3的mbedding 和reranker模型呢

730

0

0

通义灵码安装后，账号登录不上去，是为什么呢？（昨天还可以用，软件客户端卸载后还是这样，不知道怎么回事

131

2

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

相关文章

一人挑战一支研发团队，3步搞定全栈开发

阿里云AI基础设施成果入选顶级学术会议，显著提升GPU利用率

从零到一构建你的第一个检索增强生成应用

最佳实践2：用通义灵码以自然语言交互实现 AI 高考志愿填报系统

当学习遇上数据：在线课程也能“懂你”的秘密

热门讨论

热门文章

ModelScope中，模型下载默认路径在哪个路径？

dataset的版本问题导致与modelscope不兼容

我希望通过damo-YOLO训练1500*1500的图片

ModelScope下载速度慢怎么解决？

ModelScope中，大佬们4卡跑lora时，遇到这样的错，怎么解决？

qwen3-32b和qwen-2.5-32b-Instruct有什么区别

从modelscope下载模型失败，怎么回事？

cpu部署报错 Torch not compiled with CUDA enabled

如何下载modelscope模型？

ModelScope qwen7b、14b、72b lora微调分别需要的显存和cpu内存是多少？

展开全部

智谱旗舰模型GLM-4.6开源发布，代码能力对齐Claude Sonnet 4

92_自我反思提示：输出迭代优化

AgentScope：阿里开源多智能体低代码开发平台，支持一键导出源码、多种模型API和本地模型部署

144_推理时延优化：Profiling与瓶颈分析 - 使用PyTorch Profiler诊断推理延迟，优化矩阵运算的独特瓶颈

通义DeepResearch全面开源！同步分享可落地的高阶Agent构建方法论

Ling-1T，智渊、思简

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

45_混合专家模型：MoE架构详解

51_安全性测试：提示注入与红队

展开全部

还有其他疑问?