备案控制台

开发者社区 ModelScope模型即服务正文

ModelScope中错误怎么解决？

https://www.modelscope.cn/docs/VLLM%E6%8E%A8%E7%90%86%E5%8A%A0%E9%80%9F%E4%B8%8E%E9%83%A8%E7%BD%B2 执行：CUDA_VISIBLE_DEVICES=0 swift infer --model_type qwen-7b-chat --infer_backend vllm 报错：ValueError: The model's max seq len (32768) is larger than the maximum number of tokens that can be stored in KV cache (21568). Try increasing gpu_memory_utilization or decreasing max_model_len when initializing the engine. ModelScope中错误怎么解决？

展开

收起

小小爱吃香菜 2024-04-10 14:36:45 508 版权

1 条回答

写回答

取消提交回答

为了利利

加一下--gpu_memory_utilization 0.95 --max_model_len 8192 此回答整理自“魔搭ModelScope开发者联盟群 ①”。

2024-04-10 15:22:01

赞同 1 展开评论

相关问答

购买阿里国外的云服务器是否可以访问谷歌？

83799

47

0

请问下我访问接口不通什么原因 Provisional headers are shown

3777

1

0

this xml file does not appear to have any style in

51925

10

0

重启Docker后报错：Error response from daemon

2331

0

0

sql server的用户名和密码怎么查啊？

37549

21

0

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

60954

32

0

OSS的endpoint如何查看

37520

6

0

LoRa的网络覆盖能力范围是怎么样的？

3223

1

0

域名在阿里买的，服务器在百度买的，域名备案在百度云也通过备案了，现在怎么将阿里云的域名解析到百度

3691

1

0

阿里云服务器如何重置系统？

24751

4

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

相关文章

无影GPU云电脑，焕新升级！

阿里云服务器租赁多少钱？最新阿里云服务器租用价格表（轻量服务器/ECS云服务器/GPU云服务器明细报价）

租用阿里云服务器一年要多少钱？阿里云ECS、轻量与 GPU 服务器最新价格总结，手动整理

Scikit-Learn 1.8引入 Array API，支持 PyTorch 与 CuPy 张量的原生 GPU 加速

阿里云服务器租用价格：轻量应用服务器、云服务器ECS、gpu云服务器收费标准与活动价格参考

热门讨论

热门文章

我希望通过damo-YOLO训练1500*1500的图片

ModelScope中，模型下载默认路径在哪个路径？

ModelScope中apikey在哪申请？

dataset的版本问题导致与modelscope不兼容

ModelScope下载速度慢怎么解决？

怎么搭建本地文生图工作流

com/action/joingroup?code=v1是什么意思

如何下载modelscope模型？

ModelScope qwen7b、14b、72b lora微调分别需要的显存和cpu内存是多少？

关于 Windows平台上 ttsfrd 库的问题。

展开全部

Z-Image：冲击体验上限的下一代图像生成模型

Qwen3-VL新成员 2B、32B来啦！更适合开发者体质

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

共学 | 2025年，更加有效地搭建Agent

Z-Image Turbo LoRA训练魔法：如何保持加速生图能力

AgentScope：阿里开源多智能体低代码开发平台，支持一键导出源码、多种模型API和本地模型部署

Meta SAM3开源：让图像分割，听懂你的话

Agent Skills技术协议与开源实现，让大模型拥有“即插即用”技能

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

通义百聆语音双子星，同步开源！

展开全部

还有其他疑问?