备案控制台

开发者社区 ModelScope模型即服务正文

请问以上ModelScope问题如何解决呢？"

"

图一是报错，好像是说内存不足，但是机器状态是图2，感觉内存没被占用。这是代码import requestsfrom swift.llm import ( ModelType, get_vllm_engine, get_default_template_type, get_template, inference_vllm, inference_stream_vllm)# 设置环境变量os.environ['CUDA_VISIBLE_DEVICES'] = '2,3,4,5'os.environ['RAY_memory_monitor_refresh_ms'] = '0'# 启动 vLLM API 服务器server_process = subprocess.Popen([ 'python', '-m', 'vllm.entrypoints.openai.api_server', '--model', './qwen/Qwen2-72B-Instruct', '--dtype', 'half', '--tensor-parallel-size', '4' ])。请问以上ModelScope问题如何解决呢？"

展开

收起

小小爱吃香菜 2024-07-17 08:18:02 109 版权

1 条回答

写回答

取消提交回答

为了利利

您用这个文档中的部署命令呢，有多卡部署，参考以下链接
https://github.com/modelscope/swift/blob/main/docs/source/LLM/VLLM%E6%8E%A8%E7%90%86%E5%8A%A0%E9%80%9F%E4%B8%8E%E9%83%A8%E7%BD%B2.md
此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2024-07-17 13:02:51

赞同 6 展开评论

相关问答

请问下我访问接口不通什么原因 Provisional headers are shown

3334

0

0

购买阿里国外的云服务器是否可以访问谷歌？

83007

47

0

sql server的用户名和密码怎么查啊？

37152

21

0

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

60649

30

0

this xml file does not appear to have any style in

51345

10

0

OSS的endpoint如何查看

37266

6

0

配置了安全组规则，端口还是无法访问

33175

25

0

通过www和不带www的网址输入最终都指向www.我的域名.com，求指教

132591

28

0

java并且符号怎么按出来

3052

1

0

重启Docker后报错：Error response from daemon

2008

0

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

相关文章

云安全自动化：当攻击来敲门，我们用代码说“不”

从零开始：用Python和Gemini 3四步搭建你自己的AI Agent

1688买家/卖家店铺订单API接口指南

Rakuten 商品详情核心 API（Item Search API）参数体系解析与权限配置指南

诊所管理软件门诊系统源码，采用SpringBoot+Vue2.0+MySQL技术栈开发，已成功落地百余项目

热门讨论

热门文章

我希望通过damo-YOLO训练1500*1500的图片

dataset的版本问题导致与modelscope不兼容

ModelScope中，模型下载默认路径在哪个路径？

ModelScope下载速度慢怎么解决？

关于模型的下载，huggingface下载速度太慢，如何在modelscope快速下载？

如何下载modelscope模型？

通过ollama 编写modelfile的形式创建翻译模型，输出全是思考，老是超限，翻译不出来。

qwen3-32b和qwen-2.5-32b-Instruct有什么区别

com/action/joingroup?code=v1是什么意思

ModelScope有部署qwen2-72b的么，正常推理需要多大的显存？

展开全部

Qwen3-VL新成员 2B、32B来啦！更适合开发者体质

Meta SAM3开源：让图像分割，听懂你的话

Meta SAM3开源：让图像分割，听懂你的话

码上生花：用API链接Qwen-Image系列及衍生LoRA生态模型

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

Manga Image Translator：开源的漫画文字翻译工具，支持多语言翻译并嵌入原图，保持漫画的原始风格和布局

AgentScope：阿里开源多智能体低代码开发平台，支持一键导出源码、多种模型API和本地模型部署

一文读懂“大语言模型”

中文大模型体验

腾讯混元 HunyuanVideo 1.5 开源！

展开全部

还有其他疑问?