大模型产品解决方案权益定价云市场伙伴服务了解阿里云
AI 助理
文档备案控制台
开发者社区ModelScope模型即服务
首页计算机视觉自然语言处理语音多模态科学计算魔搭社区官网
探索云世界

热门

百炼大模型Modelscope模型即服务弹性计算通义灵码云原生数据库云效DevOps龙蜥操作系统
云计算弹性计算无影存储网络倚天
云原生容器serverless中间件微服务可观测消息队列
数据库关系型数据库NoSQL数据库数据仓库数据管理工具PolarDB开源向量数据库
大数据大数据计算实时数仓Hologres实时计算FlinkE-MapReduceDataWorksElasticsearch机器学习平台PAI智能搜索推荐数据可视化DataV
人工智能机器学习平台PAI视觉智能开放平台智能语音交互自然语言处理多模态模型pythonsdk通用模型
开发与运维云效DevOps钉钉宜搭镜像站
开发者社区 ModelScope模型即服务 正文

modelscope中本地部署QWEN1.5-32B用两张A10的卡很慢,是需要做多卡优化吗?

modelscope中,本地部署QWEN1.5-32B,用两张A10的卡,吐一句话要一分钟,是需要做多卡优化吗,还是配置不够?

展开
收起
小小爱吃香菜 2024-06-04 19:42:09 461 分享 版权
1 条回答
写回答
取消 提交回答
  • 为了利利

    您用vllm部署,参考以下链接 https://github.com/modelscope/swift/blob/main/docs/source/LLM/VLLM%E6%8E%A8%E7%90%86%E5%8A%A0%E9%80%9F%E4%B8%8E%E9%83%A8%E7%BD%B2.md 此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

    2024-06-04 20:00:01
    赞同 3 展开评论
相关问答
如何本地部署语言大模型?
236
1
0
ModelScope接口访问qwen-coder,报错409
250
0
0
本地部署开源模型Qwen2.5-coder-32b,和直接使用线上api同样参数的模型,差距很大
827
1
0
在4卡4090(24G)服务器上利用modelscope离线部署Qwen2vl-Flux时报错
355
1
0
想请问下ModelScope里Vllm部署了qwen1.5-32B之后,它无限输出日志 怎么解决?
498
0
0
modelscope有人知道为啥部署会不成功吗?
172
1
0
modelscope微调后的多模态大模型Qwen-VL和graghrag相结合构建知识库的案例有嘛?
220
0
0
modelscope-funasr本地部署 上传视频后点击asr 就出现错误 ,为什么?
180
1
0
ModelScope我微调Qwen2-7B-Instruct,loss一直不变是什么原因?
251
1
0
在modelscope-funasr中docker部署包4.5时间戳和热词可以同时实现吗?
216
1
0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352

我要提问

热门讨论

热门文章

  • 运行qwen-image显示Reconnecting
  • ModelScope中,模型下载默认路径在哪个路径?
  • dataset的版本问题导致与modelscope不兼容
  • 我希望通过damo-YOLO训练1500*1500的图片
  • notebook启动安全验证一直失败
  • 如何下载modelscope模型?
  • ModelScope下载速度慢怎么解决?
  • vllm部署模型,参数如何指定
  • 现在还能免费部署模型至api上了吗?
  • ModelScope有部署qwen2-72b的么,正常推理需要多大的显存?
  • 展开全部
  • 保姆级 OpenClaw (原 Clawdbot)飞书对接教程 手把手教你搭建 AI 助手
  • 目前最火的 AI 助手 Clawdbot 又又又改名了 并且发布新版本
  • OpenClaw(原 Clawdbot)钉钉对接保姆级教程 手把手教你打造自己的 AI 助手
  • Qwen3-TTS全面开源:支持超低延迟流式合成的多语言语音大模型
  • 免费的模型API平台盘点
  • HTTPS 原理
  • Qwen-Image-Edit:全能图像编辑,驱动内容创作提质增效
  • 小而强,GLM-4.7-Flash开源
  • 世界模型 LingBot-World,正式开源!
  • Z Image标准版来了!专为微调而生的全能基座,兼顾真实与艺术!
  • 展开全部
    还有其他疑问?
    咨询AI助理

    为什么选择阿里云

    什么是云计算全球基础设施技术领先稳定可靠安全合规分析师报告

    大模型

    通义大模型大模型服务AI应用构建

    产品和定价

    全部产品免费试用产品动态产品定价配置报价器云上成本管理

    技术内容

    技术解决方案帮助文档开发者社区天池大赛阿里云认证

    权益

    免费试用解决方案免费试用高校计划5亿算力补贴推荐返现计划

    服务

    基础服务企业增值服务迁云服务官网公告健康看板信任中心

    关注阿里云

    关注阿里云公众号或下载阿里云APP,关注云资讯,随时随地运维管控云服务

    阿里云APP阿里云微信

    联系我们:4008013260

    法律声明Cookies政策廉正举报安全举报联系我们加入我们

    友情链接

    阿里巴巴集团淘宝网天猫全球速卖通阿里巴巴国际交易市场1688阿里妈妈飞猪阿里云计算万网高德UC友盟优酷钉钉支付宝达摩院淘宝海外阿里云盘淘宝闪购

    © 2009-现在 Aliyun.com 版权所有 增值电信业务经营许可证: 浙B2-20080101 域名注册服务机构许可: 浙D3-20210002

    浙公网安备 33010602009975号浙公网安备 33010602009975号浙B2-20080101-4