备案控制台

开发者社区 ModelScope模型即服务计算机视觉正文

ModelScope在128g显存下使用chat-ms模型4bit量化回答问题响应效率慢，怎么加快？

ModelScope在128g显存下使用chat-ms模型4bit量化回答问题响应效率慢，怎么加快？

展开

收起

青城山下庄文杰 2023-08-25 15:33:42 132 版权

1 条回答

写回答

取消提交回答

Ð

开源上可以使用https://github.com/vllm-project/vllm 进行推理加速，我们后续也会在dashscope(https://dashscope.aliyun.com/) 上上线推理加速后的llama2模型服务方便调用-此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2023-08-29 15:39:02

赞同展开评论

相关问答

ModelScope 报显存不够如下图怎么解决？

249

1

0

modelscope-funasr这个量化模型在哪里下载？

185

0

0

modelscope-funasr的paraformer推理的显存是有什么决定的，为啥会不太稳定？

204

1

0

在modelscope-funasr当音频文件超过一个小时后，显存溢出怎么解决？

218

1

0

ModelScope有没有对各种大模型使用各种微调方法所需要显存的统计？

154

1

0

在modelscope-funasr我设4路的话，它的GPU显存占用就是4G吗？

100

1

0

modelscope-funasr的funclip，4g.显存不够如何解决？

98

0

0

ModelScope中，计算卡的显存是16g， vllm显所用显存也会均匀分布在各个卡上吗？

248

1

0

modelscope-funasr的GPU推理的cpp版本内存和显存不回收的问题怎么解决？

133

0

0

在modelscope-funasr同样的文件，文本强制对齐，有时运行成功，有时运行爆显存，为什么？

150

1

0

ModelScope模型即服务

计算机视觉

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

我要提问

相关文章

高效率办公PDF批量处理：批量OCR识别PDF区域文字内容，用PDF内容批量改名或导出表格的货物运单应用案例

机器视觉软件平台哪个好：2025领衔的选型指南

机器视觉公司有哪些：德创测控引领，产教融合优选指南

机器视觉公司有哪些：国产平台德创引领产教融合

AI内容创作Agent架构解析：基于移动端原生框架的内容特工队AI (ReelsAgent)与传统短视频工具的技术差异

热门讨论

热门文章

ModelScope下载速度慢怎么解决？

我希望通过damo-YOLO训练1500*1500的图片

ModelScope中，模型下载默认路径在哪个路径？

com/action/joingroup?code=v1是什么意思

ModelScope中，大佬们4卡跑lora时，遇到这样的错，怎么解决？

如何下载modelscope模型？

报错原因？

cpu部署报错 Torch not compiled with CUDA enabled

服务器上onnxruntime-gpu 调用结束，如何释放显存

在ModelScope中，下载模型时的ssl问题怎么解决？!

展开全部

Manga Image Translator：开源的漫画文字翻译工具，支持多语言翻译并嵌入原图，保持漫画的原始风格和布局

Qwen2.5-VL：阿里通义千问最新开源视觉语言模型，能够理解超过1小时的长视频

RF-DETR：YOLO霸主地位不保？开源 SOTA 实时目标检测模型，比眨眼还快3倍！

video-analyzer：开源视频分析工具，支持提取视频关键帧、音频转录，自动生成视频详细描述

X-AnyLabeling：开源的 AI 图像标注工具，支持多种标注样式，适于目标检测、图像分割等不同场景

ColorFlow：腾讯和清华大学联合推出的图像序列着色模型，通过参考图像的颜色对黑白漫画进行着色生成彩色漫画

STAR：南京大学联合字节开源视频超分辨率增强生成框架，视频清晰度一键提升，支持从低分辨率视频生成高分辨率视频

SPAR3D：一张图片就能生成3D模型，每个物体的重建时间仅需0.7秒！

UI-TARS：字节跳动开源专注于多平台 GUI 自动化交互的视觉语言模型

AddressCLIP：一张照片就能准确定位！中科院联合阿里云推出街道级图像地理定位模型

展开全部

还有其他疑问?