备案控制台

开发者社区 ModelScope模型即服务计算机视觉正文

ModelScope中，我想量化下这个模型，modelscope 有对应的方法和文档么？

ModelScope中，我用swift lora微调了一个qwen 14b模型，然后合并了原模型和微调部分，但部署的时候太耗费资源了，我想量化下这个模型，modelscope 有对应的方法和文档么

展开

收起

多麻辣哦 2023-11-22 20:39:27 454 版权

2 条回答

写回答

取消提交回答

sunrr

您好，ModelScope 是一个一站式的开源模型即服务共享平台。对于模型量化的需求，您可以采用 BitsAndBytes 方法来进行8bits量化。这种方法在量化后能基本保持性能无损，并且已经集成到了 transformers 库中。基于 BitsAndBytes，ModelScope 提供了在线量化和离线8bits模型两种方式。此外，为了进一步优化模型的部署效率，您还可以考虑使用低比特量化模型，例如 Yi-34B-Chat 的 4bit 量化版模型，这种模型可以在消费级显卡（如RTX3090）上直接使用。

2023-11-29 10:58:00

赞同展开评论
超爱吃辣

目前千问有一个qwen.cpp可以做c++部署
https://github.com/QwenLM/qwen.cpp
——此回答整理自钉群：魔搭ModelScope开发者联盟群 ①

2023-11-22 21:38:57

赞同展开评论

相关问答

有没有什么方法可以提升modelscope-funasr对人名、地名的识别率？

224

1

0

请问用modelscope里swift的dpo微调模型的断点Debug方式，有相关文档说明吗？

322

1

0

modelscope CPU跑chatglm有什么加速的方法嘛？

142

1

0

modelscope-funasr这个量化模型在哪里下载？

197

0

0

在modelscope-funasr中手工启动服务如何操作有具体的文档吗?

86

0

0

ModelScope提示对上传的文档进行如何的处理，而不是导入知识库，怎么解决？

101

0

0

ModelScope创空间成功运行了，如何上传文档让其学习知识库？

121

1

0

ModelScope有啥方法提高一下呢？

85

0

0

ModelScope中，Qwen2微调的文档有吗？

220

1

0

ModelScope有没有对各种大模型使用各种微调方法所需要显存的统计？

156

1

0

ModelScope模型即服务

计算机视觉

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

我要提问

相关文章

RFID让园区电动车进出更安全

计算机网络--TCP和UDP学习

阿里云数据库MongoDB版收费价格：分片集群和副本集费用清单

从 50 步到 4 步：LightX2V 如何把视频生成拉进20 秒时代？

蓝牙信标人员定位系统：从技术原理、架构设计到实现方案详解（一）

热门讨论

热门文章

我希望通过damo-YOLO训练1500*1500的图片

ModelScope中，模型下载默认路径在哪个路径？

ModelScope下载速度慢怎么解决？

如何下载modelscope模型？

com/action/joingroup?code=v1是什么意思

ModelScope的PAI-DSW中，怎么上传一个文件夹？

服务器上onnxruntime-gpu 调用结束，如何释放显存

modelscope这个下载有点慢呀，好几次都超时了，怎么解决？

在ModelScope中，下载模型时的ssl问题怎么解决？!

在ModelScope中，请问模型下载到本地的具体方法？

展开全部

Manga Image Translator：开源的漫画文字翻译工具，支持多语言翻译并嵌入原图，保持漫画的原始风格和布局

Qwen2.5-VL：阿里通义千问最新开源视觉语言模型，能够理解超过1小时的长视频

video-analyzer：开源视频分析工具，支持提取视频关键帧、音频转录，自动生成视频详细描述

LHM：单图生成3D动画人！阿里开源建模核弹，高斯点云重构服装纹理

X-AnyLabeling：开源的 AI 图像标注工具，支持多种标注样式，适于目标检测、图像分割等不同场景

ColorFlow：腾讯和清华大学联合推出的图像序列着色模型，通过参考图像的颜色对黑白漫画进行着色生成彩色漫画

AddressCLIP：一张照片就能准确定位！中科院联合阿里云推出街道级图像地理定位模型

SPAR3D：一张图片就能生成3D模型，每个物体的重建时间仅需0.7秒！

STAR：南京大学联合字节开源视频超分辨率增强生成框架，视频清晰度一键提升，支持从低分辨率视频生成高分辨率视频

InvSR：开源图像超分辨率生成模型，提升分辨率，修复老旧照片为超清图像

展开全部

还有其他疑问?