开发者社区 > ModelScope模型即服务 > 计算机视觉 > 正文

ModelScope中,我想量化下这个模型,modelscope 有对应的方法和文档么?

ModelScope中,我用swift lora微调了一个qwen 14b模型,然后合并了原模型和微调部分,但部署的时候太耗费资源了,我想量化下这个模型,modelscope 有对应的方法和文档么

展开
收起
多麻辣哦 2023-11-22 20:39:27 70 0
2 条回答
写回答
取消 提交回答
  • 您好,ModelScope 是一个一站式的开源模型即服务共享平台。对于模型量化的需求,您可以采用 BitsAndBytes 方法来进行8bits量化。这种方法在量化后能基本保持性能无损,并且已经集成到了 transformers 库中。基于 BitsAndBytes,ModelScope 提供了在线量化和离线8bits模型两种方式。此外,为了进一步优化模型的部署效率,您还可以考虑使用低比特量化模型,例如 Yi-34B-Chat 的 4bit 量化版模型,这种模型可以在消费级显卡(如RTX3090)上直接使用。

    2023-11-29 10:58:00
    赞同 展开评论 打赏
  • 目前千问有一个qwen.cpp可以做c++部署
    https://github.com/QwenLM/qwen.cpp
    ——此回答整理自钉群:魔搭ModelScope开发者联盟群 ①

    2023-11-22 21:38:57
    赞同 展开评论 打赏

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

相关电子书

更多
视觉AI能力的开放现状及ModelScope实战 立即下载
ModelScope助力语音AI模型创新与应用 立即下载
低代码开发师(初级)实战教程 立即下载