开发者社区 > ModelScope模型即服务 > 正文

请问modelscope中做量化swift和tensorRT llm有区别吗?

请问modelscope中做量化swift和tensorRT llm有区别吗?

展开
收起
小小爱吃香菜 2024-05-25 20:39:27 68 0
2 条回答
写回答
取消 提交回答
  • 您看下是不是和--quant_device_map有关。此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

    2024-05-29 08:41:52
    赞同 展开评论 打赏
  • 北京阿里云ACE会长

    Swift支持使用AWQ、GPTQ、BnB、HQQ、EETQ等技术对模型进行量化。
    Swift的量化可以用于推理加速,并且量化后的模型支持QLoRA微调。
    Swift提供了命令行工具来执行量化操作,例如使用AWQ进行INT4量化,并支持自定义量化数据集。

    2024-05-26 08:00:51
    赞同 5 展开评论 打赏

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352

相关电子书

更多
OpenStack Swift 海量小文件优化之路 立即下载
From Java/Android to Swift iOS 立即下载
Swift在Airbnb的应用实践 立即下载