ModelScopeQwen-14B-Chat本地部署 请问下能如何优化啊?

"ModelScopeQwen-14B-Chat本地部署 单张v100启动会爆内存,2张v100会回复很慢,请问下能如何优化啊?065ef47e913a2d16661f5cbd7568a283.png
"

展开
收起
真的很搞笑 2023-10-24 16:44:33 238 分享 版权
1 条回答
写回答
取消 提交回答
  • "要不您装一下flash-attention,部分模型用到flash-attension不支持v100
    您看一下模型卡片,Qwen-14B-Chat-Int8有些依赖项,没装的话装一下,此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”"

    2023-10-24 21:48:09
    赞同 展开评论

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

热门讨论

热门文章

还有其他疑问?
咨询AI助理