单个GPU显存较小,无法推理,如何设置多卡推理?

我们单个GPU显存较小,无法推理,ms有办法指定多卡推理吗?是device参数吗?

展开
收起
游客o4k5mx22dpaco 2023-05-11 10:44:20 873 发布于广东 分享
分享
版权
举报
1 条回答
写回答
取消 提交回答
  • 如果GPU显存较小或推理速度较慢,可开启半精度推理。临时的解决方法是使用源代码安装modelscope,然后将 modelscope/models/nlp/fid_T5/text_generation.py 文件76行# self.backbone.half()解除注释,mass后续sdk版本会支持可配置开启/关闭 半精度推理。

    2023-05-19 08:31:12 发布于浙江 举报
    赞同 评论

    评论

    全部评论 (0)

    登录后可评论

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

热门讨论

热门文章

还有其他疑问?
咨询AI助理