开发者社区 > ModelScope模型即服务 > 计算机视觉 > 正文

ModelScope中,我的推理卡,v100,不支持fp16,我要怎么改?

ModelScope中,我的推理卡,v100,不支持fp16,我要怎么改,但是我微调的时候也是V100的卡,我改了其他类型的,微调完在训练的服务器都可以运行推理代码,同样的代码在部署的服务器就报了这个错

展开
收起
多麻辣哦 2023-11-08 21:02:13 718 0
4 条回答
写回答
取消 提交回答
  • 请确保您使用的计算卡支持 fp16 操作。目前大部分 V100 卡支持 fp16 操作,但是在某些情况下,可能会由于驱动问题或其他限制而不能正常工作。

    1. 更新驱动:确认您已经更新 V100 显卡的最新驱动程序。
    2. 检查硬件:确保您使用的硬件兼容 FP16 操作。有时,某些硬件可能不支持 FP16 操作。
    3. 调整模型:尝试在运行时修改模型参数或调整训练代码,使其不依赖于 FP16 操作。
    4. 代码审查:如果问题依然存在,请检查您的代码中是否存在有关 FP16 的错误,例如使用了错误的参数或设置。
    2023-11-10 11:34:20
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    根据您提供的信息,推测问题是由于推理服务器所使用的V100 GPU不支持FP16运算造成的。在这种情况,您可以尝试以下几种解决方案:

    1. 将模型的数据类型转换为FP32格式。由于V100 GPU支持FP32,因此您可以尝试将模型的数据类型由FP16转换为FP32,然后再进行推理。

    2. 采用支持FP16运算的其他GPU型号,例如Ampere架构的RTX A6000 或者 A100。

    3. 检查您的推理代码,确保它能正确识别GPU所支持的数据类型,并按照正确的方式进行运算。

    4. 如果其他方法都无效,您还可以考虑使用软件层面上的解决方案,比如 TensorFlow 的混合精度训练和推理,这样可以让 V100 支持 FP16 运算。

    2023-11-09 13:56:39
    赞同 展开评论 打赏
  • 如果你在使用ModelScope进行推理时遇到"v100不支持fp16"的错误,这可能是因为你的服务器上的NVIDIA V100显卡不支持半精度浮点数(FP16)的计算。

    在这种情况下,你可以尝试以下几种方法来解决这个问题:

    1. 使用全精度浮点数(FP32)进行计算:在PyTorch中,你可以通过设置torch.backends.cudnn.enabled=False来强制使用FP32进行计算。但是请注意,这可能会降低计算效率。

    2. 更新驱动程序:确保你的服务器上的NVIDIA驱动程序是最新的。有时,更新驱动程序可以解决一些兼容性问题。

    3. 使用其他类型的显卡:如果你的服务器上有其他类型的显卡,比如A100或者P100等,这些显卡可能支持FP16的计算。

    4. 使用其他框架:如果你在使用PyTorch,并且不能改变硬件配置,那么你可能需要考虑使用其他的支持FP16计算的框架,比如TensorFlow或者ONNX Runtime等。

    5. 使用混合精度训练:如果你在进行训练时使用了FP16,那么在推理时也使用FP16可能会有更好的性能。但是请注意,混合精度训练需要特定的硬件配置,并且可能需要一些额外的设置。

    2023-11-09 10:34:34
    赞同 展开评论 打赏
  • v100 支持fp16 不支持bf16吧 你查下是不是bf16——此回答整理自钉群:魔搭ModelScope开发者联盟群 ①

    2023-11-08 22:02:58
    赞同 展开评论 打赏

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

相关电子书

更多
视觉AI能力的开放现状及ModelScope实战 立即下载
ModelScope助力语音AI模型创新与应用 立即下载
低代码开发师(初级)实战教程 立即下载