开发者社区 问答 正文

为什么需要增量模型导出及加载能力?

为什么需要增量模型导出及加载能力?

展开
收起
不吃核桃 2024-08-07 18:15:56 49 分享 版权
1 条回答
写回答
取消 提交回答
  • 对于时效性要求高的业务,需要频繁的线上模型更新,频率往往达到分钟级别甚至秒级。然而,对于TB-10TB级别的超大模型而言,分钟级别的模型生成到上线很难完成。此外,超大模型的训练和预测存在资源浪费、多节点Serving延时加大等问题。因此,DeepRec提供了增量模型产出及加载能力,以极大加速超大模型生成和加载。
    image.png

    2024-08-07 18:40:57
    赞同 展开评论
问答地址: