开发者社区 问答 正文

投机采样在性能上引入的主要额外负担是什么?

投机采样在性能上引入的主要额外负担是什么?

展开
收起
花开富贵111 2024-05-23 17:32:59 61 分享 版权
1 条回答
写回答
取消 提交回答
  • 投机采样引入的额外负担主要有两块:小模型顺序生成token的时间和采样。小模型推理会占用一定的时间,尤其在N较大且接受token数少的情况下开销会很大。此外,重复多次的采样也引入了巨大的开销。

    2024-05-23 17:53:07
    赞同 1 展开评论
问答地址: