开发者社区 问答 正文

如何优化投机采样中的采样流程以减少额外负担?

如何优化投机采样中的采样流程以减少额外负担?

展开
收起
花开富贵111 2024-05-23 17:40:06 76 分享 版权
1 条回答
写回答
取消 提交回答
  • 通过对采样流程进行优化来减少额外负担。具体做法是对存在top_k参数的情况使用融合算子,将原版采样流程分为两步:先进行TopK采样,再省略TopP步骤直接在采样过程中判断。改进后的流程大幅度减少了计算量和kernel数量,从而极大程度减少了采样需要的时间。

    2024-05-23 17:53:06
    赞同 展开评论
问答地址: