开发者社区 问答 正文

能不能描述下投机采样的设计思路及其在RTP-LLM中的实现方式?

能不能描述下投机采样的设计思路及其在RTP-LLM中的实现方式?

展开
收起
花开富贵111 2024-05-23 17:32:59 99 分享 版权
1 条回答
写回答
取消 提交回答
  • 投机采样的设计思路基于两点认知:部分token生成难度低,可以用小模型生成;在小批次情况下,大模型的前向推理时间主要受加载模型权重影响。在RTP-LLM中,我们基于论文思路使用大小模型进行了投机采样的实践。代码设计上考虑系统可维护性,与原始流程解耦,封装了一层编排层提供统一API,内部组织参数顺序调用正常流程。

    2024-05-23 17:49:46
    赞同 2 展开评论
问答标签:
问答地址: