开发者社区 问答 正文

模拟器就是user simulator主要分为哪三大块?

模拟器就是user simulator主要分为哪三大块?

展开
收起
张柠檬 2022-05-14 12:29:39 2159 分享 版权
来自: 阿里技术
1 条回答
写回答
取消 提交回答
  • 一个是 user model,用来模拟人的行为的;第二个是 error model,模拟完人的行为以后经过 error model 引入一个错误扰动,用 user model 产出的只是一个概率为 1 的东西;第三个模块是 reward model,用来提供 reward 值。

    2022-05-14 15:10:03
    赞同 展开评论
问答地址: