开发者社区 问答 正文

无法回答问题

该插件更新后无法使用image.png

展开
收起
桃乐丝007 2024-09-16 13:07:33 41 分享 版权
1 条回答
写回答
取消 提交回答
  • 北京阿里云ACE会长

    self._a = np.ones(self.bandit.k)
    self._b = np.ones(self.bandit.k)

    两个数组 _a 和 _b,它们的大小由 self.bandit.k 决定,这里的 k 通常代表老虎机的数量。np.ones 函数创建了一个填充有1的数组,这意味着每个老虎机的初始估计奖励(或某些统计量)被设置为1。这样的初始化在算法开始时是常见的,比如在实现UCB(上置信界限)算法时。

    2024-09-18 09:39:31
    赞同 328 展开评论
问答地址: