【刷穿 LeetCode】528. 按权重随机选择 :「前缀和 + 二分」&「模拟(桶轮询)」

简介: 【刷穿 LeetCode】528. 按权重随机选择 :「前缀和 + 二分」&「模拟(桶轮询)」

网络异常,图片无法展示
|


题目描述



这是 LeetCode 上的 528. 按权重随机选择 ,难度为 中等


Tag : 「前缀和」、「二分」、「模拟」


给定一个正整数数组 w ,其中 w[i] 代表下标 i 的权重(下标从 0 开始),请写一个函数 pickIndex ,它可以随机地获取下标 i,选取下标 i 的概率与 w[i] 成正比。


例如,对于 w = [1, 3],挑选下标 0 的概率为 1 / (1 + 3) = 0.25 (即,25%),而选取下标 1 的概率为 3 / (1 + 3) = 0.75(即,75%)。


也就是说,选取下标 i 的概率为 w[i] / sum(w) 。


示例 1:


输入:
["Solution","pickIndex"]
[[[1]],[]]
输出:
[null,0]
解释:
Solution solution = new Solution([1]);
solution.pickIndex(); // 返回 0,因为数组中只有一个元素,所以唯一的选择是返回下标 0。
复制代码


示例 2:


输入:
["Solution","pickIndex","pickIndex","pickIndex","pickIndex","pickIndex"]
[[[1,3]],[],[],[],[],[]]
输出:
[null,1,1,1,1,0]
解释:
Solution solution = new Solution([1, 3]);
solution.pickIndex(); // 返回 1,返回下标 1,返回该下标概率为 3/4 。
solution.pickIndex(); // 返回 1
solution.pickIndex(); // 返回 1
solution.pickIndex(); // 返回 1
solution.pickIndex(); // 返回 0,返回下标 0,返回该下标概率为 1/4 。
由于这是一个随机问题,允许多个答案,因此下列输出都可以被认为是正确的:
[null,1,1,1,1,0]
[null,1,1,1,1,1]
[null,1,1,1,0,0]
[null,1,1,1,0,1]
[null,1,0,1,0,0]
......
诸若此类。
复制代码


提示:


  • 1 <= w.length <= 10000
  • 1 <= w[i] <= 10^5105
  • pickIndex 将被调用不超过 10000 次


前缀和 + 二分



根据题意,权重值 w[i]w[i] 可以作为 pickIndex 调用总次数为 \sum_{i = 0}^{w.length - 1} w[i]i=0w.length1w[i] 时,下标 ii 的返回次数。


随机数的产生可以直接使用语言自带的 API,剩下的我们需要构造一个分布符合权重的序列。


由于 1 <= w[i] <= 10^51<=w[i]<=105,且 ww 长度为 10^4104,因此直接使用构造一个有 w[i]w[i] 个的 ii 的数字会 MLE。


我们可以使用「前缀和」数组来作为权重分布序列,权重序列的基本单位为 11


一个长度为 nn 的构造好的「前缀和」数组可以看是一个基本单位为 11[1, sum[n - 1]][1,sum[n1]] 数轴。


使用随机函数参数产生 [1, sum[n - 1]][1,sum[n1]] 范围内的随机数,通过「二分」前缀和数组即可找到分布位置对应的原始下标值。


网络异常,图片无法展示
|


代码:


class Solution {
    int[] sum;
    public Solution(int[] w) {
        int n = w.length;
        sum = new int[n + 1];
        for (int i = 1; i <= n; i++) sum[i] = sum[i - 1] + w[i - 1];
    }
    public int pickIndex() {
        int n = sum.length;
        int t = (int) (Math.random() * sum[n - 1]) + 1;
        int l = 1, r = n - 1;
        while (l < r) {
            int mid = l + r >> 1;
            if (sum[mid] >= t) r = mid;
            else l = mid + 1;
        }
        return r - 1;
    }
}
复制代码


  • 时间复杂度:Solution 类的构造方法整体复杂度为 O(n)O(n)pickIndex 的复杂度为 O(\log{n})O(logn)
  • 空间复杂度:O(n)O(n)


模拟(桶轮询)



利用 OJ 不太聪明(对权重分布做近似检查),我们可以构造一个最小轮询序列(权重精度保留到小数点一位),并使用 (i, cnt)(i,cnt) 的形式进行存储,代表下标 ii 在最小轮询序列中出现次数为 cntcnt


然后使用两个编号 bidbidiidiid 来对桶进行轮询返回(循环重置 & 跳到下一个桶)。


该解法的最大好处是不需要使用 random 函数,同时返回的连续序列满足每一段(长度不短于最小段)都符合近似权重分布。


网络异常,图片无法展示
|


代码:


class Solution {
    // 桶编号 / 桶内编号 / 总数
    int bid, iid, tot;
    List<int[]> list = new ArrayList<>();
    public Solution(int[] w) {
        int n = w.length;
        double sum = 0, min = 1e9;
        for (int i : w) {
            sum += i;
            min = Math.min(min, i);
        }
        double minv = min / sum;
        int k = 1;
        while (minv * k < 1) k *= 10;
        for (int i = 0; i < n; i++) {
            int cnt = (int)(w[i] / sum * k);
            list.add(new int[]{i, cnt});
            tot += cnt;
        }
    }
    public int pickIndex() {
        if (bid >= list.size()) {
            bid = 0; iid = 0;
        }
        int[] info = list.get(bid);
        int id = info[0], cnt = info[1];
        if (iid >= cnt) {
            bid++; iid = 0;
            return pickIndex();
        }
        iid++;
        return id;
    }
}
复制代码


  • 时间复杂度:计算 kk 的操作只会发生一次,可以看作是一个均摊到每个下标的常数计算,Solution 类的构造方法的整体复杂度可看作 O(n)O(n)pickIndex 的复杂度为 O(1)O(1)
  • 空间复杂度:O(n)O(n)


最后



这是我们「刷穿 LeetCode」系列文章的第 No.528 篇,系列开始于 2021/01/01,截止于起始日 LeetCode 上共有 1916 道题目,部分是有锁题,我们将先把所有不带锁的题目刷完。


在这个系列文章里面,除了讲解解题思路以外,还会尽可能给出最为简洁的代码。如果涉及通解还会相应的代码模板。


为了方便各位同学能够电脑上进行调试和提交代码,我建立了相关的仓库:github.com/SharingSour…


在仓库地址里,你可以看到系列文章的题解链接、系列文章的相应代码、LeetCode 原题链接和其他优选题解。

相关文章
|
算法 Android开发 索引
LeetCode 周赛上分之旅 #44 同余前缀和问题与经典倍增 LCA 算法
学习数据结构与算法的关键在于掌握问题背后的算法思维框架,你的思考越抽象,它能覆盖的问题域就越广,理解难度也更复杂。在这个专栏里,小彭与你分享每场 LeetCode 周赛的解题报告,一起体会上分之旅。
83 0
|
6月前
【LeetCode刷题】前缀和解决问题:742.寻找数组的中心下标、238.除自身以外数组的乘积
【LeetCode刷题】前缀和解决问题:742.寻找数组的中心下标、238.除自身以外数组的乘积
LeetCode-798 得分最高的最小论调 及差分和前缀和的学习
LeetCode-798 得分最高的最小论调 及差分和前缀和的学习
|
7月前
|
自然语言处理 索引
leetcode-745:前缀和后缀搜索
leetcode-745:前缀和后缀搜索
61 0
|
7月前
[leetcode 前缀和]
[leetcode 前缀和]
|
人工智能 算法 搜索推荐
LeetCode 周赛 338,贪心 / 埃氏筛 / 欧氏线性筛 / 前缀和 / 二分查找 / 拓扑排序
大家好,我是小彭。 上周末是 LeetCode 第 338 场周赛,你参加了吗?这场周赛覆盖的知识点很多,第四题称得上是近期几场周赛的天花板。
112 0
|
算法 索引
LeetCode算法小抄--数组(双指针、差分数组、前缀和)
LeetCode算法小抄--数组(双指针、差分数组、前缀和)
|
机器学习/深度学习 人工智能
|
算法 索引
leetcode-每日一题745. 前缀和后缀搜索(哈希和字典树)
如果我们用前缀 prefix 和 后缀 suff去暴力对比所有单词肯定会超时,我们可以先把单词里所有的前缀后缀组合,中间用特殊符号@连接,对应的最大下标存入哈希表中。搜索时,用特殊符号@连接前缀后缀,在哈希表中进行搜索
99 0
leetcode-每日一题745. 前缀和后缀搜索(哈希和字典树)
|
算法
LeetCode 周赛 340,质数 / 前缀和 / 极大化最小值 / 最短路 / 平衡二叉树
今天讲 LeetCode 单周赛第 340 场,今天状态不好,掉了一波大分。
106 0