933. 最近的请求次数 : 线段树(动态开点)/ 分块 运用题

简介: 933. 最近的请求次数 : 线段树(动态开点)/ 分块 运用题

网络异常,图片无法展示
|


题目描述



这是 LeetCode 上的 933. 最近的请求次数 ,难度为 简单


Tag : 「线段树」、「分块」


写一个 RecentCounter 类来计算特定时间范围内最近的请求。


请你实现 RecentCounter 类:


  • RecentCounter() 初始化计数器,请求数为 00
  • int ping(int t) 在时间 tt 添加一个新请求,其中 tt 表示以毫秒为单位的某个时间,并返回过去 30003000 毫秒内发生的所有请求数(包括新请求)。确切地说,返回在 [t-3000, t][t3000,t] 内发生的请求数。


保证 每次对 ping 的调用都使用比之前更大的 tt 值。


示例 1:


输入:
["RecentCounter", "ping", "ping", "ping", "ping"]
[[], [1], [100], [3001], [3002]]
输出:
[null, 1, 2, 3, 3]
解释:
RecentCounter recentCounter = new RecentCounter();
recentCounter.ping(1);     // requests = [1],范围是 [-2999,1],返回 1
recentCounter.ping(100);   // requests = [1, 100],范围是 [-2900,100],返回 2
recentCounter.ping(3001);  // requests = [1, 100, 3001],范围是 [1,3001],返回 3
recentCounter.ping(3002);  // requests = [1, 100, 3001, 3002],范围是 [2,3002],返回 3
复制代码


提示:


  • 1 <= t <= 10^91<=t<=109
  • 保证每次对 ping 调用所使用的 tt 值都 严格递增
  • 至多调用 ping 方法 10^4104


以下内容(支持任意的 [l, r][l,r] 查询)基于我漏看了 tt 递增这一条件。由于 tt 递增,因此往前距离大于 30003000 的记录无须保留,从而简化了问题,可以使用队列直接做,今天打字很多了,不补充了。


基本分析



根据题意,题目涉及「单点修改」和「区间查询」,根据 区间求和问题 的总结,可以使用「树状数组」和「线段树」进行求解。


但是留意到 tt 的数据范围为 1e91e9,虽然调用次数是 1e41e4,但由于本题是「强制在线」问题,因此我们无法利用「离散化」手段来解决 MLE 问题,而要使用「线段树(动态开点)」来解决。


线段树(动态开点)



动态开点的优势在于,不需要事前构造空树,而是在插入操作 update 和查询操作 query 时根据访问需要进行「开点」操作。由于我们不保证查询和插入都是连续的,因此对于父节点 uu 而言,我们不能通过 u << 1u << 1 | 1 的固定方式进行访问,而要将节点 tr[u]tr[u] 的左右节点所在 tr 数组的下标进行存储,分别记为 lsrs 属性。对于 tr[u].ls = 0tr[u].ls=0tr[u].rs = 0tr[u].rs=0 则是代表子节点尚未被创建,当需要访问到它们,而又尚未创建的时候,则将其进行创建。


线段树的插入和查询都是 \log{n}logn 的(如果涉及区间修改,则由懒标记来确保 \log{n}logn 复杂度),因此我们在单次操作的时候,最多会创建数量级为 \log{n}logn 的点,因此空间复杂度为 O(m\log{n})O(mlogn),而不是 O(4 * n)O(4n),而开点数的预估需不能仅仅根据 \log{n}logn 来进行,还要对具体常数进行分析,才能得到准确的点数上界。


动态开点相比于原始的线段树实现,本质仍是使用「满二叉树」的形式进行存储,只不过是按需创建区间,如果我们是按照连续段进行查询或插入,最坏情况下仍然会占到 4 * n4n 的空间,因此盲猜 \log{n}logn 的常数在 44 左右,保守一点可以直接估算到 66,因此我们可以估算点数为 6 * m * \log{n}6mlogn,其中 n = 1e9n=1e9m = 1e4m=1e4 分别代表值域大小和查询次数。


当然一个比较实用的估点方式可以「尽可能的多开点数」,利用题目给定的空间上界和我们创建的自定义类(结构体)的大小,尽可能的多开( Java128M128M 可以开到 5 * 10^65106 以上)。


代码:


class RecentCounter {
    class Node {
        // ls 和 rs 分别代表当前节点(区间)的左右子节点在 tr 的下标
        // val 代表在当前节点(区间)所包含的数的个数
        int ls, rs, val;
    }
    int N = (int)1e9, M = 800010, idx = 1;
    Node[] tr = new Node[M];
    void update(int u, int lc, int rc, int x, int v) {
        if (lc == x && rc == x) {
            tr[u].val += (rc - lc + 1) * v;
            return ;
        }
        lazyCreate(u);
        int mid = lc + rc >> 1;
        if (x <= mid) update(tr[u].ls, lc, mid, x, v);
        else update(tr[u].rs, mid + 1, rc, x, v);
        pushup(u);
    }
    int query(int u, int lc, int rc, int l, int r) {
        if (l <= lc && rc <= r) return tr[u].val;
        lazyCreate(u);
        int mid = lc + rc >> 1, ans = 0;
        if (l <= mid) ans = query(tr[u].ls, lc, mid, l, r);
        if (r > mid) ans += query(tr[u].rs, mid + 1, rc, l, r);
        return ans;
    }
    void lazyCreate(int u) {
        if (tr[u] == null) tr[u] = new Node();
        if (tr[u].ls == 0) {
            tr[u].ls = ++idx;
            tr[tr[u].ls] = new Node();
        }
        if (tr[u].rs == 0) {
            tr[u].rs = ++idx;
            tr[tr[u].rs] = new Node();
        }
    }
    void pushup(int u) {
        tr[u].val = tr[tr[u].ls].val + tr[tr[u].rs].val;
    }
    public int ping(int t) {
        update(1, 1, N, t, 1);
        return query(1, 1, N, Math.max(0, t - 3000), t);
    }
}
复制代码


  • 时间复杂度:令 ping 的调用次数为 mm,值域大小为 nn,线段树的插入和查询复杂度均为 O(\log{n})O(logn)
  • 空间复杂度:O(m * \log{n})O(mlogn)


分块



另外一个稍有遗憾的算法是「分块」。


通常来说,值域范围为 n = 1e9n=1e9,我们可以定义块大小为 \sqrt{n}n,这样时空复杂度都是 O(\sqrt{n})O(n)


回到本题,我们定义一个 region 数组,用于存储每个块所包含的数的个数。


对于在位置 xx 插入一个值 vv 而言,我们可以计算位置 xx 所在的块编号 idx = \left \lfloor \frac{x}{m} \right \rflooridx=mx,然后对块大小进行累加操作(region[idx] += xregion[idx]+=x)。同时由于在查询 [t - 3000, t][t3000,t] 时不总是覆盖完整的块(也就是我们可能需要询问某一段的总个数,而这一段仅是块内的部分区间),因此我们需要额外记录位置 xx 当前所包含的总数是多少,本题值域大小达到了 1e91e9,因此不能使用静态数组来做,只能使用哈希表来实现动态记录。


我们可以分析单个 ping 操作的计算量/复杂度:


  • update 操作:O(1)O(1)
  • query 操作:不限制区域大小的话,计算量为 1e5 * C1e5CCC 是一个小于 44 的常数),由于存在 [t - 3000, t][t3000,t] 的限制,相当于这部分操作全部变成块内了,计算量固定为 30003000


于是有通过了所有样例,居然还 TLE 的结果???(这是啥测评机制


网络异常,图片无法展示
|


但经过分析,我们知道瓶颈在于块内操作过多,我们可以利用 [t - 3000, t][t3000,t] 来优化我们的分块算法:直接定义块大小为 300300,然后倒推出需要多个块空间,分块算法就可以过了(特别说明:通过时间为 2022-05-06,未来可能还会有无聊的人来卡分块。 我不信,卡不掉 🤣


网络异常,图片无法展示
|


代码:


class RecentCounter {
    static int m = 300, n = (int)(1e9 / m) + 10;
    static Map<Integer, Integer> map = new HashMap<>();
    static int[] region = new int[n];
    int getIdx(int x) {
        return x / m;
    }
    void update(int x, int v) {
        map.put(x, map.getOrDefault(x, 0) + v);
        region[getIdx(x)] += v;
    }
    int query(int l, int r) {
        int ans = 0;
        if (getIdx(l) == getIdx(r)) {
            for (int k = l; k <= r; k++) ans += map.getOrDefault(k, 0);
        } else {
            int i = l, j = r;
            while (getIdx(i) == getIdx(l)) ans += map.getOrDefault(i++, 0);
            while (getIdx(j) == getIdx(r)) ans += map.getOrDefault(j--, 0);
            for (int k = getIdx(i); k <= getIdx(j); k++) ans += region[k];
        }
        return ans;
    }
    public RecentCounter() {
        map.clear();
        Arrays.fill(region, 0);
    }
    public int ping(int t) {
        update(t, 1);
        return query(Math.max(0, t - 3000), t);
    }
}
复制代码


  • 时间复杂度:通常情况下:调用次数为 mm,值域大小为 nn,复杂度为 O(\sqrt{n})O(n);本题:O(C)O(C),其中 C = 300C=300 为块大小
  • 空间复杂度:通常情况下:O(m +\sqrt{n})O(m+n);本题:O(m + M)O(m+M),其中 MM 为分块数组大小


最后



这是我们「刷穿 LeetCode」系列文章的第 No.933 篇,系列开始于 2021/01/01,截止于起始日 LeetCode 上共有 1916 道题目,部分是有锁题,我们将先把所有不带锁的题目刷完。


在这个系列文章里面,除了讲解解题思路以外,还会尽可能给出最为简洁的代码。如果涉及通解还会相应的代码模板。


为了方便各位同学能够电脑上进行调试和提交代码,我建立了相关的仓库:github.com/SharingSour…


在仓库地址里,你可以看到系列文章的题解链接、系列文章的相应代码、LeetCode 原题链接和其他优选题解。

相关文章
|
6月前
最小操作次数问题
最小操作次数问题
44 1
|
6月前
|
算法 测试技术 C#
C++二分查找算法:包含每个查询的最小区间
C++二分查找算法:包含每个查询的最小区间
|
5月前
1049 数列的片段和 (20 分) //运行超时
1049 数列的片段和 (20 分) //运行超时
|
6月前
LeetCode题:931下降路径最小和
LeetCode题:931下降路径最小和
45 0
|
11月前
|
算法 测试技术 C#
C++前缀和算法的应用:得到连续 K 个 1 的最少相邻交换次数 原理源码测试用例
C++前缀和算法的应用:得到连续 K 个 1 的最少相邻交换次数 原理源码测试用例
|
算法 前端开发
前端算法-寻找重复数
前端算法-寻找重复数
PHP 将一个数分成区间的数
PHP 将一个数分成区间的数
|
机器学习/深度学习
|
数据采集 大数据 数据库
爬虫识别-小于自设值的次数-代码实现读取默认时间|学习笔记
快速学习爬虫识别-小于自设值的次数-代码实现读取默认时间。
115 0
爬虫识别-小于自设值的次数-代码实现读取默认时间|学习笔记