398. 随机数索引 :「哈希表预处理」&「蓄水池抽样」

简介: 398. 随机数索引 :「哈希表预处理」&「蓄水池抽样」

网络异常,图片无法展示
|


题目描述



这是 LeetCode 上的 398. 随机数索引 ,难度为 中等


Tag : 「哈希表」、「模拟」、「随机化」、「蓄水池抽样」


给定一个可能含有重复元素的整数数组,要求随机输出给定的数字的索引。 您可以假设给定的数字一定存在于数组中。


注意:


数组大小可能非常大。 使用太多额外空间的解决方案将不会通过测试。


示例:


int[] nums = new int[] {1,2,3,3,3};
Solution solution = new Solution(nums);
// pick(3) 应该返回索引 2,3 或者 4。每个索引的返回概率应该相等。
solution.pick(3);
// pick(1) 应该返回 0。因为只有nums[0]等于1。
solution.pick(1);
复制代码


提示:


  • 1 <= nums.length <= 2 * 10^41<=nums.length<=2104
  • -2^{31} <= nums[i] <= 2^{31} - 1231<=nums[i]<=2311
  • target 确保存在于 nums
  • 最多调用 10^4104 次的 pick


哈希表 预处理(定长数据流)



切换英文补全一下数据范围:


  • 1 <= nums.length <= 2 * 10^41<=nums.length<=2104
  • -2^{31} <= nums[i] <= 2^{31} - 1231<=nums[i]<=2311
  • target 确保存在于 nums
  • 最多调用 10^4104 次的 pick


为了方便,我们令 nums 的长度为 nn,利用 nn 的数据范围为 2 * 10^42104,且完整的数组为初始化时已给出,我们可以通过使用「哈希表 + 预处理」的方式进行求解。


具体的,在构造函数传入 nums 时,遍历 nums 并存储每个 nums[i]nums[i] 对应的下标集合,即使用哈希表以 nums[i]nums[i] 为键,下标集合 List 作为值进行存储。


pick 操作时,通过 O(1)O(1) 的复杂度取出所有 nums[i] = targetnums[i]=target 的集合下标,再随机一个下标进行返回。


代码:


class Solution {
    Random random = new Random();
    Map<Integer, List<Integer>> map = new HashMap<>();
    public Solution(int[] nums) {
        int n = nums.length;
        for (int i = 0; i < n; i++) {
            List<Integer> list = map.getOrDefault(nums[i], new ArrayList<>());
            list.add(i);
            map.put(nums[i], list);
        }
    }
    public int pick(int target) {
        List<Integer> list = map.get(target);
        return list.get(random.nextInt(list.size()));
    }
}
复制代码


  • 时间复杂度:初始化的复杂度为 O(n)O(n)pick 操作的复杂度为 O(1)O(1)
  • 空间复杂度:O(n)O(n)


蓄水池抽样(不定长数据流)



nums 并不是在初始化时完全给出,而是持续以「流」的形式给出,且数据流的很长,不便进行预处理的话,我们只能使用「蓄水池抽样」的方式求解。


不了解「蓄水池抽样」的同学可以看前置 🧀 : 多语言入门「蓄水池抽样」知识点


具体的,我们在每次 pick 时对流进行遍历,由于数据流很大,我们不能在遍历过程中使用诸如数组的容器存储所有满足条件的下标,只能对于每个 nums[i] = targetnums[i]=target 执行「是否要将 ii 作为最新答案候选」的操作。


假设共有 mm 个下标满足 nums[i] = targetnums[i]=target,我们需要做到以 \frac{1}{m}m1 概率返回任一坐标。


我们规定当遇到第 kk 个满足 nums[i] = targetnums[i]=target 的下标时,执行一次 [0, k)[0,k) 的随机操作,当随机结果为 00 时(发生概率为 \frac{1}{k}k1),我们将该坐标作为最新的答案候选。


当对每一个 nums[i] = targetnums[i]=target 的下标都进行上述操作后,容易证明每一位下标返回的概率均为 \frac{1}{m}m1


假设最后返回的是第 kk 个满足条件的下标,发生概率为 = 第 kk 个下标被候选的概率 \times× 后面 k + 1k+1mm 个下标不被候选的概率 = \frac{1}{k} \times (1 - \frac{1}{k + 1}) \times ... \times (1 - \frac{1}{m})k1×(1k+11)×...×(1m1) = \frac{1}{m}m1


代码:


class Solution {
    Random random = new Random();
    int[] nums;
    public Solution(int[] _nums) {
        nums = _nums;
    }
    public int pick(int target) {
        int n = nums.length, ans = 0;
        for (int i = 0, cnt = 0; i < n; i++) {
            if (nums[i] == target) {
                cnt++;
                if (random.nextInt(cnt) == 0) ans = i;
            }
        }
        return ans;
    }
}
复制代码


  • 时间复杂度:初始化的复杂度为 O(1)O(1)pick 操作的复杂度为 O(n)O(n)
  • 空间复杂度:O(n)O(n)


最后



这是我们「刷穿 LeetCode」系列文章的第 No.398 篇,系列开始于 2021/01/01,截止于起始日 LeetCode 上共有 1916 道题目,部分是有锁题,我们将先把所有不带锁的题目刷完。


在这个系列文章里面,除了讲解解题思路以外,还会尽可能给出最为简洁的代码。如果涉及通解还会相应的代码模板。


为了方便各位同学能够电脑上进行调试和提交代码,我建立了相关的仓库:github.com/SharingSour…


在仓库地址里,你可以看到系列文章的题解链接、系列文章的相应代码、LeetCode 原题链接和其他优选题解。

相关文章
|
存储 关系型数据库 MySQL
linux环境安装8.0以上版本的MySQL详细教程(亲测好用)
linux环境安装8.0以上版本的MySQL详细教程(亲测好用)
4779 0
|
4月前
|
人工智能 Java 程序员
AI聊天秘籍:58种让AI变聪明的提问技巧
想让AI变成贾维斯一样的智能助手?别再用'帮我写个代码'这种直男对话了!从零基础到提示词大师,58种实用技巧让你的AI对话水平从小学生瞬间升级为研究生。掌握这些技巧,让AI不仅听懂你说什么,还知道你想要什么,工作效率直线飙升!#人工智能 #提示词工程 #ChatGPT #AI对话
1541 4
|
4月前
|
JavaScript Shell API
阿里云百炼 API 调用教程:准备 API-Key、配置环境变量和调用 API 流程
在使用阿里云百炼平台的大模型能力时,API 调用是核心环节 —— 无论是开发 AI 应用、测试模型效果,还是搭建智能服务,都需要通过 API 将大模型能力集成到自己的系统中。不过对很多开发者来说,从准备密钥到实际调用的流程可能存在疑问,比如 “API-Key 怎么获取”“环境变量配置有什么用”“不同语言怎么写调用代码”。本文结合最新的实操细节,用通俗的语言把整个流程拆解开,从账号准备到多语言调用,每一步都附具体操作和代码示例,帮大家快速上手。
|
11月前
|
Ubuntu Linux Windows
IP地址查看方法
本指南介绍了在不同操作系统中查看设备IP地址的方法。在Windows系统中,可通过命令提示符(输入`ipconfig`)或设置界面查找IPv4地址;Linux系统中,使用终端命令`ifconfig`或`ip addr show`获取网络接口的IP;Mac系统则可在“系统偏好设置”中的“网络”查看,或通过终端执行相同命令获取。这些方法简单易行,适用于各种常见场景。
5378 11
|
JavaScript 应用服务中间件 nginx
Vue项目部署:如何打包并上传至服务器进行部署?
以上就是Vue项目打包及部署的方法,希望对你有所帮助。描述中可能会有一些小疏漏,但基本流程应该没有问题。记住要根据你的实际情况调整对应的目录路径和服务器IP地址等信息。此外,实际操作时可能会遇到各种问题,解决问题的能力是每一位开发者必备的技能。祝你部署顺利!
2604 17
|
应用服务中间件
Tomcat日志中文乱码
通过以上步骤,你可以在Tomcat日志中解决中文乱码问题,确保日志以UTF-8编码输出。 买CN2云服务器,免备案服务器,高防服务器,就选蓝易云。百度搜索:蓝易云
409 4
|
XML JSON API
微服务是什么
微服务是什么
1262 0
|
消息中间件 存储 缓存
|
SQL 安全 关系型数据库
渗透测试学习笔记
旨在起到工具书及闲暇翻阅功能
1964 0
|
SQL 关系型数据库 MySQL
MySQL之——源码编译MySQL8.x+升级gcc+升级cmake(亲测完整版)
最近,在CentOS 6.8服务器上编译安装MySQL 8.0.18的源码,百度了许久,发现网上的安装方式没一个可用的。基本都是基于CentOS 7.x来安装MySQL8.0,并且安装过程中会出现各种问题,按照他们的文章进行安装根本解决不了问题。更重要的一点就是,很多文章的内容一模一样!!我就纳闷了,那些发表文章的人,自己真的安装并且验证过吗?还是只是一味的抄袭呢?!
1189 0
MySQL之——源码编译MySQL8.x+升级gcc+升级cmake(亲测完整版)