2028. 找出缺失的观测数据 : 构造运用题

简介: 2028. 找出缺失的观测数据 : 构造运用题

网络异常,图片无法展示
|


题目描述



这是 LeetCode 上的 2028. 找出缺失的观测数据 ,难度为 中等


Tag : 「模拟」、「构造」


现有一份 n + mn+m 次投掷单个「六面」骰子的观测数据,骰子的每个面从 1166 编号。观测数据中缺失了 nn 份,你手上只拿到剩余 mm 次投掷的数据。幸好你有之前计算过的这 n + mn+m 次投掷数据的平均值。


给你一个长度为 mm 的整数数组 rolls ,其中 rolls[i]rolls[i] 是第 ii 次观测的值。同时给你两个整数 meanmeannn


返回一个长度为 nn 的数组,包含所有缺失的观测数据,且满足这 n + mn+m 次投掷的平均值是 meanmean


如果存在多组符合要求的答案,只需要返回其中任意一组即可。如果不存在答案,返回一个空数组。


kk 个数字的 平均值 为这些数字求和后再除以 kk


注意 meanmean 是一个整数,所以 n + mn+m 次投掷的总和需要被 n + mn+m 整除。


示例 1:


输入:rolls = [3,2,4,3], mean = 4, n = 2
输出:[6,6]
解释:所有 n + m 次投掷的平均值是 (3 + 2 + 4 + 3 + 6 + 6) / 6 = 4 。
复制代码


示例 2:


输入:rolls = [1,5,6], mean = 3, n = 4
输出:[2,3,2,2]
解释:所有 n + m 次投掷的平均值是 (1 + 5 + 6 + 2 + 3 + 2 + 2) / 7 = 3 。
复制代码


示例 3:


输入:rolls = [1,2,3,4], mean = 6, n = 4
输出:[]
解释:无论丢失的 4 次数据是什么,平均值都不可能是 6 。
复制代码


示例 4:


输入:rolls = [1], mean = 3, n = 1
输出:[5]
解释:所有 n + m 次投掷的平均值是 (1 + 5) / 2 = 3 。
复制代码


提示:


  • m == rolls.lengthm==rolls.length
  • 1 <= n, m <= 10^51<=n,m<=105
  • 1 <= rolls[i], mean <= 61<=rolls[i],mean<=6


构造



根据题意,我们需要构造长度为 nn 的序列 ansans,使得 ansansrollsrolls 并集的平均值为 meanmean


由于最终的平均值 meanmean 已知,我们可以直接算得两序列之和为 t = (m + n) * meant=(m+n)mean


使用 tt 减去 \sum_{i = 0}^{m}rolls[i]i=0mrolls[i] 可得 \sum_{i = 0}^{n}ans[i]i=0nans[i]。我们知道一个长度为 nn 的有效序列的元素和范围为 [n, 6 * n][n,6n](骰子编号为 [1, 6][1,6]),根据 \sum_{i = 0}^{m}rolls[i]i=0mrolls[i][n, 6 * n][n,6n] 关系进行分情况讨论:


  • 如果 \sum_{i = 0}^{n}ans[i]i=0nans[i] 不落在 [n, 6 * n][n,6n] 范围内,无解,直接返回空数组;
  • 如果 \sum_{i = 0}^{n}ans[i]i=0nans[i] 落在 [n, 6 * n][n,6n] 范围内,有解,此时尝试构造一个合法的 ansans : 起始使用 \left \lfloor \frac{\sum_{i = 0}^{n}ans[i]}{n} \right \rfloorni=0nans[i] 填充 ansans,若 \left \lfloor \frac{\sum_{i = 0}^{n}ans[i]}{n} \right \rfloor * n < \sum_{i = 0}^{n}ans[i]ni=0nans[i]n<i=0nans[i],计算两者差异值 dd,并尝试将 dd 分摊到前 ddans[i]ans[i] 上(该过程一定可以顺利进行)。


代码:


class Solution {
    public int[] missingRolls(int[] rolls, int mean, int n) {
        int m = rolls.length, cnt = m + n;
        int t = mean * cnt;
        for (int i : rolls) t -= i;
        if (t < n || t > 6 * n) return new int[0];
        int[] ans = new int[n];
        Arrays.fill(ans, t / n);
        if (t / n * n < t) {
            int d = t - (t / n * n), idx = 0;
            while (d-- > 0) ans[idx++]++;
        }
        return ans;
    }
}
复制代码


  • 时间复杂度:O(m + n)O(m+n)
  • 空间复杂度:O(n)O(n)


最后



这是我们「刷穿 LeetCode」系列文章的第 No.2028 篇,系列开始于 2021/01/01,截止于起始日 LeetCode 上共有 1916 道题目,部分是有锁题,我们将先把所有不带锁的题目刷完。


在这个系列文章里面,除了讲解解题思路以外,还会尽可能给出最为简洁的代码。如果涉及通解还会相应的代码模板。


为了方便各位同学能够电脑上进行调试和提交代码,我建立了相关的仓库:github.com/SharingSour…


在仓库地址里,你可以看到系列文章的题解链接、系列文章的相应代码、LeetCode 原题链接和其他优选题解。

相关文章
|
7月前
|
机器学习/深度学习 数据采集 算法
大模型开发:什么是时间序列预测,以及如何处理此类数据?
时间序列预测分析历史数据以预测未来,涉及数据收集、预处理、模型选择(如ARIMA或DeepAR)、模型训练、评估及未来值预测。处理时序数据需注意时间依赖性,预处理和模型选择对准确性影响大。
147 3
|
7月前
leetcode-2028:找出缺失的观测数据
leetcode-2028:找出缺失的观测数据
58 0
|
7月前
|
数据采集 数据挖掘 数据处理
数据清洗的主要步骤包括**理解数据、处理重复值、处理空缺值、处理异常值、数据标准化和数据收集
【4月更文挑战第3天】数据清洗的主要步骤包括**理解数据、处理重复值、处理空缺值、处理异常值、数据标准化和数据收集
342 2
|
3月前
|
机器学习/深度学习 数据采集 算法
时间序列结构变化分析:Python实现时间序列变化点检测
在时间序列分析和预测中,准确检测结构变化至关重要。新出现的分布模式往往会导致历史数据失去代表性,进而影响基于这些数据训练的模型的有效性。
255 1
|
1月前
|
存储 机器学习/深度学习 数据可视化
数据集中存在大量的重复值,会对后续的数据分析和处理产生什么影响?
数据集中存在大量重复值可能会对后续的数据分析和处理产生多方面的负面影响
57 10
|
2月前
|
Prometheus 监控 Kubernetes
监控对象都有哪些分类
【10月更文挑战第9天】本文介绍了多种监控类型及其特点,包括业务监控、应用监控、组件监控、资源监控、设备监控及网络监控。
|
4月前
|
SQL 缓存 数据挖掘
数据平台问题之复合指标生成中维度能力如何处理
数据平台问题之复合指标生成中维度能力如何处理
|
7月前
|
机器学习/深度学习 人工智能 运维
人工智能平台PAI 操作报错合集之请问Alink的算法中的序列异常检测组件,是对数据进行分组后分别在每个组中执行异常检测,而不是将数据看作时序数据进行异常检测吧
阿里云人工智能平台PAI (Platform for Artificial Intelligence) 是阿里云推出的一套全面、易用的机器学习和深度学习平台,旨在帮助企业、开发者和数据科学家快速构建、训练、部署和管理人工智能模型。在使用阿里云人工智能平台PAI进行操作时,可能会遇到各种类型的错误。以下列举了一些常见的报错情况及其可能的原因和解决方法。
|
7月前
|
数据采集 SQL 监控
分析重复数据通常涉及以下步骤,以确保对重复项的来源和性质有深入理解
【4月更文挑战第2天】分析重复数据通常涉及以下步骤,以确保对重复项的来源和性质有深入理解
78 1
|
7月前
|
机器学习/深度学习 运维 算法
【视频】检测异常值的4种方法和R语言时间序列分解异常检测
【视频】检测异常值的4种方法和R语言时间序列分解异常检测