1994. 好子集的数目 : 状压 DP 运用题

简介: 1994. 好子集的数目 : 状压 DP 运用题

网络异常,图片无法展示
|


题目描述



这是 LeetCode 上的 1994. 好子集的数目 ,难度为 困难


Tag : 「状压 DP」


给你一个整数数组 nums 。如果 nums 的一个子集中,所有元素的乘积可以表示为一个或多个 互不相同的质数 的乘积,那么我们称它为 好子集 。


  • 比方说,如果 nums = [1, 2, 3, 4]
  • [2, 3][1, 2, 3][1, 3] 是 好 子集,乘积分别为 6 = 2*36 = 2*33 = 3
  • [1, 4][4] 不是 好 子集,因为乘积分别为 4 = 2*24 = 2*2
  • 请你返回nums 中不同的 好 子集的数目对 10^9 + 7109+7 取余 的结果。


nums 中的 子集 是通过删除 nums 中一些(可能一个都不删除,也可能全部都删除)元素后剩余元素组成的数组。如果两个子集删除的下标不同,那么它们被视为不同的子集。


示例 1:


输入:nums = [1,2,3,4]
输出:6
解释:好子集为:
- [1,2]:乘积为 2 ,可以表示为质数 2 的乘积。
- [1,2,3]:乘积为 6 ,可以表示为互不相同的质数 2 和 3 的乘积。
- [1,3]:乘积为 3 ,可以表示为质数 3 的乘积。
- [2]:乘积为 2 ,可以表示为质数 2 的乘积。
- [2,3]:乘积为 6 ,可以表示为互不相同的质数 2 和 3 的乘积。
- [3]:乘积为 3 ,可以表示为质数 3 的乘积。
复制代码


示例 2:


输入:nums = [4,2,3,15]
输出:5
解释:好子集为:
- [2]:乘积为 2 ,可以表示为质数 2 的乘积。
- [2,3]:乘积为 6 ,可以表示为互不相同质数 2 和 3 的乘积。
- [2,15]:乘积为 30 ,可以表示为互不相同质数 2,3 和 5 的乘积。
- [3]:乘积为 3 ,可以表示为质数 3 的乘积。
- [15]:乘积为 15 ,可以表示为互不相同质数 3 和 5 的乘积。
复制代码


提示:


  • 1 <= nums.length <= 10^51<=nums.length<=105
  • 1 <= nums[i] <= 301<=nums[i]<=30


状压 DP



该问题属于 NP 完全问题,注定不存在多项式解决方案,只能通过「爆搜 + 剪枝」或「状压 DP」来求解。


对子集的乘积进行质数分解,等价于对子集每一位数进行质数分解。


一个显然的突破口是 1 <= nums[i] <= 301<=nums[i]<=30,再加上题目对于「好子集」的定义,我们可以进一步缩减可选数的数量,不超过 3030 的质数个数包括 [2, 3, 5, 7, 11, 13, 17, 19, 23, 29][2,3,5,7,11,13,17,19,23,29](共 1010 个),将其记作 pp,在一个好子集中,每个 p[i]p[i] 最多出现一次。


同时,题目规定数值相同,下标不同均视为不同方案,因此我们可以先使用数组 cntscnts 统计在 numsnums 中每个数的出现次数,cnts[val] = xcnts[val]=x 含义为数值 valvalnumsnums 中的出现次数为 xx 次。


使用的数有限(共 1010 个),并且使用到的数最多出现一次,容易想到使用「状压 DP」来求解:我们使用一个二进制数来表示好子集乘积最终能拆解成哪些质数,如果拆解结果中包含 p[i]p[i],对应的二进制表示中的第 ii 位则为 11,否则为 00


定义 f[state]f[state] 为当前子集乘积拆解结果的用到的质数为 statestate 时的方案数,statestate 为一个长度 1010 的二进制数,若 statestate 中的第 kk 位二进制表示为 11,代表数值 p[k]p[k] 在拆解结果中出现过;若第 kk 位二进制表示为 00 代表 p[k]p[k] 在拆解结果中没出现过。


我们有起始化条件:空集,即 f[0] = 1f[0]=1


不失一般性考虑 f[s]f[s] 该如何计算:从前往后考虑每个数值(范围 [2, 30][2,30] 的数,11 添加与否不对好子集产生影响,最后讨论)是否可以加入到子集中,一个数值 tt 能够添加到子集中的充要条件为题目给定的条件:该数不会被相同的质数相乘表示。


如果一个数值 tt 能够添加到好子集中,我们通过「试除法」将其分解为 pp 中的多个质数,并使用二进制数 curcur 来表示用到了 pp 中的哪些质数,然后需要判断 tt 能够添加到那些子集中,其实就是枚举与 curcur 无交集的状态 prevprev,最终的 f[s]f[s] 为「所有合法的 prevprev 的状态数 f[prev]f[prev]」与「数值 tt 的出现次数 cnts[t]cnts[t] 」的乘积之和。


需要注意的是,由于我们是从范围 [2, 30][2,30] 范围内从前往后考虑每个 tt,因此在枚举 prevprev 时需要进行倒序遍历,确保计算 f[s]f[s] 所依赖的 f[prev]f[prev] 为不考虑当前数值 tt 时的方案数


由「质数 pp 组成的好子集方案数」为 ans = \sum_{state' = 1}^{{1 << 10}} f[state']ans=state=11<<10f[state],其中 state'state 对应一个合法的好子集方案。


在此基础上,再考虑数值 11 对答案的影响:在每个合法的 state'state 前提下,增加若干个 11 并不影响子集乘积(即好子集增加 11 后仍为好子集),因此每个合法子集 state'state 可以对应出 2^{cnts[1]}2cnts[1] 个具体方案(代表每个 11 即可以选,也可以不选)。


代码:


class Solution {
    int MOD = (int)1e9+7;
    int[] p = new int[]{2, 3, 5, 7, 11, 13, 17, 19, 23, 29};
    int[] cnts = new int[35];
    public int numberOfGoodSubsets(int[] nums) {
        int n = nums.length;
        for (int i : nums) cnts[i]++;
        int mask = 1 << 10;
        long[] f = new long[mask];
        f[0] = 1;
        for (int i = 2; i <= 30; i++) {
            if (cnts[i] == 0) continue;
            // 对 i 进行试除
            int cur = 0, x = i;
            boolean ok = true;
            for (int j = 0; j < 10; j++) {
                int t = p[j], c = 0;
                while (x % t == 0) {
                    cur |= (1 << j);
                    x /= t; c++;
                }
                // 如果 i 能够被同一质数试除多次,说明 i 不能加到子集,跳过
                if (c > 1) { 
                    ok = false;
                    break;
                }
            }
            if (!ok) continue;
            // 枚举前一状态 prev
            //(确保考虑一个新数值 i 时,依赖的子集 prev 存储的为尚未考虑 i 的方案数)
            for (int prev = mask - 1; prev >= 0; prev--) {
                // 只有当前选择数与前一状态不冲突,则能够进行转移,将方案数进行累加
                if ((prev & cur) != 0) continue;
                f[prev | cur] = (f[prev | cur] + f[prev] * cnts[i]) % MOD;
            }
        }
        long ans = 0;
        // 统计所有非空集的方案数
        for (int i = 1; i < mask; i++) ans = (ans + f[i]) % MOD;
        // 在此基础上,考虑每个 1 选择与否对答案的影响
        for (int i = 0; i < cnts[1]; i++) ans = ans * 2 % MOD;
        return (int) ans;
    }
}
复制代码


  • 时间复杂度:预处理每个数值的出现次数复杂度为 O(n)O(n);令数值范围 C = 30C=30,状态数为 M = 1024M=1024,DP 部分复杂度为 O(C * M)O(CM)。整体复杂度为 O(n + C * M)O(n+CM)
  • 空间复杂度:O(C + M)O(C+M)


最后



这是我们「刷穿 LeetCode」系列文章的第 No.1994 篇,系列开始于 2021/01/01,截止于起始日 LeetCode 上共有 1916 道题目,部分是有锁题,我们将先把所有不带锁的题目刷完。


在这个系列文章里面,除了讲解解题思路以外,还会尽可能给出最为简洁的代码。如果涉及通解还会相应的代码模板。


为了方便各位同学能够电脑上进行调试和提交代码,我建立了相关的仓库:github.com/SharingSour…


在仓库地址里,你可以看到系列文章的题解链接、系列文章的相应代码、LeetCode 原题链接和其他优选题解。

相关文章
|
6月前
leetcode-1994:好子集的数目
leetcode-1994:好子集的数目
65 0
|
算法
求最大连续子段和 的 dp算法
对于这样的问题,我们可以直接用暴力,一个双重循环,虽说可以,但也没有更高明的方法? 我们再分析这个问题,如果我们知道了某个数前面一段数的和,我们就该考虑把这个数加入到前一段,还是重新开始一段。这个地方很重要,如果前一段的和小于0,我们重新建一段,反之加到前一段。这样我们就可以把n个数分成几段了,且每一段都求出了他们的和,然后再循环一次求出最大的一个和,我们就得到想要的结果了,也可以在分段的时候直接求结果。
46 0
|
11月前
|
算法 测试技术 C#
C++前缀和算法的应用:统计得分小于K的子数组数目
C++前缀和算法的应用:统计得分小于K的子数组数目
|
6月前
|
算法 测试技术 C#
【状态机dp 状态压缩 分组】1994. 好子集的数目
【状态机dp 状态压缩 分组】1994. 好子集的数目
|
6月前
|
算法 测试技术 C#
【状态机dp】【 排序 】 2809使数组和小于等于 x 的最少时间
【状态机dp】【 排序 】 2809使数组和小于等于 x 的最少时间
|
6月前
|
算法 测试技术 C++
【动态规划】1301. 最大得分的路径数目
【动态规划】1301. 最大得分的路径数目
LeetCode-2044 统计按位或能得到最大值子集的数目
LeetCode-2044 统计按位或能得到最大值子集的数目
|
开发工具
数组的子集能否累加出K
数组的子集能否累加出K
数组的子集能否累加出K
Day27——39. 组合总和 40.组合总和II 131.分割回文串
Day27——39. 组合总和 40.组合总和II 131.分割回文串
95 0