51nod 1202 子序列个数 (不重复子序列个数)

简介: 51nod 1202 子序列个数 (不重复子序列个数)

子序列的定义:对于一个序列a=a[1],a[2],…a[n]。则非空序列a’=a[p1],a[p2]…a[pm]为a的一个子序列,其中1<=p1<p2<…<pm<=n。

例如4,14,2,3和14,1,2,3都为4,13,14,1,2,3的子序列。对于给出序列a,有些子序列可能是相同的,这里只算做1个,请输出a的不同子序列的数量。由于答案比较大,输出Mod 10^9 + 7的结果即可。

输入

第1行:一个数N,表示序列的长度(1 <= N <= 100000)

第2 - N + 1行:序列中的元素(1 <= a[i] <= 100000)

输出

输出a的不同子序列的数量Mod 10^9 + 7。

输入样例

4

1

2

3

2

输出样例

13


我们知道如果不存在重复的数,那么dp[i]=dp[i-1]*2(含空集的情况)。现在考虑出现了重复的数。比如当前要取的数为a[i],且a[i]最近一次在之前的j位置出现过了。那么有dp[i]=dp[i-1]*2-dp[j-1]。所以我们利用一个数组mark记录下a[i]出现的位置就好了,没有出现过为0。


假设子序列的前k个数的子序列个数为d(k),那么前k - 1个子序列的个数就为d(k - 1)个子序列,从k - 1 到k的变化是怎样的呢?


1、假设数组a[N]第k个数为a[k],如果a[k] 与前面的k - 1个数都不相同,那么就有 : d(k) = d(k - 1) + 【d(k - 1) + 1】 = 2d(k - 1) + 1,为什么呢?可以这样想,对于前k- 1项的子序列个数为d(k - 1),那前k个数,无非就是在前k - 1项的基础上多加了一个数a[k](a[k]与前k - 1个数任意一个都相等),那就在原来的组合上加上a[k],就有d(k - 1)个,还有一个a[k]自己构成一个子序列,所以还要加1;


2、假设a[k] 与前面的k - 1个数其中一个相等,那依旧加上前k - 1个子序列个数 d(k - 1),但是由于前面有与a[k]相等的数,所以要减掉重复的部分,如何找到重复的部分呢,假设离k最近的一个与a[k]相等的数为第t个a[t] = a[k],即序列(a[1], a[2], ……,a[t],……,a[k - 1],a[k]),a[t] = a[k];我们已经知道序列(a[1], a[2], ……,a[t])的序列个数为d(t),那么d(t - 1)就是重复的部分,这里需要自己做好思考,也是算法的关键部分,这里我要解释的地方是,为什么只需要找到离k最近的t使得a[t] = a[k]?给出的解释是:我们是从1 - n对数组进行遍历的,计算d(i)的i就是从1到n依次计算的,那么第一次遇到a[k] = a[t]的情况满足条件:有且仅有一个t使得a[t] = a[k],比如序列(1, 2, 3, 2, 4, 2),分别计算d(1),d(2),d(3),d(4),d(5),d(6);我们在计算d(4)的时候发现a[4] = a[2](假设下标从1开始),所以d(4) = 2*d(3) - d(2 -1) = 2d(3) - d(1);当计算d(6)的时候也有a[6] = a[4] = a[2],但是由于我们前面已经把a[2]重复的部分减掉了,所以不需要再减,d(6) = 2 * d(5) - d(4 - 1) = 2d(5) - d(3).


过程繁琐,我总结一下结论:


状态转移方程为:


d(k) = 2 * d(k - 1) + 1; a[k] != a[i],i = 1,2,3……k - 1;


d(k) = 2 * d(k - 1) - d(t - 1); 从k往前搜索,存在离k最近的t,使得a[t] = a[k].

#include <bits/stdc++.h>
using namespace std;
const int mod = 1e9 + 7;
const int maxn = 1e6 + 5;
int a[maxn], dp[maxn], mark[maxn];
int main() {
  ios::sync_with_stdio(false);
  cin.tie(0); cout.tie(0);
  int n;
  cin >> n;
  for (int i = 1; i <= n; i++) {
    cin >> a[i];
  }
  dp[0] = 1;
  for (int i = 1; i <= n; i++) {
    if (mark[a[i]]) {
      dp[i] = 2 * dp[i - 1] - dp[mark[a[i]] - 1];
      dp[i] = (dp[i] % mod + mod) % mod;
    } else {
      dp[i] = 2 * dp[i - 1] % mod;
    }
    mark[a[i]] = i;
  }
  cout << ((dp[n] - 1) % mod + mod) % mod << endl;
  return 0;
}
相关文章
|
6月前
|
C++
两种解法解决LCR 008. 长度最小的子数组【C++】
两种解法解决LCR 008. 长度最小的子数组【C++】
|
6月前
|
Java C++ Python
leetcode-209:长度最小的子数组
leetcode-209:长度最小的子数组
44 0
|
6月前
|
算法
LeetCode算法题---无重复字符的最长子串、寻找两个正序数组的中位数(三)
LeetCode算法题---无重复字符的最长子串、寻找两个正序数组的中位数(三)
63 0
|
5月前
|
C++
给定一个长度为n的数列,将这个数列按从小到大的顺序排列。1<=n<=200
给定一个长度为n的数列,将这个数列按从小到大的顺序排列。1<=n<=200
|
6月前
392.判断子序列
392.判断子序列
23 0
|
6月前
1493.删掉一个元素以后全为1的最长子数组
1493.删掉一个元素以后全为1的最长子数组
28 0
|
6月前
|
人工智能 算法 Java
判断子序列
判断子序列
32 0
|
6月前
leetcode-6129:全 0 子数组的数目
leetcode-6129:全 0 子数组的数目
57 0
|
6月前
【每日一题Day157】LC1574删除最短的子数组使剩余数组有序 | 双指针 + 二分查找
【每日一题Day157】LC1574删除最短的子数组使剩余数组有序 | 双指针 + 二分查找
44 0
|
11月前
|
算法 测试技术 C#
C++ 算法:区间和的个数
C++ 算法:区间和的个数