先来看几个问题吧。
1.什么是树状数组?
顾名思义,就是用数组来模拟树形结构呗。那么衍生出一个问题,为什么不直接建树?答案是没必要,因为树状数组能处理的问题就没必要建树。和Trie树的构造方式有类似之处。
2.树状数组可以解决什么问题
可以解决大部分基于区间上的更新以及求和问题。
3.树状数组和线段树的区别在哪里
树状数组可以解决的问题都可以用线段树解决,这两者的区别在哪里呢?树状数组的系数要少很多,就比如字符串模拟大数可以解决大数问题,也可以解决1+1的问题,但没人会在1+1的问题上用大数模拟。
4.树状数组的优点和缺点
修改和查询的复杂度都是O(logN),而且相比线段树系数要少很多,比传统数组要快,而且容易写。
缺点是遇到复杂的区间问题还是不能解决,功能还是有限。
一、树状数组介绍
二叉树大家一定都知道,如下图
如果每个父亲都存的是两个儿子的值,是不是就可以解决这类区间问题了呢。是的没错,但是这样的树形结构,叫做线段树。
那真的的树形结构是怎样的,和上图类似,但省去了一些节点,以达到用数组建树。
黑色数组代表原来的数组(下面用A[i]代替),红色结构代表我们的树状数组(下面用C[i]代替),发现没有,每个位置只有一个方框,令每个位置存的就是子节点的值的和,则有
- C[1] = A[1];
- C[2] = A[1] + A[2];
- C[3] = A[3];
- C[4] = A[1] + A[2] + A[3] + A[4];
- C[5] = A[5];
- C[6] = A[5] + A[6];
- C[7] = A[7];
- C[8] = A[1] + A[2] + A[3] + A[4] + A[5] + A[6] + A[7] + A[8];
可以发现,这颗树是有规律的
C[i] = A[i - 2k+1] + A[i - 2k+2] + ... + A[i]; //k为i的二进制中从最低位到高位连续零的长度
例如i = 8(1000)时候,k = 3,可自行验证。
这个怎么实现求和呢,比如我们要找前7项和,那么应该是SUM = C[7] + C[6] + C[4];
而根据上面的式子,容易的出SUMi = C[i] + C[i-2k1] + C[(i - 2k1) - 2k2] + .....;
其实树状数组就是一个二进制上面的应用。
现在新的问题来了2^k该怎么求呢,不难得出2^k = i&(i^(i-1));但这个还是不好求出呀,前辈的智慧就出来了,2^k = i&(-i);
为什么呢?
这里利用的负数的存储特性,负数是以补码存储的,对于整数运算 x&(-x)有
● 当x为0时,即 0 & 0,结果为0;
●当x为奇数时,最后一个比特位为1,取反加1没有进位,故x和-x除最后一位外前面的位正好相反,按位与结果为0。结果为1。
●当x为偶数,且为2的m次方时,x的二进制表示中只有一位是1(从右往左的第m+1位),其右边有m位0,故x取反加1后,从右到左第有m个0,第m+1位及其左边全是1。这样,x& (-x) 得到的就是x。
●当x为偶数,却不为2的m次方的形式时,可以写作x= y * (2^k)。其中,y的最低位为1。实际上就是把x用一个奇数左移k位来表示。这时,x的二进制表示最右边有k个0,从右往左第k+1位为1。当对x取反时,最右边的k位0变成1,第k+1位变为0;再加1,最右边的k位就又变成了0,第k+1位因为进位的关系变成了1。左边的位因为没有进位,正好和x原来对应的位上的值相反。二者按位与,得到:第k+1位上为1,左边右边都为0。结果为2^k。
总结一下:x&(-x),当x为0时结果为0;x为奇数时,结果为1;x为偶数时,结果为x中2的最大次方的因子。
而且这个有一个专门的称呼,叫做lowbit,即取2^k。
二、如何建立树状数组
上面已经解释了如何用树状数组求区间和,那么如果我们要更新某一个点的值呢,还是一样的,上面说了C[i] = A[i - 2k+1] + A[i - 2k+2] + ... + A[i],那么如果我们更新某个A[i]的值,则会影响到所有包含有A[i]位置。如果求A[i]包含哪些位置里呢,同理有
A[i] 包含于 C[i + 2k]、C[(i + 2k) + 2k]...;
好,现在已经搞清楚了更新和求和,就可以来建树状数组了。如果上面的求和、更新或者lowbit步骤还没搞懂的化,建议再思考弄懂再往下看。
那么构造一个树状数组则为
1 int n; 2 int a[1005],c[1005]; //对应原数组和树状数组 3 4 int lowbit(int x){ 5 return x&(-x); 6 } 7 8 void updata(int i,int k){ //在i位置加上k 9 while(i <= n){ 10 c[i] += k; 11 i += lowbit(i); 12 } 13 } 14 15 int getsum(int i){ //求A[1 - i]的和 16 int res = 0; 17 while(i > 0){ 18 res += c[i]; 19 i -= lowbit(i); 20 } 21 return res; 22 }
这样就构造了一个树状数组。下面看一道模板题目吧。
题目链接:https://vjudge.net/problem/HDU-1166
直接看代码吧
1 #include <bits/stdc++.h> 2 using namespace std; 3 4 int n,m; 5 int a[50005],c[50005]; //对应原数组和树状数组 6 7 int lowbit(int x){ 8 return x&(-x); 9 } 10 11 void updata(int i,int k){ //在i位置加上k 12 while(i <= n){ 13 c[i] += k; 14 i += lowbit(i); 15 } 16 } 17 18 int getsum(int i){ //求A[1 - i]的和 19 int res = 0; 20 while(i > 0){ 21 res += c[i]; 22 i -= lowbit(i); 23 } 24 return res; 25 } 26 27 int main(){ 28 int t; 29 cin>>t; 30 for(int tot = 1; tot <= t; tot++){ 31 cout << "Case " << tot << ":" << endl; 32 memset(a, 0, sizeof a); 33 memset(c, 0, sizeof c); 34 cin>>n; 35 for(int i = 1; i <= n; i++){ 36 cin>>a[i]; 37 updata(i,a[i]); //输入初值的时候,也相当于更新了值 38 } 39 40 string s; 41 int x,y; 42 while(cin>>s && s[0] != 'E'){ 43 cin>>x>>y; 44 if(s[0] == 'Q'){ //求和操作 45 int sum = getsum(y) - getsum(x-1); //x-y区间和也就等于1-y区间和减去1-(x-1)区间和 46 cout << sum << endl; 47 } 48 else if(s[0] == 'A'){ 49 updata(x,y); 50 } 51 else if(s[0] == 'S'){ 52 updata(x,-y); //减去操作,即为加上相反数 53 } 54 } 55 56 } 57 return 0; 58 }
这就是最简单的点更新区间求和了。
三、树状数组的几种变式(区间更新,区间查询)
上面介绍的是最普通的单点更新,区间查询,但如果有些时候是区间更新,单点求和怎么半,又或是区间更新,区间求和怎么办。这里将介绍各种情况该怎么写。
如果上面的单点更新,区间查询还没看懂,建议再思考再往下看。
1.单点更新、单点查询
传统数组可做
2.单点更新、区间查询
已讲解,详细看上面
3.区间更新、单点查询
这就是第一个问题,如果题目是让你把x-y区间内的所有值全部加上k或者减去k,然后查询操作是问某个点的值,这种时候该怎么做呢。如果是像上面的树状数组来说,就必须把x-y区间内每个值都更新,这样的复杂度肯定是不行的,这个时候,就不能再用数据的值建树了,这里我们引入差分,利用差分建树。
假设我们规定A[0] = 0;
则有 A[i] = Σij = 1D[j];(D[j] = A[j] - A[j-1]),即前面i项的差值和,这个有什么用呢?例如对于下面这个数组
- A[] = 1 2 3 5 6 9
- D[] = 1 1 1 2 1 3
如果我们把[2,5]区间内值加上2,则变成了
- A[] = 1 4 5 7 8 9
- D[] = 1 3 1 2 1 1
发现了没有,当某个区间[x,y]值改变了,区间内的差值是不变的,只有D[x]和D[y+1]的值发生改变,至于为什么我想我就不用解释了吧。
所以我们就可以利用这个性质对D[]数组建立树状数组,代码为:
1 int n,m; 2 int a[50005] = {0},c[50005]; //对应原数组和树状数组 3 4 int lowbit(int x){ 5 return x&(-x); 6 } 7 8 void updata(int i,int k){ //在i位置加上k 9 while(i <= n){ 10 c[i] += k; 11 i += lowbit(i); 12 } 13 } 14 15 int getsum(int i){ //求D[1 - i]的和,即A[i]值 16 int res = 0; 17 while(i > 0){ 18 res += c[i]; 19 i -= lowbit(i); 20 } 21 return res; 22 } 23 24 int main(){ 25 cin>>n;27 for(int i = 1; i <= n; i++){ 28 cin>>a[i]; 29 updata(i,a[i] - a[i-1]); //输入初值的时候,也相当于更新了值 31 } 32 33 //[x,y]区间内加上k 34 updata(x,k); //A[x] - A[x-1]增加k 35 updata(y+1,-k); //A[y+1] - A[y]减少k 36 37 //查询i位置的值 38 int sum = getsum(i); 39 40 return 0; 41 }
这样就把,原来要更新一个区间的值变成了只需要更新两个点。也很容易理解吧。
4.区间更新、区间查询
上面我们说的差值建树状数组,得到的是某个点的值,那如果我既要区间更新,又要区间查询怎么办。这里我们还是利用差分,由上面可知
∑ni = 1A[i] = ∑ni = 1 ∑ij = 1D[j];
则A[1]+A[2]+...+A[n]
= (D[1]) + (D[1]+D[2]) + ... + (D[1]+D[2]+...+D[n])
= n*D[1] + (n-1)*D[2] +... +D[n]
= n * (D[1]+D[2]+...+D[n]) - (0*D[1]+1*D[2]+...+(n-1)*D[n])
所以上式可以变为∑ni = 1A[i] = n*∑ni = 1D[i] - ∑ni = 1( D[i]*(i-1) );
如果你理解前面的都比较轻松的话,这里也就知道要干嘛了,维护两个数状数组,sum1[i] = D[i],sum2[i] = D[i]*(i-1);
1 int n,m; 2 int a[50005] = {0}; 3 int sum1[50005]; //(D[1] + D[2] + ... + D[n]) 4 int sum2[50005]; //(1*D[1] + 2*D[2] + ... + n*D[n]) 5 6 int lowbit(int x){ 7 return x&(-x); 8 } 9 10 void updata(int i,int k){ 11 int x = i; //因为x不变,所以得先保存i值 12 while(i <= n){ 13 sum1[i] += k; 14 sum2[i] += k * (x-1); 15 i += lowbit(i); 16 } 17 } 18 19 int getsum(int i){ //求前缀和 20 int res = 0, x = i; 21 while(i > 0){ 22 res += x * sum1[i] - sum2[i]; 23 i -= lowbit(i); 24 } 25 return res; 26 } 27 28 int main(){ 29 cin>>n; 30 for(int i = 1; i <= n; i++){ 31 cin>>a[i]; 32 updata(i,a[i] - a[i-1]); //输入初值的时候,也相当于更新了值 33 } 34 35 //[x,y]区间内加上k 36 updata(x,k); //A[x] - A[x-1]增加k 37 updata(y+1,-k); //A[y+1] - A[y]减少k 38 39 //求[x,y]区间和 40 int sum = getsum(y) - getsum(x-1); 41 42 return 0; 43 }
再附赠两道模板题目,可以自行写一下以便理解
区间修改、单点查询模板题目:https://www.luogu.org/problem/show?pid=3368
区间修改、区间查询模板题目:https://vjudge.net/problem/POJ-3468
PS:这里大致归纳了一维树状数组的所有要使用到的东西,二维建树以及更多变式就不说了,具体问题再具体分析。
后记:自己看了一下写的不是很好,特别是公式和图,都是用简单的画图和直接写的,没有用编辑器,也不能说我懒吧,毕竟精力有限啦,以后有空还是会去学的,带给大家更好的博客。手敲也不易,希望大家理解,多多支持。
不懂问我噢= =