并查集
并查集是一种简单的用途广泛的集合。并查集是若干个不相交集合,能够实现较快的合并和判断元素所在集合的操作。应用很多,如其求无向图的连通分量个数等。最完美的应用当属:实现Kruskar算法求最小生成树。并查集的精髓在于三个操作:初始化,查找,合并。
1.三个操作
(1)初始化Make_Set()
初始化后每一个元素的父亲节点是它本身,每一个元素的祖先节点也是它本身(也可以根据情况而变)。
(2)查找Find_Set(x)
查找一个元素所在的集合,其精髓是找到这个元素所在集合的祖先!这个才是并查集判断和合并的最终依据。判断两个元素是否属于同一集合,只要看他们所在集合的祖先是否相同即可。合并两个集合,也是使一个集合的祖先成为另一个集合的祖先。
(3)Union(x,y)
合并两个不相交集合操作很简单,利用Find_Set找到其中两个集合的祖先,将一个集合的祖先指向另一个集合的祖先。
2.并查集的优化
(1)Find_Set(x)时 路径压缩
寻找祖先时我们一般采用递归查找,但是当元素很多亦或是整棵树变为一条链时,每次Find_Set(x)都是O(n)的复杂度,有没有办法减小这个复杂度呢?答案是肯定的,这就是路径压缩,即当我们经过"递推"找到祖先节点后,"回溯"的时候顺便将它的子孙节点都直接指向祖先,这样以后再次Find_Set(x)时复杂度就变成O(1)了,如下图所示;可见,路径压缩方便了以后的查找。
(2)Union(x,y)时按秩合并
即合并的时候将元素少的集合合并到元素多的集合中,这样合并之后树的高度会相对较小。
简易版本
int bin[50001]; void set() //初始化,使每个节点的祖先节点都是它本身 { int i; for(i=0;i<50001;i++) { bin[i]=i; } } int find(int x) //查找x的祖先节点 { int r=x; while(r!=bin[r]) r=bin[r]; return r; } void merge(int x,int y) //合并x和y { int fx,fy; fx=find(x); fy=find(y); if(fx!=fy) bin[fx]=fy; }
优化版本
int father[MAX]; //father[x]表示x的父节点 int rank[MAX]; //rank[x]表示x的秩 void Make_Set(int x) //初始化集合 { int i; for(i=0;i<MAX;i++) { father[x] = x; rank[x] = 0; } } int Find_Set(int x) //查找x元素所在的集合,回溯时压缩路径 { if (x != father[x]) { father[x] = Find_Set(father[x]); //回溯时压缩路径 } return father[x]; } void Union(int x, int y) //合并 { x = Find_Set(x); y = Find_Set(y); if (x == y) return; if (rank[x] > rank[y]) //如果x的秩大于y的秩 { father[y] = x; //y指向x } else { if (rank[x] == rank[y]) { rank[y]++; } father[x] = y; } }