并查集
并查集是一种简单的用途广泛的集合。并查集是若干个不相交集合,能够实现较快的合并和判断元素所在集合的操作。应用很多,如其求无向图的连通分量个数等。最完美的应用当属:实现Kruskar算法求最小生成树。并查集的精髓在于三个操作:初始化,查找,合并。
1.三个操作
(1)初始化Make_Set()
初始化后每一个元素的父亲节点是它本身,每一个元素的祖先节点也是它本身(也可以根据情况而变)。
(2)查找Find_Set(x)
查找一个元素所在的集合,其精髓是找到这个元素所在集合的祖先!这个才是并查集判断和合并的最终依据。判断两个元素是否属于同一集合,只要看他们所在集合的祖先是否相同即可。合并两个集合,也是使一个集合的祖先成为另一个集合的祖先。
(3)Union(x,y)
合并两个不相交集合操作很简单,利用Find_Set找到其中两个集合的祖先,将一个集合的祖先指向另一个集合的祖先。
2.并查集的优化
(1)Find_Set(x)时 路径压缩
寻找祖先时我们一般采用递归查找,但是当元素很多亦或是整棵树变为一条链时,每次Find_Set(x)都是O(n)的复杂度,有没有办法减小这个复杂度呢?答案是肯定的,这就是路径压缩,即当我们经过"递推"找到祖先节点后,"回溯"的时候顺便将它的子孙节点都直接指向祖先,这样以后再次Find_Set(x)时复杂度就变成O(1)了,如下图所示;可见,路径压缩方便了以后的查找。

(2)Union(x,y)时按秩合并
即合并的时候将元素少的集合合并到元素多的集合中,这样合并之后树的高度会相对较小。

简易版本
int bin[50001];
void set() //初始化,使每个节点的祖先节点都是它本身
{
int i;
for(i=0;i<50001;i++)
{
bin[i]=i;
}
}
int find(int x) //查找x的祖先节点
{
int r=x;
while(r!=bin[r])
r=bin[r];
return r;
}
void merge(int x,int y) //合并x和y
{
int fx,fy;
fx=find(x);
fy=find(y);
if(fx!=fy)
bin[fx]=fy;
}
优化版本
int father[MAX]; //father[x]表示x的父节点
int rank[MAX]; //rank[x]表示x的秩
void Make_Set(int x) //初始化集合
{
int i;
for(i=0;i<MAX;i++)
{
father[x] = x;
rank[x] = 0;
}
}
int Find_Set(int x) //查找x元素所在的集合,回溯时压缩路径
{
if (x != father[x])
{
father[x] = Find_Set(father[x]); //回溯时压缩路径
}
return father[x];
}
void Union(int x, int y) //合并
{
x = Find_Set(x);
y = Find_Set(y);
if (x == y) return;
if (rank[x] > rank[y]) //如果x的秩大于y的秩
{
father[y] = x; //y指向x
}
else
{
if (rank[x] == rank[y])
{
rank[y]++;
}
father[x] = y;
}
}
