【高阶数据结构】并查集 -- 详解

简介: 【高阶数据结构】并查集 -- 详解

一、并查集的原理

1、并查集的本质和概念

(1)本质

并查集的本质:森林。


(2)概念

在一些应用问题中,需要将 n 个不同的元素划分成一些不相交的集合

开始时,每个元素自成一个单元素集合,然后按一定的规律将归于同一组元素的集合合并。在此过程中要反复用到查询某一个元素归属于那个集合的运算。适合于描述这类问题的抽象数据类型称为并查集(union-find set)


比如:某公司今年校招,在全国总共招生 10 人,广州招 4 人,深圳招 3 人,东莞招 3 人,10 个人来自不同的学校,起先互不相识,每个学生都是一个独立的小团体。

现给这些学生进行编号:{0, 1, 2, 3, 4, 5, 6, 7, 8, 9}; 给以下数组用来存储该小集体,数组中的数字代表:该小集体中具有成员的个数。

(初始状态为 -1 ,表示 10 棵树,即每个学生是一个独立的集合)

(跟堆类似,用下标表示关系,双亲表示法)

毕业后,学生们要去公司上班,每个地方的学生自发组织成小分队一起上路,于是:广州学生小分队 s1={0,6,7,8},深圳学生小分队 s2={1,4,9},东莞学生小分队 s3={2,3,5} 就相互认识了,10 个人形成了三个小团体。

假设右三个群主 0, 1, 2 担任队长,负责大家的出行。

一趟火车之旅后,每个小分队成员就互相熟悉,称为了一个朋友圈。

从上图可以看出:

  • 编号 6, 7, 8 同学属于 0 号小分队,该小分队中有 4 人(包含队长 0);
  • 编号为 4和 9 的同学属于 1 号小分队,该小分队有 3 人(包含队长 1);
  • 编号为 3 和 5 的同学属于 2 号小分队,该小分队有 3 个人(包含队长 1)。

仔细观察数组中内融化,可以得出以下结论:

  1. 数组的下标对应集合中元素的编号
  2. 数组中如果为负数负号代表根数字的绝对值代表该集合中元素个数
  3. 数组中如果为非负数,代表该元素双亲在数组中的下标

2、并查集的应用

在公司工作一段时间后,广州小分队中 8 号同学与深圳小分队 1 号同学奇迹般的走到了一起,两个小圈子的学生相互介绍,最后成为了一个小圈子:

现在 0 集合有 7 个人,2 集合有 3 个人,总共两个朋友圈。


通过以上例子可知,并查集一般可以解决一下问题:

(1)查找元素属于哪个集合

沿着数组表示树形关系以上一直找到根(即:树中中元素为负数的位置)。


(2)查看两个元素是否属于同一个集合

沿着数组表示的树形关系往上一直找到树的根,如果根相同表明在同一个集合,否则不在。


(3)将两个集合归并成一个集合

将两个集合中的元素合并将一个集合名称改成另一个集合的名称。


(4)统计集合的个数

遍历数组,数组中元素为负数的个数即为集合的个数。


二、并查集的实现

class UnionFindSet
{
public:
  UnionFindSet(size_t n)
    :_ufs(n, -1)
  {}
 
    // 初始时,将数组中元素全部设置为1
  void Union(int x1, int x2)
  {
    int root1 = FindRoot(x1);
    int root2 = FindRoot(x2);
    // 如果x1已经与x2在同一个集合就不需要合并了
    if (root1 == root2)
      return;
 
    // 控制数据量小的往大的集合合并
    if (abs(_ufs[root1]) < abs(_ufs[root2]))
      swap(root1, root2);
 
    // 将两个集合中元素合并
    _ufs[root1] += _ufs[root2];
        // 将其中一个集合名称改变成另外一个
    _ufs[root2] = root1;
  }
 
    // 给一个元素的编号,找到该元素所在集合的名称
  int FindRoot(int x)
  {
    int root = x;
        // 如果数组中存储的是负数,找到,否则一直继续
    while (_ufs[root] >= 0)
    {
      root = _ufs[root];
    }
 
    //路径压缩
    while (_ufs[x] >= 0)
    {
      int parent = _ufs[x];
      _ufs[x] = root;
      x = parent;
    }
    return root;
  }
 
  bool InSet(int x1, int x2)
  {
    return FindRoot(x1) == FindRoot(x2);
  }
 
    // 数组中负数的个数,即为集合的个数
  size_t SetSize()
  {
    size_t size = 0;
    for (size_t i = 0; i < _ufs.size(); i++)
    {
      if (_ufs[i] < 0)
      {
        size++;
      }
    }
    return size;
  }
 
private:
  vector<int> _ufs;
};


相关文章
|
1月前
|
容器
数据结构:并查集
数据结构:并查集
40 0
数据结构:并查集
|
1月前
|
机器学习/深度学习 存储
数据结构(九)---并查集
数据结构(九)---并查集
22 5
|
17天前
|
存储 算法
数据结构学习记录——集合及运算(集合的表示、并查集、树结构表示集合、集合运算、查找函数、并运算)
数据结构学习记录——集合及运算(集合的表示、并查集、树结构表示集合、集合运算、查找函数、并运算)
8 0
|
1月前
|
存储 NoSQL 算法
【高阶数据结构】跳表 -- 详解
【高阶数据结构】跳表 -- 详解
|
1月前
|
存储 算法 关系型数据库
【高阶数据结构】 B树 -- 详解
【高阶数据结构】 B树 -- 详解
|
1月前
|
缓存 算法 内存技术
【高阶数据结构】LRU Cache -- 详解
【高阶数据结构】LRU Cache -- 详解
|
1月前
|
算法
【高阶数据结构】图 -- 详解(下)
【高阶数据结构】图 -- 详解(下)
|
1月前
|
存储
【高阶数据结构】图 -- 详解(上)
【高阶数据结构】图 -- 详解(上)
|
1月前
|
算法 计算机视觉
【数据结构入门精讲 | 第十六篇】并查集知识点及考研408、企业面试练习
【数据结构入门精讲 | 第十六篇】并查集知识点及考研408、企业面试练习
38 0
|
1月前
|
算法 Python
Python高级数据结构——并查集(Disjoint Set)
Python高级数据结构——并查集(Disjoint Set)
157 2