使用红黑树模拟实现map和set

简介: 将单独使用的红黑树改造一下,即使用类模板来适用set和map的不同情况,从而作为map和set的底层,进而模拟实现了map和set。

 在STL的源代码中,map和set的底层原理都是红黑树。但这颗红黑树跟我们单独写的红黑树不一样,它需要改造一下:

改造红黑树

节点的定义

因为map和set的底层都是红黑树。而且map是拥有键值对pair<K,V>的,而set是没有键值对,只有一个K。因此,为了应对这两种不同的情况,就使用模板参数T。

当map使用这棵红黑树的时候,T就会变成pair<K,V>。当set使用时,T就会变成K。

//使用枚举
enum Colour
{
  RED,
  BLACK,
};
// 如果是map,则为pair<K, V>; 如果是set,则为k
//因此,对于节点来说,需要再套一层模板,来应付两种不同的情况
template<class T>
struct RBTreeNode
{
  T _data;
  RBTreeNode<T>* _left;
  RBTreeNode<T>* _right;
  RBTreeNode<T>* _parent;
  Colour _col;
  RBTreeNode(const T& data)
    :_data(data)
    , _left(nullptr)
    , _right(nullptr)
    , _parent(nullptr)
    , _col(RED)  //默认是红色
  {}
};

image.gif

改版的红黑树的插入操作

红黑树的模板参数有三个:K、valueType和仿函数KeyOfValue。

K是key的类型,ValueTyp要么是set的K,要么是map的pair<const K,V>。

而仿函数是为了比较节点的值的大小的,因为官方库中键值对pair<K,V>比较大小的方法是比较first和second。但是红黑树中,新增节点是通过比较first,因此我们需要自己写一个仿函数用于单独比较first。

//跟节点的定义一样
//因为关联式容器中存储的是<key, value>的键值对,因此
// k为key的类型,
// ValueType: 如果是map,则为pair<K, V>; 如果是set,则为k。如下:
// map->RBTree<K,pair<const K,V>,MapKeyOfT> _t;
// set->RBTree<K,K,SetKeyOfT> _t
// 
// KeyOfValue: 通过value来获取key的一个仿函数类。其作用就是用于比较。
template<class K,class ValueType,class KeyOfValue>
class RBTree
{
  typedef RBTreeNode<ValueType> Node;
public: 
    //迭代器
    typedef __RBTreeIterator<ValueType> iterator;
   //......
private:
  Node* _root = nullptr;
};

image.gif

迭代器

红黑树的迭代器不能使用原生指针,因为它是一棵树,节点地址不连续,因此需要封装起来。

//set的K,map的pair<K,V>
template<class ValueType>
struct __RBTreeIterator
{
  typedef RBTreeNode<ValueType> Node;
  typedef __RBTreeIterator<ValueType> Self;
  Node* _node;
  __RBTreeIterator(Node* node)
    :_node(node)
  {}
};

image.gif

1.operator++()

红黑树是二叉搜索树,采用的是中序遍历的方法。因此,迭代器每次向前走,是按照中序遍历的顺序走的。

因此,对于往前++,有两种情况:第一种情况是当前节点的右孩子不为空,那么按照中序遍历的顺序,下一个节点便是右子树的最小值。第二种情况是当前节点的右孩子为空:这种情况下,又分两种情况:①当前节点是父节点的左孩子,那么下一个节点肯定是当前节点的父节点。②当前节点是父节点的右孩子,这意味着当前节点的父节点也被遍历了,又没有右孩子节点,只能往上找了,找的节点是祖先节点,而这个祖先节点是特征是:孩子节点是它的左节点。

{70M%EQ73L~2GU86IL1W901.png

//左 根  右
  Self& operator++()
  {
    //当当前节点的右子树不为空,根据中序遍历的顺序,那就找右子树最小值
    if (_node->_right)
    {
      Node* minValue = _node->_right;
      while (minValue->_left)
      {
        minValue = minValue->_left;
      }
      //找到最小值的节点后,更新节点
      _node = minValue;
    }
    else  //当当前节的的右子树为空,说明它是叶子节点。此时需要判断情况
    {
      //判断当前节点是父亲节点的左孩子还是右孩子
      //第一种情况:如果是cur==parent->_right,即当前节点是父节点的右孩子的话,就
      //去找祖先节点(这个祖先节点的特征:孩子节点是它的左节点)
      //第二种情况:当前节点是父亲节点的左孩子,那么下一个节点就是父亲节点了
      Node* cur = _node;
      //定义父亲节点。
      Node* parent = cur->_parent;
      //如果当前节点不是父亲的右孩子,并且父亲是不存在,那么就是根节点或者是左孩子节点了
      //那就不进入循环。
      while (parent && cur == parent->_right)
      {
        //如果是,那就往上找到下一个节点。
        cur = cur->_parent;
        parent = parent->_parent;
      }
      //更新节点
      _node = parent;
    }
    return *this;
  }

image.gif

2.begin()和end();

迭代器的begin和end,是左闭右开的区间。那么begin就是最左的节点,end则是最右节点的下一个节点。这里不使用哨兵来作为end节点。

对于begin,就找到最左的节点就好啦!

iterator begin()
  {
    Node* left = _root;
    while (left && left->_left)
    {
      left = left->_left;
    }
    return iterator(left);
  }

image.gif

对于end,这里选择直接置为空,传入匿名对象。这样子做的话,当遍历到最后一个节点后,它会往回遍历,一直到了根节点的上面一个节点,也就是空。此时就会结束循环。

iterator end()
  {
    return iterator(nullptr);
  }

image.gif

迭代器整体代码:

template<class ValueType>
struct __RBTreeIterator
{
  typedef RBTreeNode<ValueType> Node;
  typedef __RBTreeIterator<ValueType> Self;
  Node* _node;
  __RBTreeIterator(Node* node)
    :_node(node)
  {}
  ValueType& operator*()
  {
    return _node->_data;
  }
  ValueType* operator->()
  {
    return &_node->_data;
  }
  Self& operator++()
  {
    if (_node->_right)
    {
      Node* minValue = _node->_right;
      while (minValue->_left)
      {
        minValue = minValue->_left;
      }
      _node = minValue;
    }
    else 
    {
      Node* cur = _node;
      Node* parent = cur->_parent;
      while (parent && cur == parent->_right)
      {
        cur = cur->_parent;
        parent = parent->_parent;
      }
      _node = parent;
    }
    return *this;
  }
  bool operator!=(const Self& s)
  {
    return _node != s._node;
  }
};

image.gif

set的模拟实现

仿函数

由于set只有Key,因此就让仿函数直接返回Key值就可以了。

template<class K>
  class set
  {
    //set的仿函数,返回set的K值
    struct SetKeyOfValue
    {
      const K& operator()(const K& key)
      {
        return key;
      }
    };

image.gif

整体都是复用了红黑树的接口,并没有什么技术含量,问题都在红黑树中解决了。

namespace my_set
{
  template<class K>
  class set
  {
    //set的仿函数,返回set的K值
    struct SetKeyOfValue
    {
      const K& operator()(const K& key)
      {
        return key;
      }
    };
  public:
    typedef typename RBTree<K, K, SetKeyOfValue>::iterator iterator;
    iterator begin()
    {
      return _t.begin();
    }
    iterator end()
    {
      return _t.end();
    }
    bool insert(const K& key)
    {
      return _t.Insert(key);
    }
  private:
    RBTree<K, K, SetKeyOfValue> _t;
  };

image.gif

map的模拟实现:

仿函数

由于比较的是first,因此我们返回键值对中的first即可。

template<class K, class V>
  class map
  {
    struct MapKeyOfValue
    {
      const K& operator()(const pair<const K, V>& kv)
      {
        return kv.first;
      }
    };

image.gif

整体代码,一样的都是复用了红黑树的接口,并没有什么技术含量:

namespace my_map
{
  template<class K, class V>
  class map
  {
    struct MapKeyOfValue
    {
      const K& operator()(const pair<const K, V>& kv)
      {
        return kv.first;
      }
    };
  public:
    typedef typename RBTree<K, pair<const K, V>, MapKeyOfValue>::iterator iterator;
    iterator begin()
    {
      return _t.begin();
    }
    iterator end()
    {
      return _t.end();
    }
    bool insert(const pair<const K, V>& kv)
    {
      return _t.Insert(kv);
    }
  private:
    RBTree<K, pair<const K, V>, MapKeyOfValue> _t;
  };

image.gif

最后是红黑树的整体代码,这段代码跟单独写的红黑树的代码差不多,就是在新增节点的操作那里,比较节点的值使用的是仿函数。

#pragma once
//使用枚举
enum Colour
{
  RED,
  BLACK,
};
// 如果是map,则为pair<K, V>; 如果是set,则为k
//因此,对于节点来说,需要再套一层模板,来应付两种不同的情况
template<class T>
struct RBTreeNode
{
  T _data;
  RBTreeNode<T>* _left;
  RBTreeNode<T>* _right;
  RBTreeNode<T>* _parent;
  Colour _col;
  RBTreeNode(const T& data)
    :_data(data)
    , _left(nullptr)
    , _right(nullptr)
    , _parent(nullptr)
    , _col(RED)  //默认是红色
  {}
};
template<class ValueType>
struct __RBTreeIterator
{
  typedef RBTreeNode<ValueType> Node;
  typedef __RBTreeIterator<ValueType> Self;
  Node* _node;
  __RBTreeIterator(Node* node)
    :_node(node)
  {}
  ValueType& operator*()
  {
    return _node->_data;
  }
  ValueType* operator->()
  {
    return &_node->_data;
  }
  //左 根  右
  Self& operator++()
  {
    //当当前节点的右子树不为空,根据中序遍历的顺序,那就找右子树最小值
    if (_node->_right)
    {
      Node* minValue = _node->_right;
      while (minValue->_left)
      {
        minValue = minValue->_left;
      }
      //找到最小值的节点后,更新节点
      _node = minValue;
    }
    else  //当当前节的的右子树为空,说明它是叶子节点。此时需要判断情况
    {
      //判断当前节点是父亲节点的左孩子还是右孩子
      //第一种情况:如果是cur==parent->_right,即当前节点是父节点的右孩子的话,就
      //去找祖先节点(这个祖先节点的特征:孩子节点是它的左节点)
      //第二种情况:当前节点是父亲节点的左孩子,那么下一个节点就是父亲节点了
      Node* cur = _node;
      //定义父亲节点。
      Node* parent = cur->_parent;
      //如果当前节点不是父亲的右孩子,并且父亲是不存在,那么就是根节点或者是左孩子节点了
      //那就不进入循环。
      while (parent && cur == parent->_right)
      {
        //如果是,那就往上找到下一个节点。
        cur = cur->_parent;
        parent = parent->_parent;
      }
      //更新节点
      _node = parent;
    }
    return *this;
  }
  bool operator!=(const Self& s)
  {
    return _node != s._node;
  }
};
//跟节点的定义一样
//因为关联式容器中存储的是<key, value>的键值对,因此
// k为key的类型,
// ValueType: 如果是map,则为pair<K, V>; 如果是set,则为k。如下:
// map->RBTree<K,pair<const K,V>,MapKeyOfT> _t;
// set->RBTree<K,K,SetKeyOfT> _t
// 
// KeyOfValue: 通过value来获取key的一个仿函数类。其作用就是用于比较。
template<class K,class ValueType,class KeyOfValue>
class RBTree
{
  typedef RBTreeNode<ValueType> Node;
public:
  typedef __RBTreeIterator<ValueType> iterator;
  iterator begin()
  {
    Node* left = _root;
    while (left && left->_left)
    {
      left = left->_left;
    }
    return iterator(left);
  }
  iterator end()
  {
    return iterator(nullptr);
  }
  bool Insert(const ValueType& data)
  {
    //先按二叉搜索树的规矩来创建一棵二叉搜索树
    if (_root == nullptr)
    {
      _root = new Node(data);
      //因为红黑树的根节点是黑色的
      _root->_col = BLACK;
      return true;
    }
    KeyOfValue kot;
    Node* parent = nullptr;
    Node* cur = _root;
    while (cur)
    {
      if (kot(cur->_data) < kot(data))
      {
        parent = cur;
        cur = cur->_right;
      }
      else if (kot(cur->_data) > kot(data))
      {
        parent = cur;
        cur = cur->_left;
      }
      else
      {
        return false;
      }
    }
    cur = new Node(data);
    cur->_col = RED;//多写一步,防止写错代码。
    if (kot(parent->_data) < kot(data))
    {
      parent->_right = cur;
      cur->_parent = parent;
    }
    else
    {
      parent->_left = cur;
      cur->_parent = parent;
    }
    //创建完二叉搜索树
    //开始创建红黑树,使用颜色来判断是否需要调整
    //循环往上走,循环条件:当走到的parent不为空,并且parent是红色的
    //即我们列举是三种情况,parent都是红的,就需要重新调整
    //如果parent是黑色的,那就不需要了。直接就是一棵红黑树,不进入循环
    while (parent && parent->_col == RED)
    {
      //保存祖先节点,即g节点
      Node* grandfther = parent->_parent;
      //判断父节点是在祖先节点的哪边
      if (parent == grandfther->_left)
      {
        //父节点在左边,那么叔叔节点就在右边
        Node* uncle = grandfther->_right;
        //情况一:uncle存在且为红。改变颜色即可
        if (uncle && uncle->_col == RED)
        {
          //变色。
          parent->_col = uncle->_col = BLACK;
          grandfther->_col = RED;
          //往上走
          cur = grandfther;
          parent = cur->_parent;
        }
        else  //uncle不存在 或者 存在但是黑色
        {
          //情况二  p是g的左孩子,cur是p的左孩子,以g为轴右单旋
          if (cur == parent->_left)
          {
            //右单旋
            RotateR(grandfther);
            //变色  右单旋后,parent为根节点,变黑色。cur和g节点为红色
            parent->_col = BLACK;
            grandfther->_col = RED;
          }
          else  //情况三  p是g的左孩子,cur是p的右孩子.
          {
            //先以p为轴左旋转
            RotateL(parent);
            //变成情况二,再以g为轴右单旋
            RotateR(grandfther);
            //变色  cur变成根节点,为黑色。p和g是红色
            cur->_col = BLACK;
            grandfther->_col = RED;
          }
          break;
        }
      }
      else  //parent是在grandfther的右边
      {
        //叔叔节点就在祖先节点的左边
        Node* uncle = grandfther->_left;
        //情况一:uncle存在且为红。改变颜色即可
        if (uncle && uncle->_col == RED)
        {
          //变色。
          parent->_col = uncle->_col = BLACK;
          grandfther->_col = RED;
          //往上走
          cur = grandfther;
          parent = cur->_parent;
        }
        else  //uncle不存在 或者 存在但是黑色
        {
          //情况二  p是g的右孩子,cur是p的右孩子。
          if (cur == parent->_right)
          {
            //左单旋
            RotateL(grandfther);
            //变色  右单旋后,parent为根节点,变黑色。cur和g节点为红色
            parent->_col = BLACK;
            grandfther->_col = RED;
          }
          else  //情况三  p是g的右孩子,cur是p的左孩子.
          {
            //先以p为轴右旋转
            RotateR(parent);
            //变成情况二,再以g为轴左单旋
            RotateL(grandfther);
            //变色  cur变成根节点,为黑色。p和g是红色
            cur->_col = BLACK;
            grandfther->_col = RED;
          }
          break;
        }
      }
    }
    //最后将根节点置为黑
    _root->_col = BLACK;
    return true;
  }
  void RotateL(Node* parent)
  {
    Node* subR = parent->_right;
    Node* subRL = subR->_left;
    parent->_right = subRL;
    if (subRL)
    {
      subRL->_parent = parent;
    }
    Node* ppNode = parent->_parent;
    subR->_left = parent;
    parent->_parent = subR;
    if (ppNode == nullptr)
    {
      _root = subR;
      _root->_parent = nullptr;
    }
    else
    {
      if (ppNode->_left == parent)
      {
        ppNode->_left = subR;
      }
      else
      {
        ppNode->_right = subR;
      }
      subR->_parent = ppNode;
    }
  }
  void RotateR(Node* parent)
  {
    Node* subL = parent->_left;
    Node* subLR = subL->_right;
    parent->_left = subLR;
    if (subLR)
    {
      subLR->_parent = parent;
    }
    Node* ppNode = parent->_parent;
    subL->_right = parent;
    parent->_parent = subL;
    if (ppNode == nullptr)
    {
      _root = subL;
      _root->_parent = nullptr;
    }
    else
    {
      if (ppNode->_left == parent)
      {
        ppNode->_left = subL;
      }
      else
      {
        ppNode->_right = subL;
      }
      subL->_parent = ppNode;
    }
  }
  void Inorder()
  {
    _Inorder(_root);
  }
  void _Inorder(Node* root)
  {
    if (root == nullptr)
      return;
    _Inorder(root->_left);
    std::cout << root->_kv.first << ": " << root->_kv.second << std::endl;
    _Inorder(root->_right);
  }
  bool Check(Node* root, int blackNum, const int ref)
  {
    if (root == nullptr)
    {
      //cout << blackNum << endl;
      if (blackNum != ref)
      {
        cout << "违反规则:本条路径的黑色节点的数量跟最左路径不相等" << endl;
        return false;
      }
      return true;
    }
    if (root->_col == RED && root->_parent->_col == RED)
    {
      cout << "违反规则:出现连续红色节点" << endl;
      return false;
    }
    if (root->_col == BLACK)
    {
      ++blackNum;
    }
    return Check(root->_left, blackNum, ref)
      && Check(root->_right, blackNum, ref);
  }
  bool IsBalance()
  {
    if (_root == nullptr)
    {
      return true;
    }
    if (_root->_col != BLACK)
    {
      return false;
    }
    int ref = 0;
    Node* left = _root;
    while (left)
    {
      if (left->_col == BLACK)
      {
        ++ref;
      }
      left = left->_left;
    }
    return Check(_root, 0, ref);
  }
private:
  Node* _root = nullptr;
};

image.gif


相关文章
|
1月前
|
算法
你对Collection中Set、List、Map理解?
你对Collection中Set、List、Map理解?
64 18
你对Collection中Set、List、Map理解?
|
30天前
|
存储 缓存 安全
只会“有序无序”?面试官嫌弃的List、Set、Map回答!
小米,一位热衷于技术分享的程序员,通过与朋友小林的对话,详细解析了Java面试中常见的List、Set、Map三者之间的区别,不仅涵盖了它们的基本特性,还深入探讨了各自的实现原理及应用场景,帮助面试者更好地准备相关问题。
60 20
|
2月前
|
存储 C++ 容器
【C++】map、set基本用法
本文介绍了C++ STL中的`map`和`set`两种关联容器。`map`用于存储键值对,每个键唯一;而`set`存储唯一元素,不包含值。两者均基于红黑树实现,支持高效的查找、插入和删除操作。文中详细列举了它们的构造方法、迭代器、容量检查、元素修改等常用接口,并简要对比了`map`与`set`的主要差异。此外,还介绍了允许重复元素的`multiset`和`multimap`。
37 3
【C++】map、set基本用法
|
2月前
|
存储 算法 C++
【C++】unordered_map(set)
C++中的`unordered`容器(如`std::unordered_set`、`std::unordered_map`)基于哈希表实现,提供高效的查找、插入和删除操作。哈希表通过哈希函数将元素映射到特定的“桶”中,每个桶可存储一个或多个元素,以处理哈希冲突。主要组成部分包括哈希表、哈希函数、冲突处理机制、负载因子和再散列,以及迭代器。哈希函数用于计算元素的哈希值,冲突通过开链法解决,负载因子控制哈希表的扩展。迭代器支持遍历容器中的元素。`unordered_map`和`unordered_set`的插入、查找和删除操作在理想情况下时间复杂度为O(1),但在冲突较多时可能退化为O(n)。
29 5
|
3月前
|
Java 开发者
在Java的集合世界里,Set以其独特的特性脱颖而出,它通过“哈希魔法”和“红黑树防御”两大绝技
【10月更文挑战第13天】在Java的集合世界里,Set以其独特的特性脱颖而出。它通过“哈希魔法”和“红黑树防御”两大绝技,有效抵御重复元素的侵扰,确保集合的纯洁性和有序性。无论是“人海战术”还是“偷梁换柱”,Set都能从容应对,成为开发者手中不可或缺的利器。
36 6
|
4月前
|
存储 Java API
【数据结构】map&set详解
本文详细介绍了Java集合框架中的Set系列和Map系列集合。Set系列包括HashSet(哈希表实现,无序且元素唯一)、LinkedHashSet(保持插入顺序的HashSet)、TreeSet(红黑树实现,自动排序)。Map系列为双列集合,键值一一对应,键不可重复,值可重复。文章还介绍了HashMap、LinkedHashMap、TreeMap的具体实现与应用场景,并提供了面试题示例,如随机链表复制、宝石与石头、前K个高频单词等问题的解决方案。
54 6
【数据结构】map&set详解
|
3月前
|
存储 JavaScript 前端开发
Set、Map、WeakSet 和 WeakMap 的区别
在 JavaScript 中,Set 和 Map 用于存储唯一值和键值对,支持多种操作方法,如添加、删除和检查元素。WeakSet 和 WeakMap 则存储弱引用的对象,有助于防止内存泄漏,适合特定场景使用。
|
3月前
|
存储 缓存 Java
【用Java学习数据结构系列】HashMap与TreeMap的区别,以及Map与Set的关系
【用Java学习数据结构系列】HashMap与TreeMap的区别,以及Map与Set的关系
48 1
|
4月前
|
算法
你对Collection中Set、List、Map理解?
你对Collection中Set、List、Map理解?
45 5
|
4月前
|
存储 JavaScript 前端开发
js的map和set |21
js的map和set |21