从C语言到C++_29(红黑树封装set和map)红黑树迭代器的实现(上)

简介: 从C语言到C++_29(红黑树封装set和map)红黑树迭代器的实现

1. set和map中的红黑树

前一篇红黑树的源代码:

#pragma once
 
#include <iostream>
#include <assert.h>
#include <time.h>
using namespace std;
 
enum Colour // 枚举颜色
{
  RED,
  BLACK
};
 
template<class K, class V>
struct RBTreeNode
{
  RBTreeNode<K, V>* _left;
  RBTreeNode<K, V>* _right;
  RBTreeNode<K, V>* _parent;
 
  pair<K, V> _kv;
  Colour _col; // 比AVL树少了平衡因子,多了颜色
 
  RBTreeNode(const pair<K, V>& kv)
    :_left(nullptr)
    , _right(nullptr)
    , _parent(nullptr)
    , _kv(kv)
  {}
};
 
template<class K, class V>
struct RBTree
{
  typedef RBTreeNode<K, V> Node;
public:
  bool Insert(const pair<K, V>& kv)
  {
    if (_root == nullptr)
    {
      _root = new Node(kv);
      _root->_col = BLACK; // 根给黑色
      return true;
    }
 
    Node* parent = nullptr;
    Node* cur = _root;
    while (cur) // 找到要插入的结点
    {
      if (cur->_kv.first < kv.first)
      {
        parent = cur;
        cur = cur->_right;
      }
      else if (cur->_kv.first > kv.first)
      {
        parent = cur;
        cur = cur->_left;
      }
      else
      {
        return false;
      }
    }
 
    cur = new Node(kv);
    cur->_col = RED; // 默认插入红色结点
    if (parent->_kv.first < kv.first) // 找到位置后插入结点
    {
      parent->_right = cur;
    }
    else
    {
      parent->_left = cur;
    }
    cur->_parent = parent;
 
    while (parent && parent->_col == RED) // 父亲存在且为红才需要处理
    {
      Node* grandfather = parent->_parent;
      assert(grandfather); // 确定的可以断言下,否则就是插入前就不是红黑树
      assert(grandfather->_col == BLACK);
      if (grandfather->_left == parent)
      {
        Node* uncle = grandfather->_right;
 
        if (uncle && uncle->_col == RED) // 情况一,叔叔存在且为红(可以直接复制到下面uncle在左边)
        {    // 将父亲和叔叔改为黑,祖父改为红,然后把祖父当成cur,parent变祖父parent继续向上调整。
          parent->_col = uncle->_col = BLACK;
          grandfather->_col = RED;
          cur = grandfather;
          parent = cur->_parent;
        }
        else // 情况二或情况三:叔叔存在且为黑或叔叔不存在
        {
          if(cur == parent->_left) // 情况二的右旋+变色(parent在左)
          {
            //     g      
            //   p   u
            // c
            RotateR(grandfather);
            parent->_col = BLACK; // 父亲变为根了
            grandfather->_col = RED;
          }
          else // 情况二的左右双旋+变色(parent在左)
          {
            //      g      
                        //   p     u
                        //    c
            RotateL(parent);
            RotateR(grandfather);
            cur->_col = BLACK; // cur变为根了
            grandfather->_col = RED;
          }
          break;
        }
      }
      else
      {
        Node* uncle = grandfather->_left;
 
        if (uncle && uncle->_col == RED) // 情况一,叔叔存在且为红
        {    // 将父亲和叔叔改为黑,祖父改为红,然后把祖父当成cur,parent变祖父parent继续向上调整。
          parent->_col = uncle->_col = BLACK;
          grandfather->_col = RED;
          cur = grandfather;
          parent = cur->_parent;
        }
        else // 情况二或情况三:叔叔存在且为黑或叔叔不存在
        {
          if (cur == parent->_right) // 情况二的左旋+变色(parent在右)
          {
            //     g      
            //   u   p
            //        c
            RotateL(grandfather);
            parent->_col = BLACK; // 父亲变为根了
            grandfather->_col = RED;
          }
          else // 情况二的右左双旋+变色(parent在右)
          {
            //       g      
            //    u     p
            //         c
            RotateR(parent);
            RotateL(grandfather);
            cur->_col = BLACK; // cur变为根了
            grandfather->_col = RED;
          }
          break;
        }
      }
    }
    
    _root->_col = BLACK;
    return true;
  }
 
  void InOrder()
  {
    _InOrder(_root);
    cout << endl;
  }
 
  bool IsBalance()
  {
    if (_root == nullptr)
    {
      return true;
    }
 
    if (_root->_col == RED) // 验证性质二
    {
      cout << "根节点不是黑色" << endl;
      return false;
    }
 
    int benchmark = 0; // 黑色节点数量基准值
    //Node* cur = _root; // 这种方法是先遍历一遍,然后传值,不过我们可以传引用
    //while (cur)
    //{
    //  if (cur->_col == BLACK)
    //  {
    //    ++benchmark;
    //  }
    //  cur = cur->_left;
    //}
    return PrevCheck(_root, 0, benchmark); // 验证性质三和四
  }
 
protected:
  bool PrevCheck(Node* root, int blackNum, int& benchmark)
  {
    if (root == nullptr)
    {
      if (benchmark == 0)
      {
        benchmark = blackNum;
        return true;
      }
 
      if (blackNum != benchmark) // 验证性质三
      {
        cout << "某条黑色节点的数量不相等" << endl;
        return false;
      }
      else
      {
        return true;
      }
    }
 
    if (root->_col == BLACK)
    {
      ++blackNum;
    }
 
    if (root->_col == RED && root->_parent->_col == RED) // 验证性质四
    {
      cout << "存在连续的红色节点" << endl;
      return false;
    }
 
    return PrevCheck(root->_left, blackNum, benchmark)
      && PrevCheck(root->_right, blackNum, benchmark);
  }
 
  void _InOrder(Node* root)
  {
    if (root == nullptr)
    {
      return;
    }
    _InOrder(root->_left);
    cout << root->_kv.first << ":" << root->_kv.second << endl;
    _InOrder(root->_right);
  }
 
  void RotateL(Node* parent)
  {
    Node* subR = parent->_right; // 动了三个标记了的结点,共更新六个指针,这更新两个指针
    Node* subRL = subR->_left;
 
    parent->_right = subRL;
    if (subRL) // subRL不为空才更新
    {
      subRL->_parent = parent;
    }
 
    Node* ppNode = parent->_parent; // 记录parent的parent,防止parent是一颗子树的头结点
 
    subR->_left = parent; // 再更新两个指针
    parent->_parent = subR;
 
    if (_root == parent)  // 最后更新两个指针
    {
      _root = subR;
      subR->_parent = nullptr;
    }
    else // parent是一颗子树的头结点
    {
      if (ppNode->_left == parent)
      {
        ppNode->_left = subR;
      }
      else
      {
        ppNode->_right = subR;
      }
      subR->_parent = ppNode;
    }
  }
 
  void RotateR(Node* parent)
  {
    Node* subL = parent->_left;
    Node* subLR = subL->_right;
 
    parent->_left = subLR; // 更新两个节点
    if (subLR)
    {
      subLR->_parent = parent;
    }
 
    Node* ppNode = parent->_parent;
 
    subL->_right = parent; // 再更新两个节点
    parent->_parent = subL;
 
    if (_root == parent) // 最后更新两个结点
    {
      _root = subL;
      subL->_parent = nullptr;
    }
    else
    {
      if (ppNode->_left == parent)
      {
        ppNode->_left = subL;
      }
      else
      {
        ppNode->_right = subL;
      }
 
      subL->_parent = ppNode;
    }
  }
 
  Node* _root = nullptr;
};

在前一篇学习红黑树的时候,实现的是KV模型,节点中存放的是键值对pair。

而set中的节点只存放一个key值,map中的节点存放的是键值对。

但是map和set却使用的是同一颗红黑树。

这到底是怎么实现的呢?怎么做到一会儿是键值,一会又是键值对的呢?

看一下STL库中是如何实现的:

map和set中都既有key值,又有数据类型,map中的数据类型是键值对pair,


而set中的数据类型也是key值。STL模板中,红黑树中的数据类型只有一个。


无论是map还是set,底层封装的都是红黑树,


区别在于给红黑树实例化的是什么类型的模板参数。


map给红黑树传的模板参数是键值对pair。


set给红黑树传的模板参数是键值Key。


对于红黑树而言,它是不知道接收到的第二个模板参数value是什么类型的,


它只能推演。所以set对应的红黑树中的数据类型就是一个key值,


而map对应的红黑树中的数据类型就是一个键值对。


接下来就是对我们实现的红黑树进行改造,(配合上一篇一起看)


首先就是对结点进行改造,将原本的KV键值对数据类型改成T,像STL中一样,只有一个,


让编译器自己去推演这个数据类型是key值还是键值对:

template<class T>
struct RBTreeNode
{
  RBTreeNode<T>* _left;
  RBTreeNode<T>* _right;
  RBTreeNode<T>* _parent;
 
  T _data; // 结点中的数据
  Colour _col; // 比AVL树少了平衡因子,多了颜色
 
  RBTreeNode(const pair<K, V>& kv)
    :_left(nullptr)
    , _right(nullptr)
    , _parent(nullptr)
    , _data(data)
  {}
};

红黑树中也不再用键值对去构建新节点,而是使用那一个数据类型T。

先改一点是这样的:

Set.h:

#pragma once
 
#include "RedBlackTree.h"
 
namespace rtx
{
  template <class K>
  class set
  {
  protected:
    RBTree <K, K> _t;
  };
}

Map.h:

#pragma once
 
#include "RedBlackTree.h"
 
namespace rtx
{
  template <class K,class V>
  class map
  {
  protected:
    RBTree <K, pair<K, V>> _t;
  };
}

set中,向红黑树传的模板参数是,第二个K传给节点,作为节点是数据类型。


map中,向红黑树传的模板参数是>键值对,


第二个参数键值对pair传给节点,作为节点的数据类型。


现在有一个问题,给红黑树传模板参数时,第一个参数K类型的作用是什么?


对于insert来说,set和map中都可以不要第一个参数K,因为第二个参数中就有K,


可以用来比较。但是对于find接口来说,它需要的只是K。set中第二个参数也是K,


所以第一个K也可以省略。map中第二个参数是一个键值对,如果省略了第一K后,


红黑树中只有一个键值对类型,在使用find的时候,无法确定拿到first的数据类型,


此时就需要第一个模板参数K来确定find的类型了。


虽然set中可以不需要第一个模板参数K,但是map不可以,因它两使用的一个红黑树,

所以为了统一,第一个模板参数K不能省略


2. 仿函数比较键值对

改了数据那插入的所有比较都要改了,


站在红黑树的角度,并不知道它接收到的模板参数value是来自set中的键值还是map中的键值对。


在插入结点进行比较时:


set:cur->data 与 data进行比较,插入结点中的key值直接和树中的key值比较大小,决定插入左还是右即可。


map:cur->data.first 与 data.first进行比较,插入结点中的键值对的first和树种键值对的first比较,决定插入左还是右。


既然使用的是模板,是泛型编程,那么在比较处到底该写成map和set中的哪种比较方式呢?


要知道set中的data不是键值对,是没有first的,而map中的data直接比较又不符合我们的要求。


(pair也能比较键值对,不过它在first一样时比较了second,但我们不想比较second)


(关于set和map的细节可以回去看看

此专栏第26篇,后面实现方括号也要知道细节,链接:从C语言到C++_26(set+map+multiset+multimap)力扣692+349+牛客_单词识别-CSDN博客)


此时我们也不能自己重新定义键值对的比较方式,因为库中已经有了,


我们无法再重载一个函数名,返回值,参数都相同的比较方式。


为了能够在红黑树中使用统一的比较方式,这里采用仿函数的方式:


在set和map中各定义一个仿函数,专门用来获取key值的,


并且将这个仿函数当作模板参数传给红黑树。

实现下仿函数和封装下insert,现在的部分代码就是这样:

set中存放的数据本身就是key,所以获取key时有点多此一举,但是为了和红黑树的结构以及map的结构统一,也需要写一个。

map中存放的数据是键值对,所以仿函数返回的是键值对中的first,依次来获取到key值。

在插入函数inset中,创建仿函数对象koft。


在需要进行键值key比较的位置,使用仿函数koft获取键值进行比较,然后决定插入左边函数右边。


使用仿函数的方法,压根就不用关心比较的是键值还是键值对,因为set和map都会给红黑树传它自己获取键值的仿函数,最终比较的都是键值。


set和map中的插入直接复用红黑树中的插入即可。


但是set中插入的是一个键值,而map中插入的是一个键值对。


跑一下测试用例:

#include "RedBlackTree.h"
#include "Set.h"
#include "Map.h"
 
namespace rtx
{
  void TestSet()
  {
    set<int> s;
    s.insert(1);
    s.insert(5);
    s.insert(3);
    s.insert(5);
  }
  void TestMap()
  {
    map<int,int> m;
    m.insert(make_pair(6, 1));
    m.insert(make_pair(2, 1));
    m.insert(make_pair(3, 1));
    m.insert(make_pair(2, 1));
  }
}
 
int main()
{
  rtx::TestSet();
  rtx::TestMap();
 
  return 0;
}

如果想遍历,那么就要实现迭代器了。

3. 红黑树迭代器的实现

这里实现的和库里的不太一样,库里的实现是带哨兵位头结点的,它指向根结点,

它的左指向中序遍历的第一个结点,右指向中序遍历的最后一个结点。

但不用哨兵位头结点也能实现,所以就不改了。

set和map的迭代器就是红黑树的迭代器:

这里可以参考list的迭代器,红黑树也是通过指针来链接的。

template<class T, class Ref, class Ptr>
struct __RBTreeInterator
{
public:
  typedef RBTreeNode<T> Node;
  typedef __RBTreeIterator<T, Ref, Ptr> Self;
  Node* _node;
 
  __RBTreeIterator(Node* node)
    :_node(node)
  {}
};

最基本的迭代器如上面所示代码,迭代器中只有一个成员变量,那就是节点node。

下面就是逐渐完善迭代器支持的功能了,比如解引用,判断等于,加加,减减,等操作。

解引用+箭头+等于+不等于:(这里和链表是一样的,就不再详细讲解了)

template<class T, class Ref, class Ptr>
struct __RBTreeIterator
{
public:
  typedef RBTreeNode<T> Node;
  typedef __RBTreeIterator<T, Ref, Ptr> Self;
  Node* _node;
 
  __RBTreeIterator(Node* node)
    :_node(node)
  {}
 
  Ref operator*()
  {
    return _node->_data;
  }
 
  Ptr operator->()
  {
    return &_node->_data;
  }
 
  bool operator!=(const Self& s) const
  {
    return _node != s._node;
  }
 
  bool operator==(const Self& s) const
  {
    return _node == s._node;
  }
};

比较的内容是两个迭代器指向节点是否相同,而不是节点中的值。

无论是普通对象还是const对象,都可以调用const版本,并且仅仅是进行比较,

所以只有const版本的就够用了。

从C语言到C++_29(红黑树封装set和map)红黑树迭代器的实现(下):https://developer.aliyun.com/article/1522303?spm=a2c6h.13148508.setting.17.50c04f0es3cPJy

目录
相关文章
|
19天前
|
算法
你对Collection中Set、List、Map理解?
你对Collection中Set、List、Map理解?
54 18
你对Collection中Set、List、Map理解?
|
13天前
|
存储 缓存 安全
只会“有序无序”?面试官嫌弃的List、Set、Map回答!
小米,一位热衷于技术分享的程序员,通过与朋友小林的对话,详细解析了Java面试中常见的List、Set、Map三者之间的区别,不仅涵盖了它们的基本特性,还深入探讨了各自的实现原理及应用场景,帮助面试者更好地准备相关问题。
49 20
|
29天前
|
存储 C++ 容器
【C++】map、set基本用法
本文介绍了C++ STL中的`map`和`set`两种关联容器。`map`用于存储键值对,每个键唯一;而`set`存储唯一元素,不包含值。两者均基于红黑树实现,支持高效的查找、插入和删除操作。文中详细列举了它们的构造方法、迭代器、容量检查、元素修改等常用接口,并简要对比了`map`与`set`的主要差异。此外,还介绍了允许重复元素的`multiset`和`multimap`。
30 3
【C++】map、set基本用法
|
29天前
|
存储 C++
【C++】红黑树
红黑树是一种自平衡二叉搜索树,通过节点颜色(红或黑)及特定规则维持平衡,确保操作效率。其性质包括:每个节点非红即黑,根节点必黑,红节点的子节点必黑,从任一节点到其每个叶子的所有路径含相同数量的黑节点。实现上,通过节点结构定义、基本操作(插入、删除、旋转等)、维护平衡性质等步骤完成。代码示例展示了节点定义、插入操作及旋转调整方法。
25 2
【C++】红黑树
|
26天前
|
存储 数据建模 程序员
C 语言结构体 —— 数据封装的利器
C语言结构体是一种用户自定义的数据类型,用于将不同类型的数据组合在一起,形成一个整体。它支持数据封装,便于管理和传递复杂数据,是程序设计中的重要工具。
|
29天前
|
存储 算法 C++
【C++】unordered_map(set)
C++中的`unordered`容器(如`std::unordered_set`、`std::unordered_map`)基于哈希表实现,提供高效的查找、插入和删除操作。哈希表通过哈希函数将元素映射到特定的“桶”中,每个桶可存储一个或多个元素,以处理哈希冲突。主要组成部分包括哈希表、哈希函数、冲突处理机制、负载因子和再散列,以及迭代器。哈希函数用于计算元素的哈希值,冲突通过开链法解决,负载因子控制哈希表的扩展。迭代器支持遍历容器中的元素。`unordered_map`和`unordered_set`的插入、查找和删除操作在理想情况下时间复杂度为O(1),但在冲突较多时可能退化为O(n)。
22 5
|
22天前
|
算法 编译器 C语言
【C语言】C++ 和 C 的优缺点是什么?
C 和 C++ 是两种强大的编程语言,各有其优缺点。C 语言以其高效性、底层控制和简洁性广泛应用于系统编程和嵌入式系统。C++ 在 C 语言的基础上引入了面向对象编程、模板编程和丰富的标准库,使其适合开发大型、复杂的软件系统。 在选择使用 C 还是 C++ 时,开发者需要根据项目的需求、语言的特性以及团队的技术栈来做出决策。无论是 C 语言还是 C++,了解其优缺点和适用场景能够帮助开发者在实际开发中做出更明智的选择,从而更好地应对挑战,实现项目目标。
45 0
|
2月前
|
存储 JavaScript 前端开发
Set、Map、WeakSet 和 WeakMap 的区别
在 JavaScript 中,Set 和 Map 用于存储唯一值和键值对,支持多种操作方法,如添加、删除和检查元素。WeakSet 和 WeakMap 则存储弱引用的对象,有助于防止内存泄漏,适合特定场景使用。
|
2月前
|
存储 缓存 Java
【用Java学习数据结构系列】HashMap与TreeMap的区别,以及Map与Set的关系
【用Java学习数据结构系列】HashMap与TreeMap的区别,以及Map与Set的关系
43 1
|
2月前
|
C语言
C语言链式结构之有头单链表再封装写法
本文介绍了如何使用C语言对有头单链表进行封装,包括节点的创建、链表的初始化、数据的插入和删除,以及链表的打印等功能。
23 1