手撕AVL树

简介: 手撕AVL树

一、概念

二叉搜索树虽可以缩短查找的效率,但若数据有序或接近有序二叉搜索树将退化为单支树,查找元素相当于在链表中搜索元素,效率低下。

因此,两位俄罗斯的数学家G.M.Adelson-Velskii和E.M.Landis在1962年发明了一种解决上述问题的方法:当向二叉搜索树中插入新结点后,若能保证每个结点的左右子树高度之差的绝对值不超过1(需要对树中的结点进行调整),即可降低树的高度,从而减少平均搜索长度。

一棵AVL树是空树 或 具有以下性质的二叉搜索树:

1. 它的左右子树都是AVL树

2. 左右子树高度之差(简称平衡因子)的绝对值不超过1(-1/0/1)    右子树高度减去左子树高度

3. 若一棵二叉搜索树是高度平衡的,其就是AVL树。

   若它有n个结点,其高度可保持在log_2 n,搜索时间复杂度O(log_2 n)

4. 不允许键值冗余

二、 结点的定义

2.1 键值对pair

pair是用来表示具有一一对应关系的一种结构,该结构中一般只包含两个成员变量key和value,key代表键值,value表示与key对应的信息

template <class T1, class T2>
struct pair
{
    typedef T1 first_type;
    typedef T2 second_type;
    T1 first;
    T2 second;
    pair(): first(T1()), second(T2()) {}
    pair(const T1& a, const T2& b): first(a), second(b) {}
};

但使用时需要显示指定元素类型会导致代码过长,并且频繁使用时较为麻烦,于是出现make_pair进行自动类型推导。其定义为:

template <class T1,class T2>
pair<T1,T2> make_pair (T1 x, T2 y)
{    
    return ( pair<T1,T2>(x,y) );
}

2.2 定义细节

结点中存储了左子树指针、右子树指针和父指针以及一个键值对(即数据域)、平衡因子。不过平衡因子并不是必要的,没有平衡因子同样可以实现AVL树。

struct AVLTreeNode {
  AVLTreeNode(const pair<K,V>& kv) :
            _parent(nullptr), _left(nullptr), 
            _right(nullptr),_data(kv),_balance_factor(0) {}
  AVLTreeNode<K, V>* _parent;
  AVLTreeNode<K, V>* _left;
  AVLTreeNode<K, V>* _right;
  pair<K, V> _data;
  int _balance_factor;//平衡因子
};

普通二叉树和搜索二叉树都是二叉链(没有父指针),为什么AVL树会需要使用三叉链呢?


这个问题可以从后面的讲解得到答案。

插入和删除结点、旋转 、平衡因子调整,这些操作都会需要频繁的使用父指针,使用三叉链可以减少查找父结点的时间复杂度并且使得AVL树的实现更加方便。


三、 AVL树的插入操作

AVL本质上就是具有特殊性质的二叉搜索树,其插入操作与二叉搜索树较为相似,不过更为复杂。


AVL树的插入过程可以分为两步

1. 按照二叉搜索树的方式插入新节点    2. 调整节点的平衡因子

bool insert(const pair<K, V>& kv) {
    //第一步: 按照二叉搜索树的方式插入新节点 
  if (_root == nullptr) {
    _root = new TreeNode(kv);
    return true;
  }
  TreeNode* parent = nullptr;
  TreeNode* cur = _root;
  while (cur != nullptr) {
    if (kv.first > cur->_data.first) {
      parent = cur;
      cur = cur->_right;
    }
    else if (kv.first < cur->_data.first) {
      parent = cur;
      cur = cur->_left;
    }
    else return false;
  }
  cur = new TreeNode(kv);
  if (kv.first > parent->_data.first) {
    parent->_right = cur;
    }
  else { //kv.first < parent->_data.first)
    parent->_left = cur;
  }
  cur->_parent = parent;
    //调整平衡因子
    //………………    
}

但是平衡因子是如何调整的呢?


3.1 平衡因子调整规则

1. 若新增结点在其父结点的左边,则父结点的平衡因子 -1;若新增结点在其父结点的右边,则父结点的平衡因子 +1。


2. 更新后,若父结点的平衡因子为1 或 -1,说明插入前父结点的平衡因子为0,插入后父结点所在子树的高度发生变化,需要继续向上更新


3.更新后,若父结点的平衡因子为0,说明插入前父结点的平衡因子为1 或 -1,插入到了父结点矮的一边,父结点所在子树的高度并未发生变化,所以不需继续向上更新


4.更新后,若父结点的平衡因子为2 或 -2,说明插入前父结点的平衡因子为1 或 -1(达到平衡临界值),插入后已经破坏平衡,此时父结点所子树需要进行旋转处理


5.更新后,若父结点的平衡因子的绝对值大于2(理论上而言不可能),说明插入前该树就不是AVL树,需检查之前的操作。


while (parent != nullptr){
    //规则1
    if (cur == parent->_right) ++parent->_balance_factor;
  else --parent->_balance_factor;
    //规则2
  if(parent->_balance_factor == 0) break;
    //规则3
  else if (abs(parent->_balance_factor) == 1) {
    cur = parent;
    parent = parent->_parent;
  }
    //规则4
  else if (abs(parent->_balance_factor) == 2) {
    //需要旋转
        //………………
  }
    //规则5
    else {
    assert(false);
  }
    return true;
}

3.2 旋转规则

AVL树的旋转可以分为四种:


3.2.1 新结点插入较高左子树的左侧 — 左左:右单旋


3578643123804157865138610e04740e.png

//发生右旋的判断条件
if (parent->_balance_factor == -2 && cur->_balance_factor == -1) {
  rotate_right(parent);
}
void rotate_right(TreeNode* parent) {
  TreeNode* subL = parent->_left;
  TreeNode* subLR = subL->_right;
  TreeNode* pparent = parent->_parent;//发生旋转的子树的父结点
  parent->_left = subLR;
  if (subLR != nullptr) subLR->_parent = parent;//h可能为0,即空树
  subL->_right = parent;
  parent->_parent = subL;
    //父结点所在的子树发生右旋转后,该子树的根结点发生改变
  if (_root == parent) {
    _root = subL;
    subL->_parent = nullptr;
  }
  else {
    if (pparent->_left == parent) pparent->_left = subL;
    else pparent->_right = subL;
    subL->_parent = pparent;
  }
    //更新平衡因子
  subL->_balance_factor = parent->_balance_factor = 0;
}

3.2.2 新结点插入较高右子树的右侧 — 右右:左单旋

f1ef478b3b2c41188861f57cccfbbdd1.png


//发生左旋的判断条件
if (parent->_balance_factor == 2 && cur->_balance_factor == 1) {
    rotate_left(parent);
}
void rotate_right(TreeNode* parent) {
  TreeNode* subL = parent->_left;
  TreeNode* subLR = subL->_right;
  TreeNode* pparent = parent->_parent;//发生旋转的子树的父结点
  parent->_left = subLR;
  if (subLR != nullptr) subLR->_parent = parent;//h可能为0,即空树
  subL->_right = parent;
  parent->_parent = subL;
    //parent所在的子树发生左旋转后,该子树的根结点发生变化
  if (_root == parent) {
    _root = subL;
    subL->_parent = nullptr;
  }
  else {
    if (pparent->_left == parent) pparent->_left = subL;
    else pparent->_right = subL;
    subL->_parent = pparent;
  }
    //更新平衡因子
  subL->_balance_factor = parent->_balance_factor = 0;
}

3.2.3 新结点插入较高左子树的右侧 — 左右:左右双旋

c2cd8e53c30a4a8ea2f5a92cdef6b6c7.png


e6cbca16d4404767a760024d96a4cfe9.png


9f74c9ee95464f748736c01d10e730b6.png


void rotate_left_right(TreeNode* parent) {
  TreeNode* subL = parent->_left;
  TreeNode* subLR = subL->_right;
  int bf = subLR->_balance_factor;
  rotate_left(parent->_left);
  rotate_right(parent);
  //更新平衡因子
  subLR->_balance_factor = 0;
    //情况一
  if (bf == 1) {
    parent->_balance_factor = 0;
    subL->_balance_factor = -1;
  }
    //情况二
  else if (bf == -1) {
    parent->_balance_factor = 1;
    subL->_balance_factor = 0;
  }
    //情况三
  else if (bf == 0) {
    parent->_balance_factor = 0;
    subL->_balance_factor = 0;
  }
  else assert(false);
}


3.2.4 新结点插入较高右子树的左侧 — 右左:右左双旋


e7b92d42268546ed924fce17b386114e.png


65268397aaaa43fa980ead6e3c1d3867.png


e16b63ed44494ffa8ca6021fefbbb0e2.png

void rotate_right_left(TreeNode* parent) {
  TreeNode* subR = parent->_right;
  TreeNode* subRL = subR->_left;
  int bf = subRL->_balance_factor;
  rotate_right(parent->_right);
  rotate_left(parent);
    //调整平衡因子
  subRL->_balance_factor = 0;
    //情况一
  if (bf == 1) {
    parent->_balance_factor = -1;
    subR->_balance_factor = 0;
  }
    //情况二
  else if (bf == -1) {
    parent->_balance_factor = 0;
    subR->_balance_factor = 1;
  }
    //情况三
  else if (bf == 0) {
    parent->_balance_factor = 0;
    subR->_balance_factor = 0;
  }
  else assert(false);
}

四、 AVL树的删除操作

因为AVL树也是二叉搜索树,可按照二叉搜索树的方式将节点删除,然后再更新平衡因子,只不

过与删除不同的时,删除节点后的平衡因子更新,最差情况下一直要调整到根节点的位置。


五、 AVL树性能分析

AVL树是一棵绝对平衡的二叉搜索树,其要求每个节点的左右子树高度差的绝对值都不超过1

这样可以保证查询时高效的时间复杂度,即O(log_2 N)

但是若要对AVL树做一些结构修改的操作,性能非常低下。比如:插入时要维护其绝对平衡,旋转的次数比较多,更差的是在删除时,有可能一直要让旋转持续到根的位置

因此若需要一种查询高效且有序的数据结构,而且数据的个数为静态的(即不会改变),可以考虑AVL树,但一个结构经常修改,就不太适合


六、 完整代码

#include <utility>
#include <cstdlib>
#include <cassert>
#include <iostream>
using std::cout;
using std::endl;
using std::max;
using std::swap;
using std::pair;
using std::make_pair;
template<class K,class V>
struct AVLTreeNode {
  AVLTreeNode(const pair<K,V>& kv) :_parent(nullptr), _left(nullptr), _right(nullptr),_data(kv),_balance_factor(0) {}
  AVLTreeNode<K, V>* _parent;
  AVLTreeNode<K, V>* _left;
  AVLTreeNode<K, V>* _right;
  pair<K, V> _data;
  int _balance_factor;//平衡因子
};
template<class K, class V>
class AVLTree 
{
  typedef AVLTreeNode<K, V> TreeNode;
public:
  bool insert(const pair<K, V>& kv) {
    if (_root == nullptr) {
      _root = new TreeNode(kv);
      return true;
    }
    TreeNode* parent = nullptr;
    TreeNode* cur = _root;
    while (cur != nullptr) {
      if (kv.first > cur->_data.first) {
        parent = cur;
        cur = cur->_right;
      }
      else if (kv.first < cur->_data.first) {
        parent = cur;
        cur = cur->_left;
      }
      else return false;
    }
    cur = new TreeNode(kv);
    if (kv.first > parent->_data.first) {
      parent->_right = cur;
    }
    else { //kv.first < parent->_data.first)
      parent->_left = cur;
    }
    cur->_parent = parent;
    //控制平衡
    //更新平衡因子
    while (parent != nullptr){
      if (cur == parent->_right) ++parent->_balance_factor;
      else --parent->_balance_factor;
      if(parent->_balance_factor == 0) break;
      else if (abs(parent->_balance_factor) == 1) {
        cur = parent;
        parent = parent->_parent;
      }
      else if (abs(parent->_balance_factor) == 2) {
        //需要旋转
        if (parent->_balance_factor == 2 && cur->_balance_factor == 1) {
          rotate_left(parent);
        }
        else if (parent->_balance_factor == -2 && cur->_balance_factor == -1) {
          rotate_right(parent);
        }
        else if (parent->_balance_factor == -2 && cur->_balance_factor == 1) {
          rotate_left_right(parent);
        }
        else if (parent->_balance_factor == 2 && cur->_balance_factor == -1) {
          rotate_right_left(parent);
        }
        else assert(false);
        break;
      }
      else {
        assert(false);
      }
    }
    return true;
  }
  void inorder() {
    _inorder(_root);
  }
  bool IsBlance() {
    return _IsBlance(_root);
  }
private:
  void _inorder(TreeNode* root) {
    if (root == nullptr) {
      return;
    }
    _inorder(root->_left);
    cout << root->_data.first << " ";
    _inorder(root->_right);
  }
  bool _IsBlance(TreeNode* root) {
    if (root == nullptr) return true;
    int diff = Height(root->_right) - Height(root->_left);
    if (diff != root->_balance_factor) {
      cout << root->_data.first << "结点的平衡因子异常" << endl;
      return false;
    }
    return abs(diff) < 2 && _IsBlance(root->_left) && _IsBlance(root->_right);
  }
  int Height(TreeNode* root) {
    if (root == nullptr) return 0;
    return max(Height(root->_left),Height(root->_right)) + 1;
  }
  void rotate_left(TreeNode* parent) {
    TreeNode* subR = parent->_right;
    TreeNode* subRL = subR->_left;
    TreeNode* pparent = parent->_parent;
    parent->_right = subRL;
    if (subRL != nullptr) subRL->_parent = parent;
    subR->_left = parent;
    parent->_parent = subR;
    //解决根结点变换带来的问题
    if (_root == parent) {
      _root = subR;
      subR->_parent = nullptr;
    }
    else {
      if (pparent->_left == parent) pparent->_left = subR;
      else pparent->_right = subR;
      subR->_parent = pparent;
    }
    subR->_balance_factor = parent->_balance_factor = 0;
  }
  void rotate_right(TreeNode* parent) {
    TreeNode* subL = parent->_left;
    TreeNode* subLR = subL->_right;
    TreeNode* pparent = parent->_parent;
    parent->_left = subLR;
    if (subLR != nullptr) subLR->_parent = parent;
    subL->_right = parent;
    parent->_parent = subL;
    if (_root == parent) {
      _root = subL;
      subL->_parent = nullptr;
    }
    else {
      if (pparent->_left == parent) pparent->_left = subL;
      else pparent->_right = subL;
      subL->_parent = pparent;
    }
    subL->_balance_factor = parent->_balance_factor = 0;
  }
  void rotate_left_right(TreeNode* parent) {
    TreeNode* subL = parent->_left;
    TreeNode* subLR = subL->_right;
    int bf = subLR->_balance_factor;
    rotate_left(parent->_left);
    rotate_right(parent);
    //更新平衡因子
    subLR->_balance_factor = 0;
    if (bf == 1) {
      parent->_balance_factor = 0;
      subL->_balance_factor = -1;
    }
    else if (bf == -1) {
      parent->_balance_factor = 1;
      subL->_balance_factor = 0;
    }
    else if (bf == 0) {
      parent->_balance_factor = 0;
      subL->_balance_factor = 0;
    }
    else assert(false);
  }
  void rotate_right_left(TreeNode* parent) {
    TreeNode* subR = parent->_right;
    TreeNode* subRL = subR->_left;
    int bf = subRL->_balance_factor;
    rotate_right(parent->_right);
    rotate_left(parent);
    subRL->_balance_factor = 0;
    if (bf == 1) {
      parent->_balance_factor = -1;
      subR->_balance_factor = 0;
    }
    else if (bf == -1) {
      parent->_balance_factor = 0;
      subR->_balance_factor = 1;
    }
    else if (bf == 0) {
      parent->_balance_factor = 0;
      subR->_balance_factor = 0;
    }
    else assert(false);
  }
private:
  TreeNode* _root = nullptr;
};
目录
相关文章
|
2月前
|
存储 索引
手撸二叉树——二叉查找树
二叉树是数据结构中非常重要的一种数据结构,它是树的一种。
13 2
|
2月前
|
Java
手撸二叉树——AVL平衡二叉树
本文介绍了AVL平衡二叉树的基本概念和实现方法。首先回顾了二叉查找树在插入节点后的不平衡问题,然后详细讲解了四种旋转操作:左左单旋转、右右单旋转、左右双旋转和右左双旋转,以确保树的平衡。文章还提供了Java代码实现,包括节点插入、删除和平衡调整的具体方法。通过这些操作,AVL树能够保持较低的高度,从而提高查询性能。
37 0
|
5月前
|
C++
【C++】手撕AVL树(下)
【C++】手撕AVL树(下)
59 1
|
5月前
|
Java C++ Python
【C++】手撕红黑树
【C++】手撕红黑树
30 1
|
5月前
|
Java C++ Python
【C++】手撕AVL树(上)
【C++】手撕AVL树(上)
57 0
【手撕红黑树】
【手撕红黑树】
133 0
手撕红黑树
手撕红黑树
79 0
|
7月前
|
存储 Java C++
手撕单链表
手撕单链表
64 0
|
7月前
|
存储 Java C++
手撕双链表
手撕双链表
51 0
|
存储 C语言
手撕双链表 1
手撕双链表
51 0