一、概念
二叉搜索树虽可以缩短查找的效率,但若数据有序或接近有序二叉搜索树将退化为单支树,查找元素相当于在链表中搜索元素,效率低下。
因此,两位俄罗斯的数学家G.M.Adelson-Velskii和E.M.Landis在1962年发明了一种解决上述问题的方法:当向二叉搜索树中插入新结点后,若能保证每个结点的左右子树高度之差的绝对值不超过1(需要对树中的结点进行调整),即可降低树的高度,从而减少平均搜索长度。
一棵AVL树是空树 或 具有以下性质的二叉搜索树:
1. 它的左右子树都是AVL树
2. 左右子树高度之差(简称平衡因子)的绝对值不超过1(-1/0/1) 右子树高度减去左子树高度
3. 若一棵二叉搜索树是高度平衡的,其就是AVL树。
若它有n个结点,其高度可保持在log_2 n,搜索时间复杂度O(log_2 n)
4. 不允许键值冗余
二、 结点的定义
2.1 键值对pair
pair是用来表示具有一一对应关系的一种结构,该结构中一般只包含两个成员变量key和value,key代表键值,value表示与key对应的信息
template <class T1, class T2> struct pair { typedef T1 first_type; typedef T2 second_type; T1 first; T2 second; pair(): first(T1()), second(T2()) {} pair(const T1& a, const T2& b): first(a), second(b) {} };
但使用时需要显示指定元素类型会导致代码过长,并且频繁使用时较为麻烦,于是出现make_pair进行自动类型推导。其定义为:
template <class T1,class T2> pair<T1,T2> make_pair (T1 x, T2 y) { return ( pair<T1,T2>(x,y) ); }
2.2 定义细节
结点中存储了左子树指针、右子树指针和父指针以及一个键值对(即数据域)、平衡因子。不过平衡因子并不是必要的,没有平衡因子同样可以实现AVL树。
struct AVLTreeNode { AVLTreeNode(const pair<K,V>& kv) : _parent(nullptr), _left(nullptr), _right(nullptr),_data(kv),_balance_factor(0) {} AVLTreeNode<K, V>* _parent; AVLTreeNode<K, V>* _left; AVLTreeNode<K, V>* _right; pair<K, V> _data; int _balance_factor;//平衡因子 };
普通二叉树和搜索二叉树都是二叉链(没有父指针),为什么AVL树会需要使用三叉链呢?
这个问题可以从后面的讲解得到答案。
插入和删除结点、旋转 、平衡因子调整,这些操作都会需要频繁的使用父指针,使用三叉链可以减少查找父结点的时间复杂度并且使得AVL树的实现更加方便。
三、 AVL树的插入操作
AVL本质上就是具有特殊性质的二叉搜索树,其插入操作与二叉搜索树较为相似,不过更为复杂。
AVL树的插入过程可以分为两步
1. 按照二叉搜索树的方式插入新节点 2. 调整节点的平衡因子
bool insert(const pair<K, V>& kv) { //第一步: 按照二叉搜索树的方式插入新节点 if (_root == nullptr) { _root = new TreeNode(kv); return true; } TreeNode* parent = nullptr; TreeNode* cur = _root; while (cur != nullptr) { if (kv.first > cur->_data.first) { parent = cur; cur = cur->_right; } else if (kv.first < cur->_data.first) { parent = cur; cur = cur->_left; } else return false; } cur = new TreeNode(kv); if (kv.first > parent->_data.first) { parent->_right = cur; } else { //kv.first < parent->_data.first) parent->_left = cur; } cur->_parent = parent; //调整平衡因子 //……………… }
但是平衡因子是如何调整的呢?
3.1 平衡因子调整规则
1. 若新增结点在其父结点的左边,则父结点的平衡因子 -1;若新增结点在其父结点的右边,则父结点的平衡因子 +1。
2. 更新后,若父结点的平衡因子为1 或 -1,说明插入前父结点的平衡因子为0,插入后父结点所在子树的高度发生变化,需要继续向上更新
3.更新后,若父结点的平衡因子为0,说明插入前父结点的平衡因子为1 或 -1,插入到了父结点矮的一边,父结点所在子树的高度并未发生变化,所以不需继续向上更新
4.更新后,若父结点的平衡因子为2 或 -2,说明插入前父结点的平衡因子为1 或 -1(达到平衡临界值),插入后已经破坏平衡,此时父结点所子树需要进行旋转处理
5.更新后,若父结点的平衡因子的绝对值大于2(理论上而言不可能),说明插入前该树就不是AVL树,需检查之前的操作。
while (parent != nullptr){ //规则1 if (cur == parent->_right) ++parent->_balance_factor; else --parent->_balance_factor; //规则2 if(parent->_balance_factor == 0) break; //规则3 else if (abs(parent->_balance_factor) == 1) { cur = parent; parent = parent->_parent; } //规则4 else if (abs(parent->_balance_factor) == 2) { //需要旋转 //……………… } //规则5 else { assert(false); } return true; }
3.2 旋转规则
AVL树的旋转可以分为四种:
3.2.1 新结点插入较高左子树的左侧 — 左左:右单旋
//发生右旋的判断条件 if (parent->_balance_factor == -2 && cur->_balance_factor == -1) { rotate_right(parent); }
void rotate_right(TreeNode* parent) { TreeNode* subL = parent->_left; TreeNode* subLR = subL->_right; TreeNode* pparent = parent->_parent;//发生旋转的子树的父结点 parent->_left = subLR; if (subLR != nullptr) subLR->_parent = parent;//h可能为0,即空树 subL->_right = parent; parent->_parent = subL; //父结点所在的子树发生右旋转后,该子树的根结点发生改变 if (_root == parent) { _root = subL; subL->_parent = nullptr; } else { if (pparent->_left == parent) pparent->_left = subL; else pparent->_right = subL; subL->_parent = pparent; } //更新平衡因子 subL->_balance_factor = parent->_balance_factor = 0; }
3.2.2 新结点插入较高右子树的右侧 — 右右:左单旋
//发生左旋的判断条件 if (parent->_balance_factor == 2 && cur->_balance_factor == 1) { rotate_left(parent); }
void rotate_right(TreeNode* parent) { TreeNode* subL = parent->_left; TreeNode* subLR = subL->_right; TreeNode* pparent = parent->_parent;//发生旋转的子树的父结点 parent->_left = subLR; if (subLR != nullptr) subLR->_parent = parent;//h可能为0,即空树 subL->_right = parent; parent->_parent = subL; //parent所在的子树发生左旋转后,该子树的根结点发生变化 if (_root == parent) { _root = subL; subL->_parent = nullptr; } else { if (pparent->_left == parent) pparent->_left = subL; else pparent->_right = subL; subL->_parent = pparent; } //更新平衡因子 subL->_balance_factor = parent->_balance_factor = 0; }
3.2.3 新结点插入较高左子树的右侧 — 左右:左右双旋
void rotate_left_right(TreeNode* parent) { TreeNode* subL = parent->_left; TreeNode* subLR = subL->_right; int bf = subLR->_balance_factor; rotate_left(parent->_left); rotate_right(parent); //更新平衡因子 subLR->_balance_factor = 0; //情况一 if (bf == 1) { parent->_balance_factor = 0; subL->_balance_factor = -1; } //情况二 else if (bf == -1) { parent->_balance_factor = 1; subL->_balance_factor = 0; } //情况三 else if (bf == 0) { parent->_balance_factor = 0; subL->_balance_factor = 0; } else assert(false); }
3.2.4 新结点插入较高右子树的左侧 — 右左:右左双旋
void rotate_right_left(TreeNode* parent) { TreeNode* subR = parent->_right; TreeNode* subRL = subR->_left; int bf = subRL->_balance_factor; rotate_right(parent->_right); rotate_left(parent); //调整平衡因子 subRL->_balance_factor = 0; //情况一 if (bf == 1) { parent->_balance_factor = -1; subR->_balance_factor = 0; } //情况二 else if (bf == -1) { parent->_balance_factor = 0; subR->_balance_factor = 1; } //情况三 else if (bf == 0) { parent->_balance_factor = 0; subR->_balance_factor = 0; } else assert(false); }
四、 AVL树的删除操作
因为AVL树也是二叉搜索树,可按照二叉搜索树的方式将节点删除,然后再更新平衡因子,只不
过与删除不同的时,删除节点后的平衡因子更新,最差情况下一直要调整到根节点的位置。
五、 AVL树性能分析
AVL树是一棵绝对平衡的二叉搜索树,其要求每个节点的左右子树高度差的绝对值都不超过1
这样可以保证查询时高效的时间复杂度,即O(log_2 N)
但是若要对AVL树做一些结构修改的操作,性能非常低下。比如:插入时要维护其绝对平衡,旋转的次数比较多,更差的是在删除时,有可能一直要让旋转持续到根的位置
因此若需要一种查询高效且有序的数据结构,而且数据的个数为静态的(即不会改变),可以考虑AVL树,但一个结构经常修改,就不太适合
六、 完整代码
#include <utility> #include <cstdlib> #include <cassert> #include <iostream> using std::cout; using std::endl; using std::max; using std::swap; using std::pair; using std::make_pair; template<class K,class V> struct AVLTreeNode { AVLTreeNode(const pair<K,V>& kv) :_parent(nullptr), _left(nullptr), _right(nullptr),_data(kv),_balance_factor(0) {} AVLTreeNode<K, V>* _parent; AVLTreeNode<K, V>* _left; AVLTreeNode<K, V>* _right; pair<K, V> _data; int _balance_factor;//平衡因子 }; template<class K, class V> class AVLTree { typedef AVLTreeNode<K, V> TreeNode; public: bool insert(const pair<K, V>& kv) { if (_root == nullptr) { _root = new TreeNode(kv); return true; } TreeNode* parent = nullptr; TreeNode* cur = _root; while (cur != nullptr) { if (kv.first > cur->_data.first) { parent = cur; cur = cur->_right; } else if (kv.first < cur->_data.first) { parent = cur; cur = cur->_left; } else return false; } cur = new TreeNode(kv); if (kv.first > parent->_data.first) { parent->_right = cur; } else { //kv.first < parent->_data.first) parent->_left = cur; } cur->_parent = parent; //控制平衡 //更新平衡因子 while (parent != nullptr){ if (cur == parent->_right) ++parent->_balance_factor; else --parent->_balance_factor; if(parent->_balance_factor == 0) break; else if (abs(parent->_balance_factor) == 1) { cur = parent; parent = parent->_parent; } else if (abs(parent->_balance_factor) == 2) { //需要旋转 if (parent->_balance_factor == 2 && cur->_balance_factor == 1) { rotate_left(parent); } else if (parent->_balance_factor == -2 && cur->_balance_factor == -1) { rotate_right(parent); } else if (parent->_balance_factor == -2 && cur->_balance_factor == 1) { rotate_left_right(parent); } else if (parent->_balance_factor == 2 && cur->_balance_factor == -1) { rotate_right_left(parent); } else assert(false); break; } else { assert(false); } } return true; } void inorder() { _inorder(_root); } bool IsBlance() { return _IsBlance(_root); } private: void _inorder(TreeNode* root) { if (root == nullptr) { return; } _inorder(root->_left); cout << root->_data.first << " "; _inorder(root->_right); } bool _IsBlance(TreeNode* root) { if (root == nullptr) return true; int diff = Height(root->_right) - Height(root->_left); if (diff != root->_balance_factor) { cout << root->_data.first << "结点的平衡因子异常" << endl; return false; } return abs(diff) < 2 && _IsBlance(root->_left) && _IsBlance(root->_right); } int Height(TreeNode* root) { if (root == nullptr) return 0; return max(Height(root->_left),Height(root->_right)) + 1; } void rotate_left(TreeNode* parent) { TreeNode* subR = parent->_right; TreeNode* subRL = subR->_left; TreeNode* pparent = parent->_parent; parent->_right = subRL; if (subRL != nullptr) subRL->_parent = parent; subR->_left = parent; parent->_parent = subR; //解决根结点变换带来的问题 if (_root == parent) { _root = subR; subR->_parent = nullptr; } else { if (pparent->_left == parent) pparent->_left = subR; else pparent->_right = subR; subR->_parent = pparent; } subR->_balance_factor = parent->_balance_factor = 0; } void rotate_right(TreeNode* parent) { TreeNode* subL = parent->_left; TreeNode* subLR = subL->_right; TreeNode* pparent = parent->_parent; parent->_left = subLR; if (subLR != nullptr) subLR->_parent = parent; subL->_right = parent; parent->_parent = subL; if (_root == parent) { _root = subL; subL->_parent = nullptr; } else { if (pparent->_left == parent) pparent->_left = subL; else pparent->_right = subL; subL->_parent = pparent; } subL->_balance_factor = parent->_balance_factor = 0; } void rotate_left_right(TreeNode* parent) { TreeNode* subL = parent->_left; TreeNode* subLR = subL->_right; int bf = subLR->_balance_factor; rotate_left(parent->_left); rotate_right(parent); //更新平衡因子 subLR->_balance_factor = 0; if (bf == 1) { parent->_balance_factor = 0; subL->_balance_factor = -1; } else if (bf == -1) { parent->_balance_factor = 1; subL->_balance_factor = 0; } else if (bf == 0) { parent->_balance_factor = 0; subL->_balance_factor = 0; } else assert(false); } void rotate_right_left(TreeNode* parent) { TreeNode* subR = parent->_right; TreeNode* subRL = subR->_left; int bf = subRL->_balance_factor; rotate_right(parent->_right); rotate_left(parent); subRL->_balance_factor = 0; if (bf == 1) { parent->_balance_factor = -1; subR->_balance_factor = 0; } else if (bf == -1) { parent->_balance_factor = 0; subR->_balance_factor = 1; } else if (bf == 0) { parent->_balance_factor = 0; subR->_balance_factor = 0; } else assert(false); } private: TreeNode* _root = nullptr; };