有序表之AVL树

简介: 有序表之AVL树

前言

数据库中最重要的基础是索引,索引为什么能被建立起来,因为能建立索引的字段都是可以排序的,(任何字符串都可以排序)只是我们平时感受不深。

排序是如何帮助加速找数据库里的东西的呢?
在数据库里存数据的方式真的有可能是有顺序的。比如数据库里面硬盘结构可能就有顺序。底层数据写在硬盘上是顺序的话,就在底层数据之上建出一颗索引树。

搜索二叉树(BST)

搜索二叉树单纯的加数据,找数据很容易,所以搜索二叉树本身就可以支持索引。(增删改查都在树上玩)

但问题是,在最坏情况下,这棵树会退化成为链表。
在这里插入图片描述
这个时候就引出了平衡搜索二叉树的概念:一棵树先保证是搜索二叉树的情况下,再保证它的平衡性。所谓平衡性:假设所有数据量为N的话,树的最大高度也仅仅是LogN的水平。

为什么不用哈希表(O(1))?因为现实情况下在数据库里的操作是有联系的,比如范围查询。

平衡搜索二叉树(AVL)

平衡搜索二叉树的基础操作,左旋和右旋,(左旋和右旋都不会破坏原本的搜索性)

头结点往哪左边倒就是左旋,头结点往右边倒就是右旋。

左旋

左旋:先指定头结点,然后,头结点往左边倒,头结点的右孩子上来
在这里插入图片描述

右旋

右旋:头结点往右边倒,头结点的左孩子上来。
在这里插入图片描述
总结:经典的有序表有很多种实现方式,比如AVL树,SB树(size balance tree),红黑树等,但是不管是哪种平衡搜索二叉树,不管平衡性如何定义,底层让它们变平衡的方式只有左旋和右旋!

AVL树(平衡性最严苛)

为什么要有AVL树,因为AVL树的平衡性会使得在树上玩增删改查的效率会更高!!!

AVL树的平衡性:任何一个结点,|左树最大高度 - 右树最大高度| < 2

搜索二叉树添加结点很容易,但是删除结点并不那么容易,在coding上都是要花费很大功夫的。
在这里插入图片描述
搜索二叉树删除结点最麻烦的一种情况,就是要删除的结点既有左树,也有右树。 可以用要删除结点右树上的最左结点替换,也可以用左树上的最右结点替换。下面介绍用右树上的最左替换。

如下图,要删除的结点是X,找到X结点右树上最左边的结点a,覆盖X。这样,左右两边的搜索性都没有被破坏。因为在一课搜索二叉树中,a结点就是距离X结点最近且比它大的结点,这是搜索二叉树的性质。

在这里插入图片描述
上面介绍了搜索二叉树的删除是如何进行的,当然,添加和查都很容易。AVL树,的添加,删除和查都跟搜索二叉树一样,只是在进行完了这些操作后,AVL树有自己平衡性的补充。

AVL树的平衡性

破坏AVL树平衡性的四种类型

那么AVL树如何调整平衡性?跟破坏AVL平衡性的类型有关。AVL树破坏平衡性的类型有如下四种(跟左旋和右旋无关):
以下是AVL树局部破坏平衡性的情况

  • LL型
  • LR型
  • RR型
  • RL型

##### LL型违规
遇到LL型违规,做一次右旋即可恢复平衡性,遇到RR型,做一次左旋即可。
在这里插入图片描述

LR型违规

遇到LR型违规,如下图,右树的高度比较小,左树的高度比较大,并且是由于左树的右树高度比较大,才破坏的平衡性。
在这里插入图片描述
如何调整,想办法让孙子替换爷爷,也就是说让C替换A。

第一步:在以B为头结点的整棵树上做一次左旋,让C先往上走一步。
在这里插入图片描述
第二步:在以A为头结点的整棵树进行一次右旋,让C彻底来到头部。
在这里插入图片描述

RR型违规

RR型:做一次左旋即可
在这里插入图片描述

RL型违规

RL型:想办法让孙子去到顶部,也就是说C结点替换A。(C就是孙)
在这里插入图片描述
第一步:先在以B为头结点的整棵树玩一次右旋
第二步:在以A为头结点整棵树玩一次左旋

极端情况

但是存在一种极端情况,既属于LL违规型,又属于LR违规型。
在这里插入图片描述
上图中的树,删掉右边一个结点后,就破坏平衡性,并且既是LL,又是LR。
在这里插入图片描述
既是LL又是LR,直接按照LL型标准来调整,直接右旋。是正确的!
在这里插入图片描述
举个反例,既是LL型,又是LR型(下图A的整颗左树高度是7,整颗右树高度是5)按照LR型标准来调整是错误的。
在这里插入图片描述
上图例子按照LL型调整后是正确的。
在这里插入图片描述
但是按照LR型调整是错误的。虽然下面例子(S的高度是5)是正确的,但是如果S的高度是4的话,依然破坏了平衡性。
如果S高度是4,按照LL型标准调整,依然正确,按照LR调整是错误的!!!,可以自己动手画一下试试。
在这里插入图片描述
同理,也会出现既是RL型违规和又是RR型违规。但是不会出现既是LL型,又是RR型。

AVL树的调整代价

上述四种违规类型的调整代价都是很小的,O(1)。

那么AVL树加入一个结点后,具体如何调整呢?是加入某个结点后,往上沿途每个结点都检查,看属于哪种违规类型。包括加入的结点。

如果AVL树在加入结点之前的最大高度为LogN,那么加入一个结点后,即使往上所有结点都要检查是否违规,因为上面只有LogN个结点,而每个节点的调整代价为O(1);所以,AVL树调整平衡性的代价就是O(LogN)

AVL树里,维持平衡的因子就是树的高度h,所以每一次结点相对位置调整完后,都要更新平衡因子h。如果别的树的平衡因子是另外的,也要这么干,比如红黑树,SB树等,后续文章会讲述到。

补充

有序表跟AVL树的关系

如果将有序表比作成一个接口,那么AVL树就是一个具体的类,而可以实现有序表的还有SB树,红黑树,跳表,234树,B树,B+树...,它们实现有序表的时间复杂度都是O(LogN),区别只是具体的实现细节不一样。

今天为什么关系型数据库走向了没落,随之流行的是水平扩展性数据库,一致性哈希数据库。待到后续文章继续了解吧

最后附上全部代码~

package com.harrison.class25;

/**
 * @author Harrison
 * @create 2022-04-03-10:46
 * @motto 众里寻他千百度,蓦然回首,那人却在灯火阑珊处。
 */
public class Code01_AVLTreeMap {
    /*
    因为AVL树是有序表里面用到的,所以必须要求它的key可比较
    没有办法比较,就不用谈有序表
     */
    public static class AVLNode<K extends Comparable<K>, V> {
        // AVL里的具体结点封装进去
        public K k;
        public V v;
        // 指向左孩子和右孩子的结点
        public AVLNode<K, V> l;
        public AVLNode<K, V> r;
        // AVL树中的平衡因子:高度(整棵AVL树的高度)
        public int h;

        public AVLNode(K key, V value) {
            k = key;
            v = value;
            h = 1;
        }
    }

    /*
    用AVL树实现的有序表
     */
    public static class AVLTreeMpa<K extends Comparable<K>, V> {
        public AVLNode root;// 整棵树的根结点
        public int size;// 加入的key的个数

        public AVLTreeMpa() {
            root = null;
            size = 0;
        }

        // 针对cur结点整棵树玩右旋
        private AVLNode<K, V> rightRotate(AVLNode<K, V> cur) {
            // 先记住cur的左孩子,因为右旋是cur往右边倒
            AVLNode<K, V> left = cur.l;
            // 然后左孩子的右树挂在我的(cur)的左边
            cur.l = left.r;
            // 左孩子的右接管cur
            left.r=cur;
            // 调整cur和left的高度
            // 并且一定要先调整cur的高度后再调整left
            // 因为右旋后头结点是left了
            cur.h = Math.max((cur.l != null ? cur.l.h : 0), (cur.r != null ? cur.r.h : 0)) + 1;
            left.h = Math.max((left.l != null ? left.l.h : 0), (left.r != null ? left.r.h : 0)) + 1;
            return left;
        }

        private AVLNode<K,V> leftRotate(AVLNode<K,V> cur){
            AVLNode<K,V> right=cur.r;
            cur.r=right.l;
            right.l=cur;
            cur.h = Math.max((cur.l != null ? cur.l.h : 0), (cur.r != null ? cur.r.h : 0)) + 1;
            right.h = Math.max((right.l != null ? right.l.h : 0), (right.r != null ? right.r.h : 0)) + 1;
            return right;
        }

        /*
        搜索二叉树里不加重复的key
        只要说搜索二叉树,它的潜台词就是每个key都不一样
         */
        // 在以cur为头的整颗子树上,加记录,并且把整棵树的头结点返回
        // add()方法不会遇到相同的key
        public AVLNode<K,V> add(AVLNode<K,V> cur,K key,V value){
            if(cur==null){
                return new AVLNode<K,V>(key,value);
            }else{
                if(key.compareTo(cur.k)<0){
                    // 有可能存在换头的情况
                    cur.l=add(cur.l,key,value);
                }else{
                    cur.r=add(cur.r,key,value);
                }
            }
            cur.h = Math.max((cur.l != null ? cur.l.h : 0), (cur.r != null ? cur.r.h : 0)) + 1;
            // 以上只是搜索二叉树的增加结点
            // 加完结点后,调平衡
            return maintain(cur);
        }



        // 在cur这棵树上,删掉key所代表的节点
        // 返回cur这棵树的新头部
        private AVLNode<K,V> delete(AVLNode<K,V> cur,K key){
            if(key.compareTo(cur.k)>0){
                cur.r=delete(cur.r,key);
            }else if(key.compareTo(cur.k)<0){
                cur.l=delete(cur.l,key);
            }else{
                if(cur.l==null && cur.r==null){
                    cur=null;
                }else if(cur.l==null && cur.r!=null){
                    cur=cur.r;
                }else if(cur.l!=null && cur.r==null){
                    cur=cur.l;
                }else{
                    // 找到右树上的最左结点
                    AVLNode<K,V> des=cur.r;
                    while (des.l!=null){
                        des=des.l;
                    }
                    /*
                    先在右树调一个delete()方法,在删掉最左结点后,完成右树的平衡调整,
                    然后得到最左结点,替换要删除的结点,然后依次往上检查平衡性
                     */
                    cur.r=delete(cur.r,des.k);
                    des.l=cur.l;
                    des.r=cur.r;
                    cur=des;
                }
            }
            if (cur != null) {
                cur.h = Math.max(cur.l != null ? cur.l.h : 0, cur.r != null ? cur.r.h : 0) + 1;
            }
            // 每删掉一个结点都会往上检查平衡性,所以递归函数会多次调用自己,而每一次都会检查自己的平衡性
            return maintain(cur);
        }

        private AVLNode<K,V> maintain(AVLNode<K,V> cur){
            if(cur==null){
                return null;
            }
            int leftHeight=cur!=null?cur.l.h:0;
            int rightHeiht=cur.r!=null?cur.r.h:0;
            if(Math.abs(leftHeight-rightHeiht)>1){
                if(leftHeight>rightHeiht){
                    int leftLeftHeight = cur.l != null && cur.l.l != null ? cur.l.l.h : 0;
                    int leftRightHeight = cur.l != null && cur.l.r != null ? cur.l.r.h : 0;
                    if(leftLeftHeight>leftRightHeight){
                        // 等于为什么放在这里,因为既是LL型,又是LR型,按照LL型标准来调整平衡性
                        cur=rightRotate(cur);
                    }else{
                        cur.l=leftRotate(cur.l);
                        cur=rightRotate(cur);
                    }
                }else{
                    int rightLeftHeight = cur.r != null && cur.r.l != null ? cur.r.l.h : 0;
                    int rightRightHeight = cur.r != null && cur.r.r != null ? cur.r.r.h : 0;
                    if(rightLeftHeight>=rightRightHeight){
                        // 同理,如果既是RR型,又是RL型,按照RR型标准来调整平衡性
                        cur=leftRotate(cur);
                    }else{
                        cur.r=rightRotate(cur.r);
                        cur=leftRotate(cur);
                    }
                }
            }
            return cur;
        }

        private AVLNode<K, V> findLastIndex(K key) {
            AVLNode<K, V> pre = root;
            AVLNode<K, V> cur = root;
            while (cur != null) {
                pre = cur;
                if (key.compareTo(cur.k) == 0) {
                    break;
                } else if (key.compareTo(cur.k) < 0) {
                    cur = cur.l;
                } else {
                    cur = cur.r;
                }
            }
            return pre;
        }

        private AVLNode<K, V> findLastNoSmallIndex(K key) {
            AVLNode<K, V> ans = null;
            AVLNode<K, V> cur = root;
            while (cur != null) {
                if (key.compareTo(cur.k) == 0) {
                    ans = cur;
                    break;
                } else if (key.compareTo(cur.k) < 0) {
                    ans = cur;
                    cur = cur.l;
                } else {
                    cur = cur.r;
                }
            }
            return ans;
        }

        private AVLNode<K, V> findLastNoBigIndex(K key) {
            AVLNode<K, V> ans = null;
            AVLNode<K, V> cur = root;
            while (cur != null) {
                if (key.compareTo(cur.k) == 0) {
                    ans = cur;
                    break;
                } else if (key.compareTo(cur.k) < 0) {
                    cur = cur.l;
                } else {
                    ans = cur;
                    cur = cur.r;
                }
            }
            return ans;
        }

        public int size() {
            return size;
        }

        public boolean containsKey(K key) {
            if (key == null) {
                return false;
            }
            AVLNode<K, V> lastNode = findLastIndex(key);
            return lastNode != null && key.compareTo(lastNode.k) == 0 ? true : false;
        }

        public void put(K key, V value) {
            if (key == null) {
                return;
            }
            AVLNode<K, V> lastNode = findLastIndex(key);
            if (lastNode != null && key.compareTo(lastNode.k) == 0) {
                lastNode.v = value;
            } else {
                size++;
                root = add(root, key, value);
            }
        }

        public void remove(K key) {
            if (key == null) {
                return;
            }
            if (containsKey(key)) {
                size--;
                root = delete(root, key);
            }
        }

        public V get(K key) {
            if (key == null) {
                return null;
            }
            AVLNode<K, V> lastNode = findLastIndex(key);
            if (lastNode != null && key.compareTo(lastNode.k) == 0) {
                return lastNode.v;
            }
            return null;
        }

        public K firstKey() {
            if (root == null) {
                return null;
            }
            AVLNode<K, V> cur = root;
            while (cur.l != null) {
                cur = cur.l;
            }
            return cur.k;
        }

        public K lastKey() {
            if (root == null) {
                return null;
            }
            AVLNode<K, V> cur = root;
            while (cur.r != null) {
                cur = cur.r;
            }
            return cur.k;
        }

        public K floorKey(K key) {
            if (key == null) {
                return null;
            }
            AVLNode<K, V> lastNoBigNode = findLastNoBigIndex(key);
            return lastNoBigNode == null ? null : lastNoBigNode.k;
        }

        public K ceilingKey(K key) {
            if (key == null) {
                return null;
            }
            AVLNode<K, V> lastNoSmallNode = findLastNoSmallIndex(key);
            return lastNoSmallNode == null ? null : lastNoSmallNode.k;
        }
    }
}
相关文章
|
算法
AVL树,Treap树,红黑树的实现(上)
AVL树,Treap树,红黑树的实现
|
2天前
|
存储 C++
【C++】AVL树
AVL树是一种自平衡二叉搜索树,由Georgy Adelson-Velsky和Evgenii Landis提出。它通过确保任意节点的两子树高度差不超过1来维持平衡,支持高效插入、删除和查找操作,时间复杂度为O(log n)。AVL树通过四种旋转操作(左旋、右旋、左-右旋、右-左旋)来恢复树的平衡状态,适用于需要频繁进行数据操作的场景。
14 2
|
5月前
|
C++
【c++】avl树
【c++】avl树
33 0
|
6月前
AVL 树
AVL 树
49 2
|
6月前
|
C++ 容器
【C++】—— 详解AVL树
【C++】—— 详解AVL树
|
6月前
|
存储 测试技术 C++
C++【AVL树】
C++【AVL树】
73 0
二叉搜索树之AVL树
二叉搜索树之AVL树
|
11月前
|
C++
C++实现AVL树
C++实现AVL树
63 0
|
算法 Java Python
实现AVL树
大家好,我是王有志。今天,我们会用Java和Python分别实现第一个平衡二分搜索树--AVL树。
84 0
实现AVL树