二叉搜索树 和 哈希表 (JAVA)

本文涉及的产品
函数计算FC,每月15万CU 3个月
简介: 【1月更文挑战第1天】阿里云初体验二叉搜索树二叉搜索树的插入二叉搜索树的查找二叉搜索树的删除哈希表哈希冲突闭散列线性探测法二次探测法开散列二叉搜索树又称二叉排序树,它具有以下性质的二叉树或空树:若它的左子树不为空,则左子树上所有节点的值都小于根节点的值若它的右子树不为空,则右子树上所有节点的值都大于根节点的值它的每颗子树也分别为二叉搜索树而哈希表是一种插入/删除/查找时间复杂度都是O(1)的数据结构,它的查询之所以也可以如此之快的的原因就是它在查找时不需要经过任何比较,直接一次从表中得到要搜索的元素。

​二叉搜索树

先了解一下二叉搜索树是啥,概念如下:

二叉搜索树又称二叉排序树,它具有以下性质的二叉树或空树:

  1. 若它的左子树不为空,则左子树上所有节点的值都小于根节点的值
  2. 若它的右子树不为空,则右子树上所有节点的值都大于根节点的值
  3. 它的每颗子树也分别为二叉搜索树

这就是一颗简单的二叉搜索树:
​​​​
屏幕截图 2024-01-24 181530.png

二叉搜索树的插入

二叉搜索树的插入非常简单

  1. 从根节点开始比较,如果大于根节点就遍历右子树,小于根节点就遍历左子树
  2. 对所有的子树都进行如上操作
  3. 直到遍历到空节点,将待插入元素插入此空节点
    先创建一个二叉搜索树的类,然后创建一个描述节点的内部类:
public class BinarySearchTree {
   
    //描述节点的内部类
    public static class TreeNode {
   
        public int key;
        public TreeNode left;
        public TreeNode right;

        TreeNode(int key) {
   
            this.key = key;
        }
    }
    //搜索树的根节点
    public TreeNode root;

}

添加一个插入元素的方法,注:二叉搜索树的插入只会出现在null节点处,也就是插入的新节点都会成为搜索书的叶子节点 。

public class BinarySearchTree {
   

    public static class TreeNode {
   
        public int key;
        public TreeNode left;
        public TreeNode right;

        TreeNode(int key) {
   
            this.key = key;
        }
    }

    public TreeNode root;
    /**
     * 插入一个元素
     */
    public boolean insert(int key) {
   
        TreeNode tmp = new TreeNode(key);
        //树如果为空就直接令其成为根节点
        if (this.root == null) {
   
            this.root = tmp;
            //插入成功返回true
            return true;
        }

        TreeNode parent = this.root;
        TreeNode p1 = this.root;
        //寻找新元素的插入位置
        while (p1 != null) {
   
            parent = p1;
            if (p1.key > key) {
   
                p1 = p1.left;
            }else {
   
                p1 = p1.right;
            }
        }
        //插入新元素
        if (parent.key > key) {
   
            parent.left = tmp;
        }else {
   
            parent.right = tmp;
        }
        //插入成功返回true
        return true;
    }
}

二叉搜索树的查找

在二叉搜索树中查找一个元素分为两步:

  1. 从根节点开始比较,如果大于根节点就遍历右子树,小于根节点就遍历左子树

  2. 对所有的子树都进行如上操作

//查找key是否存在
    public TreeNode search(int key) {
   
        //判断树是否为空,为空就直接返回null
        if (this.root == null){
   
            return null;
        }
        TreeNode tmp = this.root;
        while (tmp != null) {
   
            if (tmp.key > key) {
   
                tmp = tmp.left;
            }else if (tmp.key < key) {
   
                tmp = tmp.right;
            }else {
   
                //找到该元素后将其作为返回值返回
                return tmp;
            }
        }
        //当出循环之后代表没找到该元素返回null
        return null;
    }

二叉搜索树的删除

二叉搜索树的删除相比于插入和查找还是比较复杂的,因为要保证删除待删除结点之后,树依旧是一颗二叉搜索树。

分两种情况:

  • 待删除节点只有一颗子树即左子树或者右子树为空
    • 当待删除节点左树为空就令待删除节点的双亲指向其右子树
    • 当待删除节点右树为空就令待删除节点的双亲指向其左子树

image.png

  • 左右子树都不为空(此处我们利用“替罪羊”的删除方法)
    • 找到待删除节点的右(左)子树的最左(右)端的节点
    • 交换两个结点的值!
    • 删除该节点

image.png

//删除key的值
    public boolean remove(int key) {
   
        if (this.root == null) {
   
            return false;
        }
        TreeNode tmp = this.root;
        TreeNode privat = tmp;
        //寻找待删除节点
        while (tmp != null) {
   
            if (tmp.key > key) {
   
                privat = tmp;
                tmp = tmp.left;
            }else if (tmp.key < key) {
   
                privat = tmp;
                tmp = tmp.right;
            }else {
   
                break;
            }
        }
        if (tmp == null) {
   
            return false;
        }
        //判断待删除节点是否只有一颗子树
        if (tmp.left == null || tmp.right == null) {
   
            判断该子树为左右哪颗子树
            if (tmp.left == null) {
   
                if (tmp == this.root) {
   
                    this.root = tmp.right;
                }else {
   
                    if (privat.left == tmp) {
   
                        privat.left = tmp.right;
                    }else {
   
                        privat.right = tmp.right;
                    }
                }
            }else {
   
                if (tmp == this.root) {
   
                    this.root = tmp.left;
                }else {
   
                    if (privat.left == tmp) {
   
                        privat.left = tmp.left;
                    }else {
   
                        privat.right = tmp.left;
                    }
                }
            }
        }else {
   
            //待删除节点有两棵子树时
            //寻找右子树的最左端的节点
            TreeNode a = tmp.right;
            while(a.left != null) {
   
                privat = a;
                a = a.left;
            }
            //将右子树的最左端的节点的值赋值给待删除节点
            tmp.key = a.key;
            //删除右子树的最左端的节点
            if (privat.left == a) {
   
                privat.left = a.right;
            }else {
   
                privat.right = a.right;
            }
        }
        return true;
    }

性能分析:

最好情况下:当前二叉搜索树为一颗完全二叉树,查找效率为树的高度,即O()。

最坏情况下:当前二叉搜索树为一颗单分支的树,查找效率为O(N)。

哈希表

在顺序结构和平衡树中,顺序查找时间复杂度为O(N),平衡树中为树的高度,即O()。

而哈希表是一种插入/删除/查找时间复杂度都是O(1)的数据结构,它的查询之所以也可以如此之快的的原因就是它在查找时不需要经过任何比较,直接一次从表中得到要搜索的元素。

实现这种数据结构的方法就是通过某种函数使元素的存储位置与它的关键码之间能够建立一一对应的映射关系,在查找时通过该函数就可以很快找到该元素。而这种数据结构被称作哈希表或散列表,这种函数被称为哈希(散列)函数。

设计一个哈希表最关键的一步就是设计哈希函数。

哈希函数的设计有以下要求:

  1. 哈希函数的定义域必须包括需要存储的全部关键码,其值域必须在0到m-1之间(散列表允许有m个地址)
  2. 哈希函数计算出来的地址能均匀分布在整个空间中
  3. 哈希函数应该比较简单
    例如将数据集合{1,7,6,4,5,9}存入哈希表

image.png

存入的时候将每个元素都带入哈希函数计算出下标然后插入,查找时也是同理。

但是此时又出现了一个新问题如果此时要插入元素15 就会发现没地方可以放了,而这也是哈希表中经常会发生的问题,被称为:哈希冲突或哈希碰撞。

冲突的发生是必然的,而我们能做的应该是尽量的降低冲突率。

哈希冲突

降低哈希冲突有以下几个方法:

  • 采用更优的哈希函数,哈希函数设计的越精妙,产生哈希冲突的可能性就越低,但是无法避免哈希冲突;
  • 减小负载因子(负载因子 = 填入表中的元素个数 / 表的大小 JDK中负载因子被设置成里0.75)也就是增大哈希表的存储地址。
    解决哈希冲突的两种常见的方法是:闭散列和开散列

闭散列

闭散列也叫开放定址法,当发生哈希冲突时,如果哈希表未被装满,说明在哈希表中必然还有空位置,那么可以把key存放到冲突位置中的“下一个” 空位置中去。

常见的闭散列有两种:

线性探测法
线性探测:从发生冲突的位置开始,依次向后探测,直到寻找到下一个空位置为止。

通过哈希函数获取待插入元素在哈希表中的位置
如果该位置中没有元素则直接插入新元素,如果该位置中有元素发生哈希冲突,使用线性探测找到下一个空位置,插入新元素
例如在前面的例子中插入元素14:
image.png

因为下标为4的地方已经有值了,所以就看下一个位置即下标为5的地方,此处因为也有值所以继续向后寻找直到出现空位。

线性探测的缺陷:产生冲突的数据会堆积在一起,这与其找下一个空位置的方式关系,因为找空位置的方式就是挨着往后逐个去找。

二次探测法
二次探测法的本质与线性探测法相同,它们的区别是当发生哈希冲突时找下一个空位置的方法不同。

二次探测法找空位置的方法为: % m 其中:i = 1,2,3…, H0是通过散列函数对元素的关键码 key 进行计算得到的位置其中m是表的大小。

例如在前面的例子中插入元素14:

image.png

虽然插入位置和线性探测法相同但是原理不同:

先计算得到插入位置H0 = 4,因为4下标处已有值所以带入利用 % m 公式代入i=1;
计算得到的新下标为5,但5下标处也有值所以带入i = 2;
计算得到新下标为8,插入;
但是闭散列还有一个问题:如果此时删除元素4那么就找不到元素14了。

开散列

开散列法又叫链地址法(开链法),首先对关键码集合用散列函数计算散列地址,具有相同地址的关键码归于同一子集合,每一个子集合称为一个桶,各个桶中的元素通过一个单链表链接起来,各链表的头结点存储在哈希表中。

比如采用开散列的方式存储集合{1,7,6,4,5,9,14}
image.png

而开散列最重要的是控制负载因子,因为当负载因子过大就无法使哈希表的速度达到O(1)。JAVA中的哈希表就是采用的开散列的方式,在JDK中负载因子为0.75。

开散列代码实现:
散列函数和上面的例子相同

class MyHash{
   
    //哈希表中存储元素的节点
    static class node{
   
        public int data;
        public node next;
        public node(int data) {
   
            this.data = data;
        }
    }
    //哈希表,默认大小为10
    node[] arr = new node[10];
    //数组中的元素个数
    int size = 0;
    //最大负载因子,默认为0.75
    double maxLoadNum = 0.75;
}

插入元素

加入插入元素的方法,注:开散列最重要的是控制负载因子,因为当负载因子过大就无法使哈希表的速度达到O(1)所以插入元素之后必须进行负载因子的判断:

public void insert(int data) {
   
        //先利用散列函数计算出插入位置
        int index = data % this.arr.length;
        //创建节点
        node tmp = new node(data);

        if (this.arr[index] == null) {
   
            this.arr[index] = tmp;
        }else {
   
            //头插法
            tmp.next = this.arr[index];
            this.arr[index] = tmp;
        }

        this.size++;
        //计算负载因子是否过大,如果过大就必须进行扩容,然后将所有元素重新哈希
        if (((double)this.size / this.arr.length) >= this.maxLoadNum) {
   
            this.size = 0;
            node[] arr1 = new node[this.arr.length * 2];
            for (int i = 0; i < this.arr.length; i++) {
   
                while (this.arr[i] != null) {
   
                    int index1 = this.arr[i].data % arr1.length;
                    node tmp1 = this.arr[i];
                    //在原表中删除该节点
                    this.arr[i] = this.arr[i].next;
                    tmp1.next = null;
                    //将节点插入新表中
                    if (arr1[index1] == null) {
   
                        arr1[index1] = tmp1;
                    }else {
   
                        //头插法
                        tmp1.next = arr1[index1];
                        arr1[index1] = tmp1;
                    }
                    this.size++;
                }
            }
            //用新表替换原表
            this.arr = arr1;
        }
    }

利用该组样例进行简单测试之后插入和扩容均无误。
image.png
image.png
image.png

删除元素

public void remove (int data) {
   
        //先利用散列函数计算出插入位置
        int index = data % this.arr.length;
        node p = this.arr[index];
        if (p == null) {
   
            return;
        }

        if (p.data == data) {
   
            this.arr[index] = p.next;
        }else {
   
            while (p.next != null){
   
                if (p.next.data == data) {
   
                    p.next = p.next.next;
                    break;
                }
                p = p.next;
            }
        }
    }

查找元素

//找到该元素返回该元素的值,没找到返回-1
    public int check(int data) {
   
        //先利用散列函数计算出插入位置
        int index = data % this.arr.length;
        node p = this.arr[index];
        if (p == null) {
   
            return -1;
        }

        while (p != null){
   
            if (p.data == data) {
   
                return p.data;
            }
            p = p.next;
        }
        return -1;
    }

相关实践学习
【文生图】一键部署Stable Diffusion基于函数计算
本实验教你如何在函数计算FC上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。函数计算提供一定的免费额度供用户使用。本实验答疑钉钉群:29290019867
建立 Serverless 思维
本课程包括: Serverless 应用引擎的概念, 为开发者带来的实际价值, 以及让您了解常见的 Serverless 架构模式
目录
相关文章
|
5月前
|
存储 Java
数据结构中的哈希表(java实现)利用哈希表实现学生信息的存储
这篇文章通过Java代码示例展示了如何实现哈希表,包括定义结点类、链表类、数组存储多条链表,并使用简单的散列函数处理冲突,以及如何利用哈希表存储和查询学生信息。
数据结构中的哈希表(java实现)利用哈希表实现学生信息的存储
|
7月前
|
存储 Java 索引
JAVA中的哈希表实现与应用
JAVA中的哈希表实现与应用
113 1
|
8月前
|
Java
java如何实现一个高效的二叉搜索树(BST)?请给出时间复杂度分析。
这段内容介绍了Java中使用AVL树实现高效二叉搜索树的方法。AVL树是一种自平衡树,节点子树高度差不超过1,确保操作时间复杂度为O(log n)。代码包括了`Node`类和`AVLTree`类,实现了节点、插入、删除、查找和平衡旋转等方法。通过旋转操作,维持树的平衡,保证了搜索效率。
47 6
|
8月前
|
存储 Java Serverless
Java哈希表
Java哈希表
36 0
|
8月前
|
存储 安全 Java
【亮剑】`ConcurrentHashMap`是Java中线程安全的哈希表,采用锁定分离技术提高并发性能
【4月更文挑战第30天】`ConcurrentHashMap`是Java中线程安全的哈希表,采用锁定分离技术提高并发性能。数据被分割成多个Segment,每个拥有独立锁,允许多线程并发访问不同Segment。当写操作发生时,计算键的哈希值定位Segment并获取其锁;读操作通常无需锁定。内部会根据负载动态调整Segment,减少锁竞争。虽然使用不公平锁,但Java 8及以上版本提供了公平锁选项。理解其工作原理对开发高性能并发应用至关重要。
63 0
|
8月前
|
存储 缓存 安全
Java HashMap:哈希表原理、性能与优化
Java HashMap:哈希表原理、性能与优化
352 1
|
8月前
|
存储 算法 安全
【Java编程进阶之路 02】深入探索:红黑树如何重塑哈希表的性能边界
JDK 1.8之后,HashMap引入红黑树来优化性能,当链表长度超过阈值(默认为8)时,链表会转换为红黑树,从而提高高冲突时的查询效率。同时,HashMap也采用了扰动函数来增加哈希值的随机性,使键值对更均匀分布,提升性能。
89 0
|
8月前
|
存储 缓存 安全
Java ConcurrentHashMap:线程安全的哈希表实现
Java ConcurrentHashMap:线程安全的哈希表实现
178 0
|
8月前
|
存储 缓存 Java
Java LinkedHashMap:保持插入顺序的哈希表解析
Java LinkedHashMap:保持插入顺序的哈希表解析
163 0
|
8月前
|
存储 Java Serverless
哈希表原理与Java HashSet、LinkedHashSet实现
哈希表原理与Java HashSet、LinkedHashSet实现
114 0