<<Java>> Hash(哈希表) 你会使用吗?知道底层原理吗?:三分钟一篇学会

简介: <<Java>> Hash(哈希表) 你会使用吗?知道底层原理吗?:三分钟一篇学会

什么是Hash(哈希表)?

① 先确定一个哈希函数:

hash (key) = key % capacity (通常会使用这种求余法,capacity是容量)


② 例子:

假如有一组数据集合:1,7,6,4,5,9 假设hash表容量为10

我们需要存入到哈希表中怎么存储?

0c57b983953e41d492814eba6f88efc3.png


我们将每个元素求到的hash数据存放到 hash表中得到


image.png


③ so?得出的结论


当我们查找元素的时候,只需要根据公式找到hashset的位置就可以直接找到元素的位置


,不必进行多次关键码的比较,搜索的速度比较快。


一般在查找一个元素时,要经过关键码的多次比较。


顺序查找的时间复杂度为 O(N)。平衡树查找的时间复杂度为树的高度,即O(logN)。


理想的搜索方法 : 不经过任何的比较,一次直接从表中得到搜索的元素。 很显然,顺序查找、平衡树查找都不是理性的,而哈希表是-------通过哈希函数是元素的存储位置与关键码之间能够建立起一一映射的关系,那么在查找的时通过该函数就可以直接找到该元素


哈希表插入/删除/查找的时间复杂度都是O(1)

冲突

① 概念(什么是冲突?)

不同的关键字通过 相同的哈希函数 计算出 相同的哈希地址,该现象称之为 哈希冲突 或 哈希碰撞。我们把 不同的关键码 而具有 相同哈希地址 的数据元素称为“ 同义词 ”。


② 冲突出现

  • 出现冲突的一个重要原因:哈希函数设计不够合理。
  • 常见哈希函数:(有很多很多,只列举俩)

        1.直接定制法  

(线性函数) Hash(key)= A*key + B

            使用 场 景 :需要事先知道关键字的分布情况,适合查找比较小且连续的情况

        2.除留余数法

   (上面的例子就是) Hash(key)= key%p (p接近地址数,但不大于地址数)


③ 冲突解决

  • 两种解决方法:闭散列开散列

闭散列(开放地址法)

  • 思想:如果哈希表没有被装满,则为把key存放到冲突位置中的下一个。


探测方法:

               1. 线性探测


                       直接插入到后面没有发生冲突的位置


                       缺陷:容易让产生冲突的元素堆积到一起


               2. 二次探测


                              第一次发生冲突,重新通过哈希函数计算H(i) = (H0+i*i)% m(m是地址数)


                               一直计算,直至计算得到的哈希地址不存在冲突。


开散列(哈希桶)

思想: 使用数组+链表+红黑树的方式,数组里面存放链表的头节点

图示:


image.png


开散列代码实现//重点


// key-value 模型
public class HashBucket {
    private static class Node {
        private int key;
        private int value;
        Node next;
        public Node(int key, int value) {
            this.key = key;
            this.value = value;
        }
    }
    private Node[] array;
    private int size; // 当前的数据个数
    private static final double LOAD_FACTOR = 0.75;
    public int put(int key, int value) {
        int index = key % array.length;
// 在链表中查找 key 所在的结点
// 如果找到了,更新
// 所有结点都不是 key,插入一个新的结点
        for (Node cur = array[index]; cur != null; cur = cur.next) {
            if (key == cur.key) {
                int oldValue = cur.value;
                cur.value = value;
                return oldValue;
            }
        }
        Node node = new Node(key, value);
        node.next = array[index];
        array[index] = node;
        size++;
        if (loadFactor() >= LOAD_FACTOR) {    resize();    }
        return -1;
    }
    private void resize() {
        Node[] newArray = new Node[array.length * 2];
        for (int i = 0; i < array.length; i++) {
            Node next;
            for (Node cur = array[i]; cur != null; cur = next) {
                next = cur.next;
                int index = cur.key % newArray.length;
                cur.next = newArray[index];
                newArray[index] = cur;
            }
        }
        array = newArray;
    }
    private double loadFactor() {  return size * 1.0 / array.length;   }
    public HashBucket() {
        array = new Node[8];
        size = 0;
    }
    public int get(int key) {
        int index = key % array.length;
        Node head = array[index];
        for (Node cur = head; cur != null; cur = cur.next) {
            if (key == cur.key) {      return cur.value;    }
        }
        return -1;
    }
}


相关文章
|
16天前
|
存储 Java 关系型数据库
高效连接之道:Java连接池原理与最佳实践
在Java开发中,数据库连接是应用与数据交互的关键环节。频繁创建和关闭连接会消耗大量资源,导致性能瓶颈。为此,Java连接池技术通过复用连接,实现高效、稳定的数据库连接管理。本文通过案例分析,深入探讨Java连接池的原理与最佳实践,包括连接池的基本操作、配置和使用方法,以及在电商应用中的具体应用示例。
33 5
|
26天前
|
存储 算法 Java
Java HashSet:底层工作原理与实现机制
本文介绍了Java中HashSet的工作原理,包括其基于HashMap实现的底层机制。通过示例代码展示了HashSet如何添加元素,并解析了add方法的具体过程,包括计算hash值、处理碰撞及扩容机制。
|
6天前
|
存储 算法 Java
大厂面试高频:什么是自旋锁?Java 实现自旋锁的原理?
本文详解自旋锁的概念、优缺点、使用场景及Java实现。关注【mikechen的互联网架构】,10年+BAT架构经验倾囊相授。
大厂面试高频:什么是自旋锁?Java 实现自旋锁的原理?
|
6天前
|
Java
Java之CountDownLatch原理浅析
本文介绍了Java并发工具类`CountDownLatch`的使用方法、原理及其与`Thread.join()`的区别。`CountDownLatch`通过构造函数接收一个整数参数作为计数器,调用`countDown`方法减少计数,`await`方法会阻塞当前线程,直到计数为零。文章还详细解析了其内部机制,包括初始化、`countDown`和`await`方法的工作原理,并给出了一个游戏加载场景的示例代码。
Java之CountDownLatch原理浅析
|
8天前
|
Java 索引 容器
Java ArrayList扩容的原理
Java 的 `ArrayList` 是基于数组实现的动态集合。初始时,`ArrayList` 底层创建一个空数组 `elementData`,并设置 `size` 为 0。当首次添加元素时,会调用 `grow` 方法将数组扩容至默认容量 10。之后每次添加元素时,如果当前数组已满,则会再次调用 `grow` 方法进行扩容。扩容规则为:首次扩容至 10,后续扩容至原数组长度的 1.5 倍或根据实际需求扩容。例如,当需要一次性添加 100 个元素时,会直接扩容至 110 而不是 15。
Java ArrayList扩容的原理
|
14天前
|
存储 Java 关系型数据库
在Java开发中,数据库连接是应用与数据交互的关键环节。本文通过案例分析,深入探讨Java连接池的原理与最佳实践
在Java开发中,数据库连接是应用与数据交互的关键环节。本文通过案例分析,深入探讨Java连接池的原理与最佳实践,包括连接创建、分配、复用和释放等操作,并通过电商应用实例展示了如何选择合适的连接池库(如HikariCP)和配置参数,实现高效、稳定的数据库连接管理。
31 2
|
17天前
|
Java 数据格式 索引
使用 Java 字节码工具检查类文件完整性的原理是什么
Java字节码工具通过解析和分析类文件的字节码,检查其结构和内容是否符合Java虚拟机规范,确保类文件的完整性和合法性,防止恶意代码或损坏的类文件影响程序运行。
|
14天前
|
算法 Java 数据库连接
Java连接池技术,从基础概念出发,解析了连接池的工作原理及其重要性
本文详细介绍了Java连接池技术,从基础概念出发,解析了连接池的工作原理及其重要性。连接池通过复用数据库连接,显著提升了应用的性能和稳定性。文章还展示了使用HikariCP连接池的示例代码,帮助读者更好地理解和应用这一技术。
29 1
|
20天前
|
存储 安全 Java
深入理解Java中的FutureTask:用法和原理
【10月更文挑战第28天】`FutureTask` 是 Java 中 `java.util.concurrent` 包下的一个类,实现了 `RunnableFuture` 接口,支持异步计算和结果获取。它可以作为 `Runnable` 被线程执行,同时通过 `Future` 接口获取计算结果。`FutureTask` 可以基于 `Callable` 或 `Runnable` 创建,常用于多线程环境中执行耗时任务,避免阻塞主线程。任务结果可通过 `get` 方法获取,支持阻塞和非阻塞方式。内部使用 AQS 实现同步机制,确保线程安全。
|
25天前
|
开发框架 Java 程序员
揭开Java反射的神秘面纱:从原理到实战应用!
本文介绍了Java反射的基本概念、原理及应用场景。反射允许程序在运行时动态获取类的信息并操作其属性和方法,广泛应用于开发框架、动态代理和自定义注解等领域。通过反射,可以实现更灵活的代码设计,但也需注意其性能开销。
44 1