【图解数据结构与算法】LRU缓存淘汰算法面试时到底该怎么写（下）

2021-12-30 356

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 链表实现的LRU缓存淘汰算法的时间复杂度是O(n)，当时我也提到了，通过散列表可以将这个时间复杂度降低到O(1)。 Redis的有序集合是使用跳表来实现的，跳表可以看作一种改进版的链表。Redis有序集合不仅使用了跳表，还用到了散列表。 LinkedHashMap也用到了散列表和链表两种数据结构。散列表和链表都是如何组合起来使用的，以及为什么散列表和链表会经常放到一块使用。

Java LinkedHashMap

HashMap就是通过hash表这种数据结构实现的。而LinkedHashMap并不仅仅是通过链表法解决散列冲突的。

HashMap<Integer, Integer> m = new LinkedHashMap<>();
m.put(3, 11);
m.put(1, 12);
m.put(5, 23);
m.put(2, 22);
for (Map.Entry e : m.entrySet()) {
  System.out.println(e.getKey());
}

上面的代码会按照数据插入的顺序依次来打印。而hash表数据经过hash函数扰乱后是无规律存储的，它是如何实现按照数据的插入顺序来遍历打印的呢？

就是通过hash表和链表组合实现，可支持：

按照插入顺序遍历数据
按访问顺序遍历数据

你可以看下面这段代码：

打印结果

每次调用 LinkedHashMap#put()添加数据时，都会将数据添加到链尾，前四个操作完成后，链表数据如下：

第二次将键值为3的数据放入到LinkedHashMap时，会先查找该K是否已有，然后，再将已经存在的(3,11)删除，并将新的(3,26)放到链尾。

这个时候链表中的数据就是下面这样：

访问K=5数据时，将被访问到的数据移动到链尾。此时，链表数据如下：

可见，按访问时间排序的LinkedHashMap本身就是个支持LRU缓存淘汰策略的缓存系统。

LinkedHashMap中的“Linked”实际上是指的是双向链表，并非指用链表法解决哈希冲突。

为什么hash表和链表经常一块使用？

hash表这种数据结构虽然支持非常高效的数据插入、删除、查找操作，但hash表中的数据都是通过hash函数打乱之后无规律存储的。也就说，它无法支持按照某种顺序快速地遍历数据。如果希望按照顺序遍历散列表中的数据，那我们需要将散列表中的数据拷贝到数组中，然后排序，再遍历。

因为散列表是动态数据结构，不停地有数据的插入、删除，所以每当我们希望按顺序遍历散列表中的数据的时候，都需要先排序，那效率势必会很低。为了解决这个问题，我们将散列表和链表（或者跳表）结合在一起使用。

手写LRU

public class LRUCache<K, V> extends LinkedHashMap<K, V> {
    private final int CACHE_SIZE;
    // 这里就是传递进来最多能缓存多少数据
    public LRUCache(int cacheSize) {
        //  true指linkedhashmap将元素按访问顺序排序
        super((int) Math.ceil(cacheSize / 0.75) + 1, 0.75f, true);
        CACHE_SIZE = cacheSize;
    }
    @Override
    protected boolean removeEldestEntry(Map.Entry eldest) {
        // 当KV数据量大于指定缓存个数时，就自动删除最老数据
        return size() > CACHE_SIZE;
    }
}

FAQ

本文的散列表和链表结合使用的例子用的都是双向链表。如果把双向链表改成单链表，还能否正常工作呢？

在删除一个元素时，虽然能 O(1) 的找到目标结点，但是要删除该结点需要拿到前一个结点的指针，遍历到前一个结点复杂度会变为 O(N），所以用双链表实现比较合适。（硬要操作的话，单链表也是可以实现 O(1) 时间复杂度删除结点的）。

假设有 10 万名猎头，每个猎头都可以通过做任务（比如发布职位）来积累积分，然后通过积分来下载简历。假设你是猎聘网的一名工程师，如何在内存中存储这 10 万个猎头 ID 和积分信息，让它能够支持这样几个操作：

根据猎头的 ID 快速查找、删除、更新这个猎头的积分信息

查找积分在某个区间的猎头 ID 列表

查找按照积分从小到大排名在第 x 位到第 y 位之间的猎头 ID 列表

以积分排序构建一个跳表，再以猎头 ID 构建一个散列表：

1）ID 在散列表中所以可以 O(1) 查找到这个猎头；

2）积分以跳表存储，跳表支持区间查询；

3）这点根据目前学习的知识暂时无法实现

【图解数据结构与算法】LRU缓存淘汰算法面试时到底该怎么写（下）

Java LinkedHashMap

为什么hash表和链表经常一块使用？

手写LRU

FAQ

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

【图解数据结构与算法】LRU缓存淘汰算法面试时到底该怎么写（下）

Java LinkedHashMap

为什么hash表和链表经常一块使用？

手写LRU

FAQ

热门文章

最新文章

相关课程

相关电子书