设计实现一个LRU Cache

简介: 1 什么是LRU Cache在LeetCode上有一个LRU Cache实现的题目Design and implement a data structure for Least Recently Used (LRU) cache.

1 什么是LRU Cache

在LeetCode上有一个LRU Cache实现的题目

Design and implement a data structure for Least Recently Used (LRU) cache. It should support the following operations: get and set.
get(key) - Get the value (will always be positive) of the key if the key exists in the cache, otherwise return -1.
set(key, value) - Set or insert the value if the key is not already present. When the cache reached its capacity, it should invalidate the least recently used item before inserting a new item.

  • 解题思路:题目让设计一个LRU Cache,即根据LRU算法设计一个缓存。在这之前需要弄清楚LRU算法的核心思想,LRU全称是Least

Recently Used,即最近最久未使用。
在操作系统的内存管理中,有一类很重要的算法就是内存页面置换算法(包括FIFO,LRU,LFU等几种常见页面置换算法)。
事实上,Cache算法和内存页面置换算法的核心思想是一样的:都是在给定一个限定大小的空间的前提下,设计一个原则如何来更新和访问其中的元素。

  • LRU算法的设计原则
    如果一个数据在最近一段时间没有被访问到,那么在将来它被访问的可能性也很小
    也就是说,当限定的空间已存满数据时,应当把最久没有被访问到的数据淘汰

  • 而用什么数据结构来实现LRU算法呢?
    可能大多数人都会想到:用一个数组来存储数据,给每一个数据项标记一个访问时间戳,每次插入新数据项的时候,先把数组中存在的数据项的时间戳自增,并将新数据项的时间戳置为0并插入到数组中。每次访问数组中的数据项的时候,将被访问的数据项的时间戳置为0。当数组空间已满时,将时间戳最大的数据项淘汰。
    这种实现思路很简单,但是有什么缺陷呢?需要不停地维护数据项的访问时间戳,另外,在插入数据、删除数据以及访问数据时,时间复杂度都是O(n),数组的缺陷凸显无疑

  • 那么有没有更好的实现办法呢?
    那就是利用链表和HashMap。当需要插入新数据项,在链表中

    • 命中,则把该节点移到链表头部
    • 不存在,则新建一个节点,放在链表头部,若缓存满,则把链表最后一个节点删除即可。

在访问数据时,若数据项在链表中存在,则把该节点移到链表头部,否则返回-1
这样一来在链表尾部的节点就是最近最久未访问的数据项。

1)set(key,value)

  • 若key在hashmap中存在,则先重置value,然后获取对应节点cur,将其从链表删除,并移到链表头
  • 不存在,则新建一个节点,并将节点放到链表的头部。

当Cache满,删除链表最后一个节点

2)get(key)

  • 若key在hashmap中存在,把对应的节点放到链表头,并返回对应value
  • 若不存在,则返回-1

即保证基本的get/set同时,还要保证最近访问(get或put)的节点保持在限定容量的Cache中,如果超过容量则应该把LRU(近期最少使用)的节点删除掉。

当我们在get/set一个节点时都会把操作的这个节点移动到tail节点处,代表最新操作的节点,head节点永远指向最老的节点,当超过设定的容量时,我们就删除head节点指向的最老节点

就像是个LinkedHashMap,这样做的好处是,get/set在不冲突情况下可保证O(1)复杂度
也可通过双向链表保证LRU的删除/更新O(1)复杂度

当然可简化head和tail变成一个head节点,成环,这样head的next指向最旧的节点,prev指向最新的节点。

2 实现思路

在学习了HashMap和LinkedHashMap后,是不是觉得这俩数据结构简直太适合做LRU Cache了!那么动手实现一下:

基于HashMap和双向链表的实现

/**
 LRU Cache
 题目描述:
 Design and implement a data structure for Least Recently Used (LRU) cache. It should support the following operations: get and put.
  
 get(key) - Get the value (will always be positive) of the key if the key exists in the cache, otherwise return -1.
 put(key, value) - Set or insert the value if the key is not already present. When the cache reached its capacity, it should invalidate the least recently used item before inserting a new item.
 Follow up:
 Could you do both operations in O(1) time complexity?
  
 思路:
 双向链表和hashmap。
 1.当需要插入新的数据项的时候,如果新数据项在链表中存在(一般称为命中),则把该节点移到链表头部,
 如果不存在,则新建一个节点,放到链表头部
 若缓存满了,则把链表最后一个节点删除即可。
 2.在访问数据的时候,如果数据项在链表中存在,则把该节点移到链表头部,否则返回-1。
 这样一来在链表尾部的节点就是最近最久未访问的数据项。
  
 */
public class LRUCache<K , V> {

    class Node<K,V> {
        Node pre;
        Node next;
        private final K key;
        V val;

        Node(K k, V v) {
            key = k;
            val = v;
        }
    }

    Map<K, Node> map = new HashMap<K, Node>();

    // The head (eldest) of the doubly linked list.
    Node head;
    // The tail (youngest) of the doubly linked list.
    Node tail;

    int cap;

    public LRUCache(int capacity) {
        cap = capacity;
        head = new Node(null, null);
        tail = new Node(null, null);
        head.next = tail;
        tail.pre = head;
    }

    public V get(K key) {
        Node n = map.get(key);
        if(n!=null) {
            removeNode(n);
            appendTail(n);
            return (V) n.val;
        }
        return null;
    }

    public void set(K key, V value) {
        Node n = map.get(key);
        // existed
        if(n!=null) {
            n.val = value;
            map.put(key, n);
            removeNode(n);
            appendTail(n);
            return;
        }

        if(map.size() == cap) {
           removeLast();
        }
        n = new Node(key, value);
        // youngest node append tail
        appendTail(n);
        map.put(key, n);
    }

    //移除最近最少使用的节点,注意此节点就是head.next指向的节点
    public void removeLast() {
        Node tmp = head.next;
        removeNode(tmp);
        map.remove(tmp.key);
    }

    //移除某个节点,并将此节点的前后节点连接起来
    private void removeNode(Node n){
        n.pre.next = n.next;
        n.next.pre = n.pre;
    }

    //将节点加入到队列的尾部,尾部代表最近使用的节点
    private void appendTail(Node n) {
        n.next = tail;
        n.pre = tail.pre;
        tail.pre.next = n;
        tail.pre = n;
    }
}

基于LinkedHashMap的实现

public class LRUCache<K , V> {

    private int capacity;
    private Map<K, V> cache;

    public LRUCache(final int capacity) {
        this.capacity = capacity;
        this.cache = new java.util.LinkedHashMap<K, V> (capacity, 0.75f, true) {
            // 定义put后的移除规则,大于容量就删除eldest
            protected boolean removeEldestEntry(Map.Entry<K, V> eldest) {
                return size() > capacity;
            }
        };
    }

    public V get(K key) {
        if (cache.containsKey(key)) {
            return cache.get(key);
        } else
            return null;
    }

    public void set(K key, V value) {
        cache.put(key, value);
    }
}
目录
相关文章
|
缓存 数据格式
实现LRU缓存的三种方式(建议收藏)
LRU全称为Least Recently Used,即最近使用的。针对的是在有限的内存空间内,只缓存最近使用的数据(即get和set的数据),超过有限内存空间的数据将会被删除。这个在面试题中也是常会被问到的内容,接下来就看看怎么来实现。
2329 0
实现LRU缓存的三种方式(建议收藏)
|
Java 编译器 C语言
Python速成篇(基础语法)上
Python速成篇(基础语法)上
|
存储 缓存 算法
缓存淘汰策略:LRU 的设计与实现
缓存淘汰策略:LRU 的设计与实现
607 0
|
关系型数据库 MySQL Java
DDD面试题:DDD聚合和表的对应关系是什么 ?(来自蚂蚁面试)
尼恩,一位40岁的资深架构师,分享了其读者群中关于DDD(领域驱动设计)的面试题及解答,涵盖DDD架构落地、微服务拆分、聚合与MySQL表的对应关系等内容。尼恩通过系统化的梳理,帮助读者在面试中展现强大的技术实力,让面试官印象深刻。此外,他还提供了《尼恩Java面试宝典》等多本技术圣经PDF,助力读者提升架构、设计和开发水平。关注【技术自由圈】公众号,获取更多资源。
DDD面试题:DDD聚合和表的对应关系是什么 ?(来自蚂蚁面试)
|
运维 容灾 数据中心
云上应用管理问题之什么是Region和AZ,它们有什么区别
云上应用管理问题之什么是Region和AZ,它们有什么区别
|
缓存 Android开发 开发者
Android RecycleView 深度解析与面试题梳理
本文详细介绍了Android开发中高效且功能强大的`RecyclerView`,包括其架构概览、工作流程及滑动优化机制,并解析了常见的面试题。通过理解`RecyclerView`的核心组件及其优化技巧,帮助开发者提升应用性能并应对技术面试。
646 8
|
数据采集 存储 JavaScript
Dynamic Website 爬虫:应对动态内容与 JavaScript 渲染挑战
本文深入探讨了如何设计针对动态网站的爬虫,以采集 WIPO Brand Database 中的专利和技术信息。文章详细介绍了动态网站的挑战,包括 JavaScript 渲染、反爬虫机制和异步加载,并提出了解决方案,如使用 Selenium 模拟浏览器、代理 IP 技术和 API 抓取。最后,通过具体代码示例展示了如何实现这些技术手段。
977 0
|
前端开发 JavaScript 算法
Github 最受欢迎的 35 个项目一览
Github 最受欢迎的 35 个项目一览
1042 0
|
安全 API 数据库
Python中的Tortoise ORM框架:高效、灵活的数据库交互新选择
【4月更文挑战第14天】在Python的数据库交互领域中,对象关系映射(ORM)框架扮演着举足轻重的角色。近年来,随着技术的不断发展和进步,众多ORM框架如雨后春笋般涌现,其中Tortoise ORM以其高效、灵活的特性受到了广大开发者的青睐。本文将深入探讨Tortoise ORM框架的核心特性、使用方法以及其在Python开发中的应用。
2814 4
|
人工智能 弹性计算 并行计算
带你读《弹性计算技术指导及场景应用》——1. 技术改变AI发展:CUDA Graph优化的底层原理分析
带你读《弹性计算技术指导及场景应用》——1. 技术改变AI发展:CUDA Graph优化的底层原理分析
730 2