浅析数据库算法数据结构(一) LRU算法

简介: 内存规划使用对于数据库是至关重要的,因为内存的速度快于硬盘,但是内存的价格更贵,所以往往容量比硬盘小很多。那么好钢要用在刀刃上,所以一个好的内存管理算法对于数据库是非常重要的。LRU算法就是数据库常用的内存管理算法之一。

内存规划使用对于数据库是至关重要的,因为内存的速度快于硬盘,但是内存的价格更贵,所以往往容量比硬盘小很多。那么好钢要用在刀刃上,所以一个好的内存管理算法对于数据库是非常重要的。

LRU算法的全称是Least Recently Used,意思是最近最少使用的意思,是一种内存管理算法,最早应用与Linux操作系统。LRU算法基于一种假设:长期不被使用的数据,在未来被用到的几率也不大,所以,当数据所占内存达到一定阈值时,我们要移除掉最近最少被使用的数据。

这个算法,非常符合数据库内存管理的需要,数据库的缓存在内存中,任何缓存的大小都是有限制的,并且总不如被缓存的数据多。就比如数据库的数据文件的大小远远超过就数据库缓存的大小。

因此,缓存总有被占满的时候。当缓存中已经没有空闲内存块时,如果新的数据要求进入缓存,就只有从缓存中原来的数据中选出一个数据块淘汰掉,用新进入缓存的数据覆盖这个牺牲者。这个淘汰者的选择,是很重要的。缓存是为了数据可以重复利用,因此,通常应该挑选缓存中最没有可能被重复利用的块当作淘汰者。

所以算法从大体逻辑上来说,需要维护一个根据访问次序组成的链表,链表的一端是最近访问的数据,我们可以称其为热端,而另一端是最近最少访问的数据,我们可以称其为冷端,每一次访问时,数据库更新这个链表,将最新访问的数据排列在最前端。当新的数据块进来时,数据库将淘汰掉最尾端的数据,加入新的数据并且将其排在最前面
图片: https://uploader.shimo.im/f/IVLOWxPHnXhh2HaT.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJhdWQiOiJhY2Nlc3NfcmVzb3VyY2UiLCJleHAiOjE2NTY1Njk5MDQsImZpbGVHVUlEIjoiS3JrRVZFZUw1RUhlTTFBSiIsImlhdCI6MTY1NjU2OTYwNCwidXNlcklkIjoxMDEyMzI5Nn0.cCBns-vWRzoIodLtBM8ZF5ouKEZIME0xgdTuUUPGQSw

当然还有一些改进型的算法,比如Oracle会将链表分成两端,一个半是热的一半是冷的,当数据访问次数比较频繁的时候,数据会进入热的这一半,不会被淘汰,淘汰在冷的这一半发生,这样可以更好的保护热的数据
图片: https://uploader.shimo.im/f/OzXJBOf04rIblHQ1.png!thumbnail?accessToken=eyJhbGciOiJIUzI1NiIsImtpZCI6ImRlZmF1bHQiLCJ0eXAiOiJKV1QifQ.eyJhdWQiOiJhY2Nlc3NfcmVzb3VyY2UiLCJleHAiOjE2NTY1Njk5MDQsImZpbGVHVUlEIjoiS3JrRVZFZUw1RUhlTTFBSiIsImlhdCI6MTY1NjU2OTYwNCwidXNlcklkIjoxMDEyMzI5Nn0.cCBns-vWRzoIodLtBM8ZF5ouKEZIME0xgdTuUUPGQSw

以上就是数据库的LRU算法。

目录
相关文章
|
2月前
|
机器学习/深度学习 算法 数据挖掘
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构。本文介绍了K-means算法的基本原理,包括初始化、数据点分配与簇中心更新等步骤,以及如何在Python中实现该算法,最后讨论了其优缺点及应用场景。
164 4
|
3月前
|
存储 人工智能 算法
数据结构与算法细节篇之最短路径问题:Dijkstra和Floyd算法详细描述,java语言实现。
这篇文章详细介绍了Dijkstra和Floyd算法,这两种算法分别用于解决单源和多源最短路径问题,并且提供了Java语言的实现代码。
112 3
数据结构与算法细节篇之最短路径问题:Dijkstra和Floyd算法详细描述,java语言实现。
|
13天前
|
存储 算法 测试技术
【C++数据结构——树】二叉树的遍历算法(头歌教学实验平台习题) 【合集】
本任务旨在实现二叉树的遍历,包括先序、中序、后序和层次遍历。首先介绍了二叉树的基本概念与结构定义,并通过C++代码示例展示了如何定义二叉树节点及构建二叉树。接着详细讲解了四种遍历方法的递归实现逻辑,以及层次遍历中队列的应用。最后提供了测试用例和预期输出,确保代码正确性。通过这些内容,帮助读者理解并掌握二叉树遍历的核心思想与实现技巧。
37 2
|
29天前
|
存储 运维 监控
探索局域网电脑监控软件:Python算法与数据结构的巧妙结合
在数字化时代,局域网电脑监控软件成为企业管理和IT运维的重要工具,确保数据安全和网络稳定。本文探讨其背后的关键技术——Python中的算法与数据结构,如字典用于高效存储设备信息,以及数据收集、异常检测和聚合算法提升监控效率。通过Python代码示例,展示了如何实现基本监控功能,帮助读者理解其工作原理并激发技术兴趣。
57 20
|
2月前
|
数据采集 存储 算法
Python 中的数据结构和算法优化策略
Python中的数据结构和算法如何进行优化?
|
2月前
|
算法
数据结构之路由表查找算法(深度优先搜索和宽度优先搜索)
在网络通信中,路由表用于指导数据包的传输路径。本文介绍了两种常用的路由表查找算法——深度优先算法(DFS)和宽度优先算法(BFS)。DFS使用栈实现,适合路径问题;BFS使用队列,保证找到最短路径。两者均能有效查找路由信息,但适用场景不同,需根据具体需求选择。文中还提供了这两种算法的核心代码及测试结果,验证了算法的有效性。
132 23
|
2月前
|
并行计算 算法 测试技术
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面,旨在通过综合策略提升程序性能,满足实际需求。
83 1
|
2月前
|
算法 vr&ar 计算机视觉
数据结构之洪水填充算法(DFS)
洪水填充算法是一种基于深度优先搜索(DFS)的图像处理技术,主要用于区域填充和图像分割。通过递归或栈的方式探索图像中的连通区域并进行颜色替换。本文介绍了算法的基本原理、数据结构设计(如链表和栈)、核心代码实现及应用实例,展示了算法在图像编辑等领域的高效性和灵活性。同时,文中也讨论了算法的优缺点,如实现简单但可能存在堆栈溢出的风险等。
84 0
|
3月前
|
存储 算法 Java
Set接口及其主要实现类(如HashSet、TreeSet)如何通过特定数据结构和算法确保元素唯一性
Java Set因其“无重复”特性在集合框架中独树一帜。本文解析了Set接口及其主要实现类(如HashSet、TreeSet)如何通过特定数据结构和算法确保元素唯一性,并提供了最佳实践建议,包括选择合适的Set实现类和正确实现自定义对象的hashCode()与equals()方法。
61 4
|
3月前
|
机器学习/深度学习 搜索推荐 算法
探索数据结构:初入算法之经典排序算法
探索数据结构:初入算法之经典排序算法