索引结构与检索原理|学习笔记

简介: 快速学习索引结构与检索原理

开发者学堂课程【MySQL 高级应用 - 索引和锁索引结构与检索原理】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/598/detail/8594


索引结构与检索原理


目录

一、mysql 索引结构

1.BTree 索引

2.Hash 索引

3.full-text 全文索引

4.R-Tree 索引


一、mysql 索引结构

1.BTree 索引

[检索原理]

左边列的表格(真实数据),右边对应一棵树,树的管度越来越管查询越快。

以下图表的名称为:段区块

硬盘都是长方形的,打了一个封装,里面是一个圆圈,由磁盘、磁道、B 柱构成。一些数据写在磁道上,根据不同索引内容去磁道读取不同的内容,那么也需要一个存储单位,这个存储单位叫类

image.png

【初始化介绍】

1)一颗 b+树,浅蓝色的块我们称之为一个磁盘块,可以看到每个磁盘块包含几个数据项(深蓝色所示)和指针((黄色所示);

2)如磁盘块1包含数据项1735,包含指针 P1P2P3P1表示小于17的磁盘块,P2表示在1735之间的磁盘块,P3表示大于35的磁盘块。

3)真实的数据存在于叶子节点即3591013152829366075799099

4)非叶子节点只不存储真实的数据,只存储指引搜索方向的数据项,如1735并不真实存在于数据表中。

【查找过程】

1)如果要查找数据项29,那么首先会把磁盘块1由磁盘加载到内存,此时发生一次 IO,在内存中用二分查找确定291735之间,锁定磁盘块1P2指针,内存时间因为非常短(相比磁盘的 IO )可以忽略不计,通过磁盘块1P2指针的磁盘地址把磁盘块3由磁盘加载到内存,发生第二次 IO292630之间,锁定磁盘块3P2指针,通过指针加载磁盘块8到内存,发生第三次 IO,同时内存中做二分查找拨到29,结束查询,总计三次 IO

2)真实的情况是,3层的 b+树可以表示上百万的数据,如果上百万的数据查找只需要三次 IO,性能提高将是巨大的,如果没有索引,每个数据项都要发生一次 IO,那么总共需要百万次的 IO,显然成本非常非常高。

2.Hash 索引

3.full-text 全文索引

4.R-Tree 索引

相关文章
|
6月前
|
存储 算法 关系型数据库
InnoDb行格式、数据页结构、索引底层原理和如何建立索引
InnoDb行格式、数据页结构、索引底层原理和如何建立索引
117 0
|
存储 自然语言处理 算法
ES高频面试问题:一张图带你读懂 Elasticsearch 中“正排索引(正向索引)”和“倒排索引(反向索引)”区别
ES高频面试问题:一张图带你读懂 Elasticsearch 中“正排索引(正向索引)”和“倒排索引(反向索引)”区别
ES高频面试问题:一张图带你读懂 Elasticsearch 中“正排索引(正向索引)”和“倒排索引(反向索引)”区别
|
6月前
|
JSON 自然语言处理 数据格式
5.索引原理
5.索引原理
|
4月前
|
存储 SQL 关系型数据库
(四)MySQL之索引初识篇:索引机制、索引分类、索引使用与管理综述
本篇中就对MySQL的索引机制有了全面认知,从索引的由来,到索引概述、索引管理、索引分类、唯一/全文/联合/空间索引的创建与使用等内容,进行了全面概述。
183 0
|
5月前
|
存储 自然语言处理 NoSQL
深入解析Elasticsearch的内部数据结构和机制:行存储、列存储与倒排索引之倒排索引(三)
深入解析Elasticsearch的内部数据结构和机制:行存储、列存储与倒排索引之倒排索引(三)
|
6月前
|
存储 数据库 索引
faiss 三种基础索引方式
faiss 三种基础索引方式
319 1
|
存储 程序员 C语言
c++ 如何做出实现一组数据的实际索引
c++ 如何做出实现一组数据的实际索引
|
存储 程序员 C语言
c++ 如何做出实现一组数据的实际索引
C++是一种计算机高级程序设计语言, 由​​C语言​​​扩展升级而产生 , 最早于1979年由​​本贾尼·斯特劳斯特卢普​​在AT&T贝尔工
|
SQL 存储 缓存
索引不是越多越好,理解索引结构原理,才有助于我们建立合适的索引!
MySQL支持诸多存储引擎,而各种存储引擎对索引的支持也各不相同,因此MySQL数据库支持多种索引类型,如BTree索引,哈希索引,全文索引等等。为了避免混乱,本文将只关注于BTree索引,因为这是平常使用MySQL时主要打交道的索引。
653 0
|
SQL 存储 关系型数据库
PostgreSQL的元组、页面结构及索引查找原理
我们知道postgresql数据库通过数据多版本实现mvcc,pg又没有undo段,老版本的数据元组直接存放在数据页面中,这样带来的问题就是旧元组需要不断地进行清理以释放空间,这也是数据库膨胀的根本原因。本文简单介绍一下postgresql数据库的元组、页面的结构以及索引查找流程。
1203 0
PostgreSQL的元组、页面结构及索引查找原理
下一篇
无影云桌面