【后端面经】【数据库与MySQL】为什么MySQL用B+树而不用B树?-01

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS PostgreSQL,高可用系列 2核4GB
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: 【4月更文挑战第10天】B+树是一种多叉树,用于数据库索引,其特征包括叶子节点存储数据并用链表串联,非叶子节点仅存关键字。由于较低的高度和链表结构,B+树提供高效查询和范围查询。索引分类有聚簇(叶子节点存储数据)和非聚簇,以及覆盖、唯一、前缀、联合、全文和哈希索引。聚簇索引如主键索引,非聚簇索引叶子节点存储主键。覆盖索引可避免回表,提高性能。查询遵循最左匹配原则,优化SQL应选取所需列并考虑常见查询。

B+树

B+树是一个多叉树,一个k阶的B+树的定义是:

  1. 每个节点最多有k个子节点
  2. 除根节点以后,每个节点至少有[m/2]个子节点,根节点至少有2个子节点
  3. 有m个子节点的节点肯定有m个索引关键字

B+树还有两个特性:

  • 叶子节点存放了数据,非叶子节点只存放关键字
  • 叶子节点通过链表串联

B+树用于数据库索引的优势如下:

  1. B+树的高度比二叉树更低,树的高度代表查询时的耗时,因此B+树的查询效率更高
  2. B+树的叶子节点通过链表串联起来,适合范围查询
  3. B+树的非叶子节点里没有存放数据,只放了关键字,适合放入内存里

在使用索引提高查询性能的时候,索引全部都会装到内存里,真实的数据会放到磁盘里。不然如果索引也在磁盘上的话,使用索引就没什么用了。

索引分类

MySQL里索引在不同的角度有不同的分类

  • 根据叶子节点是否存储数据,可以分为聚簇索引和非聚簇索引
  • 覆盖索引:某个索引包括某个查询的所有列
  • 唯一索引:索引的值必须是唯一的,不能重复
  • 前缀索引:索引的某列只包含该列值的前一部分。比如在类型是varchar(128)的列上,选择前64个字符作为索引
  • 联合索引:由多个列组成
  • 全文索引:支持文本模糊查询
  • 哈希索引:使用哈希算法的索引

聚簇索引和非聚簇索引

上述已经提到了如果一个索引的叶子节点存储数据的话,就是聚簇索引,否则就是非聚簇索引。

主键索引就是一种聚簇索引,它的叶子节点里放着表的所有行;而其他的索引就是非聚簇索引,他们的叶子节点里放的是主键

在查询一张表的时候,如果用到了非主键索引,数据库会先在该索引对应的B+树里查到数据对应的主键,再根据主键去主键索引(聚簇索引)对应的B+树里查找数据,最终找出数据。这也就是所谓的回表

? 在回表操作的时候,会需要从磁盘里读取数据行,磁盘IO比较慢,所以回表的性能较差。

覆盖索引

如果查询的列全部都在某个索引里,数据库可以直接把索引存储的这些列的值返回,不用回表。覆盖索引的概念是某个索引相对于某个查询而言的。

比如有一个学生表student,在idname创建联合索引<id,name>,对于查询select id,name from student where id = 1,要查询的数据都在索引<id,name>里,就可以直接用索引的数据。

针对这个特性,可以得到优化SQL性能的两个方案,本质都是为了避免回表:

  1. 只查询需要的列
  2. 针对最频繁的查询来设计索引

最左匹配原则

索引在查询里是按照最左匹配原则来使用的,最左匹配原则指的是在联合索引的时候,查询条件的多个列与索引的多个列进行比较的时候,索引只会匹配到最左边的列的值。

比如创建一个在A,B,C三个列上的联合索引<A,B,C>,索引列的值的关系如下:

image-20240413200646447.png

A是绝对有序的;A确定的时候,B是有序的;A和B都确定的时候,C是有序的。

执行一个where A=a1 and B=b1 and C=c1的查询类似

for a in A {
   
   
  if a == a1 {
   
   
    for b in B {
   
   
      if b == b1 {
   
   
        for c in C {
   
   
          if c == c1 {
   
   
            // 这就是你要的数据,拿到主键之后去磁盘里面加载出来
          }
        }
      }
    }
  }
}
  • 如果查询条件是where A=a1 and B=b1,数据库只会用外面的两层循环
for a in A {
   
   
  if a == a1 {
   
   
    for b in B {
   
   
      if b == b1 {
   
   
            // 这就是你要的数据,拿到主键之后去磁盘里面加载出来
      }
    }
  }
}
相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
MySQL数据库入门学习
本课程通过最流行的开源数据库MySQL带你了解数据库的世界。 &nbsp; 相关的阿里云产品:云数据库RDS MySQL 版 阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务,提供容灾、备份、恢复、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼。 了解产品详情:&nbsp;https://www.aliyun.com/product/rds/mysql&nbsp;
目录
相关文章
|
10月前
|
SQL 关系型数据库 MySQL
网安入门之MySQL后端基础
《网安入门之MySQL后端基础》简介: 本文介绍了数据库及MySQL的基础知识,涵盖数据库的概念、结构与操作。数据库是组织化存储数据的集合,通过表、列、行等结构实现高效管理。MySQL作为开源的关系型数据库管理系统,广泛应用于Web开发。文中详细讲解了MySQL的基本操作,如增(INSERT)、删(DELETE)、改(UPDATE)、查(SELECT)等语句的使用方法,并介绍了数据库事务的ACID特性。此外,还探讨了SQL注入攻击的风险及防范措施,强调了预处理语句的重要性。最后,简述了PHP中mysqli扩展的使用方法,包括连接数据库、执行查询和关闭连接等步骤。
|
6月前
|
Java 关系型数据库 MySQL
在Linux平台上进行JDK、Tomcat、MySQL的安装并部署后端项目
现在,你可以通过访问http://Your_IP:Tomcat_Port/Your_Project访问你的项目了。如果一切顺利,你将看到那绚烂的胜利之光照耀在你的项目之上!
389 41
|
6月前
|
开发框架 Java 关系型数据库
在Linux系统中安装JDK、Tomcat、MySQL以及部署J2EE后端接口
校验时,浏览器输入:http://[your_server_IP]:8080/myapp。如果你看到你的应用的欢迎页面,恭喜你,一切都已就绪。
510 17
|
6月前
|
Java 关系型数据库 MySQL
在Linux操作系统上设置JDK、Tomcat、MySQL以及J2EE后端接口的部署步骤
让我们总结一下,给你的Linux操作系统装备上最强的军队,需要先后装备好JDK的弓箭,布置好Tomcat的阵地,再把MySQL的物资原料准备好,最后部署好J2EE攻城车,那就准备好进军吧,你的Linux军团,无人可挡!
159 18
|
6月前
|
关系型数据库 MySQL Java
安装和配置JDK、Tomcat、MySQL环境,以及如何在Linux下更改后端端口。
遵循这些步骤,你可以顺利完成JDK、Tomcat、MySQL环境的安装和配置,并在Linux下更改后端端口。祝你顺利!
460 11
|
6月前
|
开发框架 关系型数据库 Java
Linux操作系统中JDK、Tomcat、MySQL的完整安装流程以及J2EE后端接口的部署
然后Tomcat会自动将其解压成一个名为ROOT的文件夹。重启Tomcat,让新“植物”适应新环境。访问http://localhost:8080/yourproject看到你的项目页面,说明“植物”种植成功。
218 10
|
8月前
|
存储 缓存 数据库
数据库索引采用B+树不采用B树的原因?
● B+树更便于遍历:由于B+树的数据都存储在叶子结点中,分支结点均为索引,方便扫库,只需要扫一遍叶子结点即可,但是B树因为其分支结点同样存储着数据,我们要找到具体的数据,需要进行一次中序遍历按序来扫,所以B+树更加适合在区间查询的情况,所以通常B+树用于数据库索引。 ● B+树的磁盘读写代价更低:B+树在内部节点上不包含数据信息,因此在内存页中能够存放更多的key。 数据存放的更加紧密,具有更好的空间局部性。因此访问叶子节点上关联的数据也具有更好的缓存命中率。 ● B+树的查询效率更加稳定:由于非终结点并不是最终指向文件内容的结点,而只是叶子结点中关键字的索引。所以任何关键字的查找必须走一条
|
10月前
|
前端开发 Java 数据库连接
Java后端开发-使用springboot进行Mybatis连接数据库步骤
本文介绍了使用Java和IDEA进行数据库操作的详细步骤,涵盖从数据库准备到测试类编写及运行的全过程。主要内容包括: 1. **数据库准备**:创建数据库和表。 2. **查询数据库**:验证数据库是否可用。 3. **IDEA代码配置**:构建实体类并配置数据库连接。 4. **测试类编写**:编写并运行测试类以确保一切正常。
467 2
|
2月前
|
缓存 关系型数据库 BI
使用MYSQL Report分析数据库性能(下)
使用MYSQL Report分析数据库性能
133 3
|
2月前
|
关系型数据库 MySQL 数据库
自建数据库如何迁移至RDS MySQL实例
数据库迁移是一项复杂且耗时的工程,需考虑数据安全、完整性及业务中断影响。使用阿里云数据传输服务DTS,可快速、平滑完成迁移任务,将应用停机时间降至分钟级。您还可通过全量备份自建数据库并恢复至RDS MySQL实例,实现间接迁移上云。

推荐镜像

更多