【后端面经】【数据库与MySQL】为什么MySQL用B+树而不用B树?-01

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS PostgreSQL,集群系列 2核4GB
简介: 【4月更文挑战第10天】B+树是一种多叉树,用于数据库索引,其特征包括叶子节点存储数据并用链表串联,非叶子节点仅存关键字。由于较低的高度和链表结构,B+树提供高效查询和范围查询。索引分类有聚簇(叶子节点存储数据)和非聚簇,以及覆盖、唯一、前缀、联合、全文和哈希索引。聚簇索引如主键索引,非聚簇索引叶子节点存储主键。覆盖索引可避免回表,提高性能。查询遵循最左匹配原则,优化SQL应选取所需列并考虑常见查询。

B+树

B+树是一个多叉树,一个k阶的B+树的定义是:

  1. 每个节点最多有k个子节点
  2. 除根节点以后,每个节点至少有[m/2]个子节点,根节点至少有2个子节点
  3. 有m个子节点的节点肯定有m个索引关键字

B+树还有两个特性:

  • 叶子节点存放了数据,非叶子节点只存放关键字
  • 叶子节点通过链表串联

B+树用于数据库索引的优势如下:

  1. B+树的高度比二叉树更低,树的高度代表查询时的耗时,因此B+树的查询效率更高
  2. B+树的叶子节点通过链表串联起来,适合范围查询
  3. B+树的非叶子节点里没有存放数据,只放了关键字,适合放入内存里

在使用索引提高查询性能的时候,索引全部都会装到内存里,真实的数据会放到磁盘里。不然如果索引也在磁盘上的话,使用索引就没什么用了。

索引分类

MySQL里索引在不同的角度有不同的分类

  • 根据叶子节点是否存储数据,可以分为聚簇索引和非聚簇索引
  • 覆盖索引:某个索引包括某个查询的所有列
  • 唯一索引:索引的值必须是唯一的,不能重复
  • 前缀索引:索引的某列只包含该列值的前一部分。比如在类型是varchar(128)的列上,选择前64个字符作为索引
  • 联合索引:由多个列组成
  • 全文索引:支持文本模糊查询
  • 哈希索引:使用哈希算法的索引

聚簇索引和非聚簇索引

上述已经提到了如果一个索引的叶子节点存储数据的话,就是聚簇索引,否则就是非聚簇索引。

主键索引就是一种聚簇索引,它的叶子节点里放着表的所有行;而其他的索引就是非聚簇索引,他们的叶子节点里放的是主键

在查询一张表的时候,如果用到了非主键索引,数据库会先在该索引对应的B+树里查到数据对应的主键,再根据主键去主键索引(聚簇索引)对应的B+树里查找数据,最终找出数据。这也就是所谓的回表

? 在回表操作的时候,会需要从磁盘里读取数据行,磁盘IO比较慢,所以回表的性能较差。

覆盖索引

如果查询的列全部都在某个索引里,数据库可以直接把索引存储的这些列的值返回,不用回表。覆盖索引的概念是某个索引相对于某个查询而言的。

比如有一个学生表student,在idname创建联合索引<id,name>,对于查询select id,name from student where id = 1,要查询的数据都在索引<id,name>里,就可以直接用索引的数据。

针对这个特性,可以得到优化SQL性能的两个方案,本质都是为了避免回表:

  1. 只查询需要的列
  2. 针对最频繁的查询来设计索引

最左匹配原则

索引在查询里是按照最左匹配原则来使用的,最左匹配原则指的是在联合索引的时候,查询条件的多个列与索引的多个列进行比较的时候,索引只会匹配到最左边的列的值。

比如创建一个在A,B,C三个列上的联合索引<A,B,C>,索引列的值的关系如下:

image-20240413200646447.png

A是绝对有序的;A确定的时候,B是有序的;A和B都确定的时候,C是有序的。

执行一个where A=a1 and B=b1 and C=c1的查询类似

for a in A {
   
   
  if a == a1 {
   
   
    for b in B {
   
   
      if b == b1 {
   
   
        for c in C {
   
   
          if c == c1 {
   
   
            // 这就是你要的数据,拿到主键之后去磁盘里面加载出来
          }
        }
      }
    }
  }
}
  • 如果查询条件是where A=a1 and B=b1,数据库只会用外面的两层循环
for a in A {
   
   
  if a == a1 {
   
   
    for b in B {
   
   
      if b == b1 {
   
   
            // 这就是你要的数据,拿到主键之后去磁盘里面加载出来
      }
    }
  }
}
相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
1天前
|
SQL 关系型数据库 MySQL
网安入门之MySQL后端基础
《网安入门之MySQL后端基础》简介: 本文介绍了数据库及MySQL的基础知识,涵盖数据库的概念、结构与操作。数据库是组织化存储数据的集合,通过表、列、行等结构实现高效管理。MySQL作为开源的关系型数据库管理系统,广泛应用于Web开发。文中详细讲解了MySQL的基本操作,如增(INSERT)、删(DELETE)、改(UPDATE)、查(SELECT)等语句的使用方法,并介绍了数据库事务的ACID特性。此外,还探讨了SQL注入攻击的风险及防范措施,强调了预处理语句的重要性。最后,简述了PHP中mysqli扩展的使用方法,包括连接数据库、执行查询和关闭连接等步骤。
|
15天前
|
存储 Oracle 关系型数据库
数据库传奇:MySQL创世之父的两千金My、Maria
《数据库传奇:MySQL创世之父的两千金My、Maria》介绍了MySQL的发展历程及其分支MariaDB。MySQL由Michael Widenius等人于1994年创建,现归Oracle所有,广泛应用于阿里巴巴、腾讯等企业。2009年,Widenius因担心Oracle收购影响MySQL的开源性,创建了MariaDB,提供额外功能和改进。维基百科、Google等已逐步替换为MariaDB,以确保更好的性能和社区支持。掌握MariaDB作为备用方案,对未来发展至关重要。
40 3
|
15天前
|
安全 关系型数据库 MySQL
MySQL崩溃保险箱:探秘Redo/Undo日志确保数据库安全无忧!
《MySQL崩溃保险箱:探秘Redo/Undo日志确保数据库安全无忧!》介绍了MySQL中的三种关键日志:二进制日志(Binary Log)、重做日志(Redo Log)和撤销日志(Undo Log)。这些日志确保了数据库的ACID特性,即原子性、一致性、隔离性和持久性。Redo Log记录数据页的物理修改,保证事务持久性;Undo Log记录事务的逆操作,支持回滚和多版本并发控制(MVCC)。文章还详细对比了InnoDB和MyISAM存储引擎在事务支持、锁定机制、并发性等方面的差异,强调了InnoDB在高并发和事务处理中的优势。通过这些机制,MySQL能够在事务执行、崩溃和恢复过程中保持
43 3
|
15天前
|
SQL 关系型数据库 MySQL
数据库灾难应对:MySQL误删除数据的救赎之道,技巧get起来!之binlog
《数据库灾难应对:MySQL误删除数据的救赎之道,技巧get起来!之binlog》介绍了如何利用MySQL的二进制日志(Binlog)恢复误删除的数据。主要内容包括: 1. **启用二进制日志**:在`my.cnf`中配置`log-bin`并重启MySQL服务。 2. **查看二进制日志文件**:使用`SHOW VARIABLES LIKE &#39;log_%&#39;;`和`SHOW MASTER STATUS;`命令获取当前日志文件及位置。 3. **创建数据备份**:确保在恢复前已有备份,以防意外。 4. **导出二进制日志为SQL语句**:使用`mysqlbinlog`
58 2
|
29天前
|
关系型数据库 MySQL 数据库
Python处理数据库:MySQL与SQLite详解 | python小知识
本文详细介绍了如何使用Python操作MySQL和SQLite数据库,包括安装必要的库、连接数据库、执行增删改查等基本操作,适合初学者快速上手。
195 15
|
22天前
|
SQL 关系型数据库 MySQL
数据库数据恢复—Mysql数据库表记录丢失的数据恢复方案
Mysql数据库故障: Mysql数据库表记录丢失。 Mysql数据库故障表现: 1、Mysql数据库表中无任何数据或只有部分数据。 2、客户端无法查询到完整的信息。
|
29天前
|
关系型数据库 MySQL 数据库
数据库数据恢复—MYSQL数据库文件损坏的数据恢复案例
mysql数据库文件ibdata1、MYI、MYD损坏。 故障表现:1、数据库无法进行查询等操作;2、使用mysqlcheck和myisamchk无法修复数据库。
|
1月前
|
存储 缓存 数据库
数据库索引采用B+树不采用B树的原因?
B+树优化了数据存储和查询效率,数据仅存于叶子节点,便于区间查询和遍历,磁盘读写成本低,查询效率稳定,特别适合数据库索引及范围查询。
40 6
|
1月前
|
SQL 关系型数据库 MySQL
MySQL导入.sql文件后数据库乱码问题
本文分析了导入.sql文件后数据库备注出现乱码的原因,包括字符集不匹配、备注内容编码问题及MySQL版本或配置问题,并提供了详细的解决步骤,如检查和统一字符集设置、修改客户端连接方式、检查MySQL配置等,确保导入过程顺利。
|
13天前
|
存储 关系型数据库 MySQL
【MYSQL】 ——索引(B树B+树)、设计栈
索引的特点,使用场景,操作,底层结构,B树B+树,MYSQL设计栈

热门文章

最新文章

推荐镜像

更多