Mysql中的B-Tree和B+Tree原理解析

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云解析 DNS,旗舰版 1个月
简介: 1、操作系统从磁盘读取数据到内存时是以磁盘块(block)为基本单位的2、InnoDB存储引擎是按页来处理数据的,因此B-Tree/B+Tree的基础分配单位是页。InnoDB存储引擎中默认每个页的大小为16KB。通过以下命令进行茶盘

基本知识

1、操作系统从磁盘读取数据到内存时是以磁盘块(block)为基本单位的
2、InnoDB存储引擎是按页来处理数据的,因此B-Tree/B+Tree的基础分配单位是页。InnoDB存储引擎中默认每个页的大小为16KB。
通过以下命令进行茶盘

mysql> show variables like 'innodb_page_size';

3、磁盘块(block)实际上并没有这么大,因此InnoDB每次申请磁盘空间时都会是若干地址连续磁盘块来达到页的大小16KB。

平衡多路查找树(B-Tree)(所有节点存放data)

b-tree是平衡二叉树的优化,主要是为了排序数据,查找数据,减少磁盘IO。

B-Tree特点

1、每一个节点,包含指针(指向子节点的指针),主键值,data(主键值所在记录的一行数据)

2、一个m阶的b-tree,每个节点最多有m个孩子。例如三阶,每个节点有三个孩子节点

如下图所示为一个3阶的B-Tree:

注意:图中磁盘块,应该为innodb的调度单位 页。使用页,方便理解

在这里插入图片描述

以主键28,展示搜索过程:

1、磁盘IO,读取根节点页(实际上根节点被载入内存,读取内存中的根节点)
2、内存比较,28大于17,小于35,读取对应页
3、磁盘IO,读取p2指针所指向的节点
4、内存比较,28大于26,小于30,读取对应节点
5、磁盘IO,读取对应节点页
6、内存比较,获取28主键值,和对应的记录数据

以上过程三次磁盘IO(实际上应该是两次),三次内存比较。每个节点都包含data(记录数据)

B-tree缺点

  • innodb引擎对于页的处理是 16kb,节点中不仅包含键值,指针,还有占用空间较大的记录data。
  • 而主键大小bigint占8byte,指针占8byte,data大小占用过大,导致一页(节点)实际上存放不了多少键值和指针。
  • 一旦页存放不下,就会加深B-Tree的深度,而我们知道每加深一层,磁盘IO一层,磁盘IO效率低,导致整体性能降低。

B+Tree (叶子节点存放data)

B+Tree是堆B-tree的优化,主要是想每一页(每个节点)多存放键值和指针,减少tree深度,降低磁盘IO,提高查找效率。

B+Tree特点

1、非叶子节点只存储键值信息和指针。

2、所有叶子节点之间都有一个链指针。

3、数据记录都存放在叶子节点中。

假设每页能存储4个键值及指针信息,则变成B+Tree后其结构如下图所示:
在这里插入图片描述

1、InnoDB存储引擎中页的大小为16KB,

2、表的主键类型为BIGINT(占用8个字节),指针类型也一般为4或8个字节,也就是说一个页(B+Tree中的一个节点)中大概存储16KB/(8B+8B)=1K个键值

3、假设data为1kb,一页中最多16kb/1kb=16条记录

3、一个深度为3的B+Tree索引可以维护10^3 10^3 16 = 16,777,216‬ 条记录。大概是17百多万条,仅仅也才三层B+Tree。

相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
11天前
|
监控 关系型数据库 MySQL
MySQL自增ID耗尽应对策略:技术解决方案全解析
在数据库管理中,MySQL的自增ID(AUTO_INCREMENT)属性为表中的每一行提供了一个唯一的标识符。然而,当自增ID达到其最大值时,如何处理这一情况成为了数据库管理员和开发者必须面对的问题。本文将探讨MySQL自增ID耗尽的原因、影响以及有效的应对策略。
36 3
|
12天前
|
存储 关系型数据库 MySQL
MySQL 字段类型深度解析:VARCHAR(50) 与 VARCHAR(500) 的差异
在MySQL数据库中,`VARCHAR`类型是一种非常灵活的字符串存储类型,它允许存储可变长度的字符串。然而,`VARCHAR(50)`和`VARCHAR(500)`之间的差异不仅仅是长度的不同,它们在存储效率、性能和使用场景上也有所不同。本文将深入探讨这两种字段类型的区别及其对数据库设计的影响。
27 2
|
16天前
|
存储 关系型数据库 MySQL
PHP与MySQL动态网站开发深度解析####
本文作为技术性文章,深入探讨了PHP与MySQL结合在动态网站开发中的应用实践,从环境搭建到具体案例实现,旨在为开发者提供一套详尽的实战指南。不同于常规摘要仅概述内容,本文将以“手把手”的教学方式,引导读者逐步构建一个功能完备的动态网站,涵盖前端用户界面设计、后端逻辑处理及数据库高效管理等关键环节,确保读者能够全面掌握PHP与MySQL在动态网站开发中的精髓。 ####
|
20天前
|
算法 Java 数据库连接
Java连接池技术,从基础概念出发,解析了连接池的工作原理及其重要性
本文详细介绍了Java连接池技术,从基础概念出发,解析了连接池的工作原理及其重要性。连接池通过复用数据库连接,显著提升了应用的性能和稳定性。文章还展示了使用HikariCP连接池的示例代码,帮助读者更好地理解和应用这一技术。
32 1
|
23天前
|
存储 关系型数据库 MySQL
MySQL MVCC深度解析:掌握并发控制的艺术
【10月更文挑战第23天】 在数据库领域,MVCC(Multi-Version Concurrency Control,多版本并发控制)是一种重要的并发控制机制,它允许多个事务并发执行而不产生冲突。MySQL作为广泛使用的数据库系统,其InnoDB存储引擎就采用了MVCC来处理事务。本文将深入探讨MySQL中的MVCC机制,帮助你在面试中自信应对相关问题。
75 3
|
23天前
|
缓存 关系型数据库 MySQL
MySQL执行计划深度解析:如何做出最优选择
【10月更文挑战第23天】 在数据库查询性能优化中,执行计划的选择至关重要。MySQL通过查询优化器来生成执行计划,但有时不同的执行计划会导致性能差异。理解如何选择合适的执行计划,以及为什么某些计划更优,对于数据库管理员和开发者来说是一项必备技能。
32 2
|
26天前
|
数据采集 存储 编解码
一份简明的 Base64 原理解析
Base64 编码器的原理,其实很简单,花一点点时间学会它,你就又消除了一个知识盲点。
67 3
|
26天前
|
SQL 关系型数据库 MySQL
Mysql中搭建主从复制原理和配置
主从复制在数据库管理中广泛应用,主要优点包括提高性能、实现高可用性、数据备份及灾难恢复。通过读写分离、从服务器接管、实时备份和地理分布等机制,有效增强系统的稳定性和数据安全性。主从复制涉及I/O线程和SQL线程,前者负责日志传输,后者负责日志应用,确保数据同步。配置过程中需开启二进制日志、设置唯一服务器ID,并创建复制用户,通过CHANGE MASTER TO命令配置从服务器连接主服务器,实现数据同步。实验部分展示了如何在两台CentOS 7服务器上配置MySQL 5.7主从复制,包括关闭防火墙、配置静态IP、设置域名解析、配置主从服务器、启动复制及验证同步效果。
Mysql中搭建主从复制原理和配置
|
6天前
|
API 持续交付 网络架构
深入解析微服务架构:原理、优势与实践
深入解析微服务架构:原理、优势与实践
11 0
|
7天前
|
存储 供应链 物联网
深入解析区块链技术的核心原理与应用前景
深入解析区块链技术的核心原理与应用前景

推荐镜像

更多
下一篇
无影云桌面