Mysql（一）Mysql底层数据结构-阿里云开发者社区

Mysql（一）Mysql底层数据结构

2023-02-20 702

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

RDS MySQL DuckDB 分析主实例，集群系列 4核8GB

RDS MySQL DuckDB 分析主实例，基础系列 4核8GB

RDSClaw，2核4GB

简介： Mysql（一）Mysql底层数据结构

索引底层数据结构

mysql 底层有两种数据结构，B+Tree和Hash

B+树的数据结构已在文章B+树详细说明，mysql默认索引使用就是B+Tree，并且在叶子结点做了双向指针的优化

B树.png

mysql默认设置每个结点的大小为16kb，通过以下sql可查看：

SHOW GLOBAL STATUS like 'Innodb_page_size';

假设每个非叶子结点中的元素所占空间为8字节，指向子结点所占的空间占6字节，则一个结点可以存储的元素为16kb/(8b+6b)=1170个。

假设树的高度为3，叶子结点由于要存储数据，每个元素假设占1kb,则叶子结点可以存放的元素为16个，则这样的一棵高度为3的b+树可存储的数据为1170*1170*16=21907748个。大约2千万+的一张表使用3次IO便可定位到数据位置。

hash索引对索引的key进行一次hash计算就可以定位出数据存储的位置，对于只查询一条数据的情况，要比B+Tree 索引更加高效。但无法支持范围查询。这里个人的思考可以用于用户登录等业务，毕竟对于用户校验来说，不可能存在范围查询。

mysql一般使用两种存储引擎MyISAM和InnoDB

MyISAM存储引擎的索引文件和数据文件是分离的（非聚集）

MyISAM.png

索引存在MYI文件中，数据存在MYD文件中。在索引文件中，构建的B+树里，叶子结点存储的是数据的磁盘地址，也就是MYD文件中数据的地址。

InnoDB存储引擎的数据文件本身就是B+树组织的一个索引结构文件

InnoDB.png

叶子结点存储的就是完整的数据记录。

对于非主键索引，叶子结点存储的数据是主键。这样可以节省空间和保证一致性。

联合索引.png

查找时匹配顺序为name -> age->position，因为索引是基于name -> age->position的排序构建的。

先匹配name字段，匹配到name字段后，再匹配age字段，匹配到age字段后，再匹配posotion字段。

若不按照name -> age->position顺序查询，则索引失效。