3.3 常见索引概念
索引按照物理实现方式,索引可以分为 2 种:聚簇(聚集)和非聚簇(非聚集)索引。我们也把非聚集索引称为二级索引或者辅助索引。
3.3.1 聚簇索引
特点:
使用记录主键值的大小进行记录和页的排序,这包括三个方面的含义:
页内 的记录是按照主键的大小顺序排成一个 单向链表 。
各个存放存放 用户记录的页,也是根据页中用户记录的主键大小顺序排成一个 双向链表.
存放目录项记录的页分为不同的层次,在同一层次中的页也是根据页中目录项记录的主键大小顺序排成一个双向链表
B+ 树的叶子节点存储的是完整的用户记录。
所谓完整的用户记录,就是指这个记录中存储了所有列的值(包括隐藏列)。
优点:
数据访问更快 ,因为聚簇索引将索引和数据保存在同一个 B+ 树中,因此从聚簇索引中获取数据比非聚簇索引更快
聚簇索引对于主键的 排序查找 和 范围查找 速度非常快 (因为数据本身就是有序的)
按照聚簇索引排列顺序,查询显示一定范围数据的时候,由于数据都是紧密相连,数据库不用从多个数据块中提取数据,所以 节省了大量的 io 操作 。
缺点:
插入速度严重依赖于插入顺序 ,按照主键的顺序插入是最快的方式,否则将会出现页分裂,严重影响性能。因此,对于 InnoDB 表,我们一般都会定义一个 自增的 ID 列为主键
前半句分析。比如我们在上上幅图中页9和页20中间插入个 主键为200的数据,这就会导致页20及其后面的需要进行逻辑上的移动,然后插入新数据。同时上层目录页中的数据以及指针也可能变动,依次往上推,从而会降低性能!
后半句思考:删除的时候通常不真正删除,而是弄一个删除标记是不是和这个有关?
更新主键的代价很高 ,因为将会导致被更新的行移动。因此,对于 InnoDB 表,我们一般定义主键为不可更新
比如我们将 上上幅图 中的 209 改为 409,也会导致数据的移动。同时对上层目录页中的数据以及指针也可能变动,依次往上推,从而影响性能!
二级索引访问需要两次索引查找 ,第一次找到主键值,第二次根据主键值找到行数据 (下文细讲)
限制:
3.3.2 二级索引(辅助索引、非聚簇索引)
概念:回表 我们根据这个以 c2 列大小排序的 B+ 树只能确定我们要查找记录的主键值,所以如果我们想根据 c2 列的值查找到完整的用户记录的话,仍然需要到 聚簇索引 中再查一遍,这个过程称为 回表 。也就是根据 c2 列的值查询一条完整的用户记录需要使用到 2 棵 B+ 树!
问题:为什么我们还需要一次回表操作呢?直接把完整的用户记录放到叶子节点不 OK 吗?
第三点的解释:聚簇索引中存放的是记录的所有字段,一旦进行修改,聚簇索引上的数据是一定需要修改的。而非聚簇索引存放的是主键+单个字段,相对来说修改的少,效率也就高。
3.3.3 联合索引
我们也可以同时以多个列的大小作为排序规则,也就是同时为多个列建立索引,比方说我们想让 B+ 树按照 c2 和c3 列 的大小进行排序,这个包含两层含义:
先把各个记录和页按照 c2 列进行排序。
在记录的 c2 列相同的情况下,采用 c3 列进行排序
注意一点,以 c2 和 c3 列的大小为排序规则建立的 B+ 树称为 联合索引 ,本质上也是一个二级索引。它的意思与分别为 c2 和 c3 列分别建立索引的表述是不同的,不同点如下:
建立 联合索引 只会建立如上图一样的 1 棵 B+ 树。
为 c2 和 c3 列分别建立索引会分别以 c2 和 c3 列的大小为排序规则建立 2 棵 B+ 树。
3.4 InnoDB 的 B+ 树索引的注意事项
1. 根页面位置万年不动
**注意:**B+树的构建是自上往下构建的
2. 内节点中目录项记录的唯一性
注意: 页号虽然也可以保证列的唯一性,但是没有实际意义。而其他的列比如c3、c 4我们也不能保证唯一性。所以我们增添的是主键值,再进行判断时也是根据 列号+主键 来选择向哪一页插入数据
3. 一个页面最少存储 2 条记录
4. MyISAM 中的索引方案
B 树索引适用存储引擎如表所示:
索引 / 存储引擎 | MyISAM | InnoDB | Memory |
B-Tree 索引 | 支持 | 支持 | 支持 |
即使多个存储引擎支持同一种类型的索引,但是他们的实现原理也是不同的。Innodb 和 MyISAM 默认的索引是 B-tree 索引;而 Memory 默认的索引是 Hash 索引。
MyISAM 引擎使用 B+Tree 作为索引结构,叶子节点的 data 域存放的是 数据记录的地址 (所以MyISAM把索引和数据分开存储了)
注意: 在MySQL中,B 树实际上还是B+树。但是在选择谈到选择MySQL的数据结构时,这两者就区别大了
4.1 MyISAM 索引的原理
注意: 对于MYISAM来说,无论是主键索引还是非主键索引都属于非聚簇索引,因为数据和索引是分离的