索引与约束
索引是有序的存储结构,是按单个或多个列的值进行排序,主要是为了提升搜索效率;
索引分类
按数据结构划分包括B+树索引,hash索引,全文索引elasticsearch;按物理存储划分包括聚集索引,辅助索引(要查找数据得先通过辅助索引查找到聚集索引,然后再通过聚集索引查找数据);按列的属性进行划分包括主键索引(非空唯一索引),唯一索引(允许出现一个null),普通索引,前缀索引(只比较前几个字符的长字符串);按列的个数划分包括单列索引,组合索引;
索引的代价
占用空间,有维护的代价,主要体现在dml操作会变慢;
innodb必须要有一个主键,因为innodb主键索引对应聚集索引B+树;B+树是多路平衡搜索树, 中序遍历是有序的;所有的叶子节点都在同一层,并且叶子节点构成了双向链表,节点的大小都为数据页的大小即16k,因为一个扇区是512字节,因为读磁盘时都是8个扇区为单位也就是4k;innodb中我们叶子节点中至少要存储两行数据;非叶子节点只会记录索引信息,叶子节点记录数据信息;按照主键构建的B+树,叶子节点中存放数据页,数据也是索引的一部分;
辅助索引中,叶子节点不包含行记录的全部数据,辅助索引的叶子节点中,除了用来排序的key还包含一个bookmark;该书签存储了聚集索引的key;
索引使用B+树实现是为了降低磁盘io和范围查询;mysql使用索引的场景如where判断,group by,order by;mysql使用不索引的场景如没有where判断,group by,order by,以及区分度不高的列,区分度是指列中数据差异不同的列有多少;经常修改的列不要创建索引;表的数据量少也不要创建索引;
覆盖索引
覆盖索引是一种数据查询方式,针对的是辅助索引;直接通过辅助索引B+树就能获取查询的值,而无需通过回表查询;在select中尽量写我们需要的字段;
最左匹配原则
最左匹配原则针对的是组合索引,匹配规则是从左到右依次进行匹配;遇到>或<或between like就停止匹配;
索引下推
索引下推也主要是为了减少回表次数;如果没有索引下推,那么server层向存储引擎层请求数据,在server层根据索引条件进行数据过滤;有索引下推,则将索引条件判断下推到存储引擎中过滤数据,最终由存储引擎层进行数据汇总返回到server层;
索引存储
数据是不是会缓存在磁盘中;
innodb数据结构,分为在内存中的数据结构,和磁盘中的数据结构;buffer pool是用来缓存表和索引数据的,聚集索引在buffer pool修改;采用LRU算法让buffer pool只缓存比较热的数据;change buffer用来缓存二级索引,如果是辅助索引的修改会先在change buffer中修改,change buffer的数据会异步刷新到buffer pool中;
buffer pool默认是128M数据,为了阻止buffer pool中的数据,我们用free list,flush list,lru list;链表中记录的都是buffer pool中的页信息;128M存储不了大量数据,这是就通过淘汰策略更新lru list最近最少使用的数据链表;
增删改数据
如果数据在buffer pool中则直接修改,并将数据页放到flush list中,在未来进行刷盘,但是不会每次增删改都会落盘,而是通过另外线程对flush list统一落盘;
change buffer
change buffer是缓存非唯一索引的数据变更DML操作,change buffer中的数据将会异步merge到磁盘当中;free list组织buffer pool中未使用的缓存页,flush list组织buffer pool中脏页,也就是刷盘的页,lru组织buffer pool中冷热数据,当buffer pool没有空闲页,将lru list中最久未使用的数据进行淘汰;
索引存储
数据页是16k,buffer pool用于缓存数据页,用于降低磁盘io次数;change buffer用于缓存非唯一索引的DML数据;
索引失效