MySQL 学习记录系列(一)

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: MySQL官方对索引的定义为:索引(index)是帮助MySQL高效获取数据的数据结构(有序)。在数据之外,数据库系统还维护者满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构上实现高级查找算法,这种数据结构就是索引。

1、索引


1.1、索引概述


MySQL官方对索引的定义为:索引(index)是帮助MySQL高效获取数据的数据结构(有序)。


在数据之外,数据库系统还维护者满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构上实现高级查找算法,这种数据结构就是索引。


如下所示:


20200508220007828.png


左边是数据表,一共有两列七条记录。


最左边的是数据记录的物理地址(注意逻辑上相邻的记录在磁盘上也并不是一定物理相邻的)。


为了加快 Col2 字段的查找速度,可以维护一个右边所示的二叉查找树,每个节点分别包含索引键值和一个指向对应数据记录物理地址的指针,这样就可以运用二叉查找快速获取到相应数据。


一般来说索引本身也很大,不可能全部存储在内存中,因此索引往往以索引文件的形式存储在磁盘上。


索引是数据库中用来提高性能的最常用的工具。


2.2、索引优势劣势


优势:


1)类似于书籍的自录索引,提高数据检索的效率,降低数据库的IO成本。


2)通过索引列对数据进行排序,降低数据排序的成本,降低CPU的消耗。


劣势:


1)实际上索引也是一张表,该表中保存了主键与索引字段,并指向实体类的记录,所以索引列也是要占用空间的。


2)虽然索引大大提高了查询效率,同时却也降低更新表的速度,如对表进行 INSERT、UPDATE、DELETE。因为更新表时,MySQL不仅要保存数据,还要保存一下索引文件每次更新添加了索引列的字段,都会调整因为更新所带来的键值变化后的索引信息。


2.3、索引结构


索引是在MySQL的存储引擎层中实现的,而不是在服务器层实现的。所以每种存储引擎的索引都不一定完全相同,也不是所有的存储引擎都支持所有的索引类型的。MySQL目前提供了以下4种索引:


.BTREE索引:最常见的索引类型,大部分索引都支持B树索引。


.HASH索引:只有Memory引擎支持,使用场景简单。


.R-tree索引(空间索引):空间索引是MyISAM引擎的一个特殊索引类型,主要用于地理空间数据类型,通常使用较少,不做特别介绍。


.Full-text(全文索引):全文索引也是MyISAM的一个特殊索引类型,主要用于全文索引,InnoDB从Mysql5.6版本开始支持全文索引。


20200508221305618.png


我们平常所说的索引,如果没有特别指明,都是指B+树(多路搜索树,并不一定是二叉的)结构组织的索引。


其中聚集索引、复合索引、前缀索引、唯一索引默认都是使用B+tree树索引,统称为索引。


2.3.1、BTREE 索引结构


BTREE 又叫 多路平衡搜索树,一棵M叉的BTREE特性如下:


.树中每个节点最多包含m个孩子。


.除根节点与叶子节点外,每个节点至少有[ceil(m/2)]个孩子。(ceil  指 向上取整)


.每个非叶子节点由n个key与n+1个指针组成,其中[ceil(m/2)-1]<=n<=m-1


.若根节点不是叶子节点,则至少有两个孩子。


.所有的叶子节点都在同一层。


以5叉BTree为例,key的数量:公式推导[ceil(m/2)-1]<=n<=m-1。所以2<=n<=4。


当n>4时,中间节点分裂到父节点,两边节点分裂。


插入CNGAHEKQMFWLTZDPRXYS数据为例(n+1个指针 :字母下的方块表示组成为每个非叶子节点)


指针:


在插入一个元素的时候,比如下方插入E的时候,会与父节点的G进行对比,如果比G小则放置在左边


实际上该指针就是这个指向,通过这个指针指向左边的数据块


小于G这个指针指向的就是小于G的数据块


Key:


方块中的元素


演变过程如下:


1).插入前4个字母CNGA


20200508222822762.png


2).插入H,n>4,中间元素G字母向上分裂到新的节点


20200508223150472.png


3)插入E,K,Q不需要分裂


20200508223338708.png


4).插入M,中间元素M字母向上分裂到父节点G


20200508223928168.png


5).插入F,W,L,T不需要分裂


20200508224001607.png


6),插入Z,中间元素T向上分裂到父节点中


20200508224253951.png


7).插入D,中间元素D向上分裂到父节点中。然后插入P,R,X,Y不需要分裂


20200508224349419.png



8).最后插入S,NPQR节点n>5,中间节点Q向上分裂,但分裂后父节点DGMT的n>5,中间节点M向上分裂


20200508225027928.png


到此,该BTREE树就已经构建完成了。


BTREE树和二叉树相比,查询数据的效率更高,因为对于相同的数据量来说,BTREE的层级结构比二叉树小,因此搜索速度快。


2.3.3、B+TREE 结构


B+Tree为BTree的变种,B+Tree与BTree的区别为:


1).n叉B+Tree最多含有n个key(非叶子节点的Key只是起到索引的作用),而BTree最多含有n-1个key。


2).B+Tree的叶子节点保存所有的key信息,依key大小顺序排列。


3).所有的非叶子节点都可以看作是key的索引部分。


20200508225854695.png


由于B+Tree只有叶子节点保存key信息,查询任何key都要从root走到叶子。所以B+Tree的查询效率更加稳定。


2.3.3、MySOL中的B+Tree


MySql索引数据结构对经典的B+Tree进行了优化。


在原B+Tree的基础上,增加一个指向相邻叶子节点的链表指针,就形成了带有顺序指针的B+Tree,提高区间访问的性能,便于范围搜索。


MySQL中的B+Tree索引结构示意图:


20200508230043613.png


2.4、索引分类


1)单值索引:即一个索引只包含单个列,一个表可以有多个单列索引


2)唯一索引:索引列的值必须唯一,但允许有空值


3)复合索引:即一个索引包含多个列


2.5索引语法


索引在创建表的时候,可以同时创建,也可以随时增加新的索引。


准备环境:


CREATE TABLE `city` (
  `city_id` INT ( 11 ) NOT NULL AUTO_INCREMENT,
  `city_name` VARCHAR ( 50 ) NOT NULL,
  `country_id` INT ( 11 ) NOT NULL,
  PRIMARY KEY (`city_id`)
) ENGINE = INNODB DEFAULT CHARSET = utf8;
CREATE TABLE country ( country_id INT ( 11 ) NOT NULL AUTO_INCREMENT, countryname VARCHAR ( 100 ) NOT NULL, PRIMARY KEY ( country_id ) ) ENGINE = INNODB DEFAULT CHARSET = utf8;


insert into city(city_id,city_name,country_id)values(1,'西安',1);
insert into city(city_id,city_name,country_id)values(2,'NewYork',2);
insert into city(city_id,city_name,country_id)values(3,'北京',1);
insert into city(city_id,city_name,country_id)values(4,'上海',1);
insert into country(country_id,country_name)values(1,'China'); 
insert into country(country_id,country_name)values(2,'America'); 
insert into country(country_id,country_name)values(3,'Japan'); 
insert into country(country_id,country_name)values(4,'Uk');


2.5.1、创建索引


在MySQL中,该字段如果是主键,则默认存在该字段的索引


语法:


CREATE [UNIQUE | FULLTEXT | SPATIAL] INDEX index_name
[usING index_type]
on tb1_name(index_col_name,...)
index_col_name : column_name[(length)][ASC I DESc]


示例:为city表中的city_name字段创建索引;


create index idx_city_name on city(city_name);


2.5.2、查看索引


show index from table_name;


示例:查看city表中的索引信息;


show index from city;


2.5.3、删除索引


drop index idx_city_name on city;


2.5.4、ALTER 命令


1). alter table tb_name add primary key(column_list);


该语句添加一个主键,这意味着索引值必须是唯一的,且不能为NULL


2). alter table tb_name add unique index_name(column_list);


这条语句创建索引的值必须是唯一的(除了NULL外,NULL可能会出现多次)


3). alter table tb_name add index index_name(column_list);


添加普通索引,索引值可以出现多次。


4). alter table tb_name add fulltext index_name(column_list);


该语句指定了索引为FULLTEXT,用于全文索引


2.6、索引设计原则


索引的设计可以遵循一些已有的原则,创建索引的时候请尽量考虑符合这些原则,便于提升索引的使用效率,更高效的使用索引。


索引字段的选择,最佳候选列应当从where子句的条件中提取,如果where子句中的组合比较多,那么应当挑选最常用、过滤效果最好的列的组合


使用唯一索引,区分度越高,使用索引的效率越高。


索引可以有效的提升查询数据的效率,但索引数量不是多多益善,索引越多,维护索引的代价自然也就水涨船高。对于插入、更新、删除等DML操作比较频繁的表来说,索引过多,会引入相当高的维护代价,降低DML操作的效率,增加相应操作的时间消耗。另外索引过多的话,MySQL也会犯选择困难病,虽然最终仍然会找到一个可用的索引,但无疑提高了选择的代价。


使用短索引,索引创建之后也是使用硬盘来存储的,因此提升索引访问的I/O效率,也可以提升总体的访问效率。假如构成索引的字段总长度比较短,那么在给定大小的存储块内可以存储更多的索引值,相应的可以有效的提升MySQL访问索引的I/O效率。


利用最左前缀,N个列组合而成的组合索引,那么相当于是创建了N个索引,如果查询时where子句中使用了组成该索引的前几个字段,那么这条查询SQL可以利用组合索引来提升查询效率。


创建复合索引:


CREATE INDEX idx_name_email_status on tb_seller(NAME,email,STATUS);


就相当于


.对name 创建索引;

.对name,email创建了索引;

.对name,email,status 创建了索引;

相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
SQL 缓存 前端开发
MySQL 学习记录系列(六)
在业务系统中,需要记录当前业务系统的访问日志,该访问日志包含:操作人,操作时间,访问类,访问方法,请求参数,请求结果,请求结果类型,请求时长等信息。记录详细的系统访问日志,主要便于对系统中的用户请求进行追踪,并且在系统的管理后台可以查看到用户的访问记录。
78 0
MySQL 学习记录系列(六)
|
SQL 存储 关系型数据库
MySQL 学习记录系列(五)
错误日志是MySQL中最重要的日志之一,它记录了当mysqld启动和停止时,以及服务器在运行过程中发生任何严重错误时的相关信息。当数据库出现任何故障导致无法正常使用时,可以首先查看此日志。
136 0
MySQL 学习记录系列(五)
|
SQL 存储 缓存
MySQL 学习记录系列(四)
分布式数据库架构适合大数据量、负载高的情况,它有良好的拓展性和高可用性。通过在多台服务器之间分布数据,可以实现在多台服务器之间的负载均衡,提高访问效率。
104 0
MySQL 学习记录系列(四)
|
存储 SQL 缓存
MySQL 学习记录系列(三)
最上层是一些客户端和链接服务,包含本地socket通信和大多数基于客户端/服务端工具实现的类似于TCP/IP的通信。主要完成一些类似于连接处理、授权认证、及相关的安全方案。在该层上引入了线程池的概念,为通过认证安全接入的客户端提供线程。同样在该层上可以实现基于SSL的安全链接。服务器也会为安全接入的每个客户端验证它所具有的操作权限。
102 0
MySQL 学习记录系列(三)
|
存储 SQL 安全
MySQL 学习记录系列(二)
视图并不在数据库中实际存在,行和列数据来自定义视图的查询中使用的表,并且是在使用视图时动态生成的。视图就是一条SELECT语句执行后返回的结果集。所以在创建视图的时候,主要的工作就落在创建这条SQL查询语句上。
101 0
MySQL 学习记录系列(二)
|
SQL 数据格式 XML
Mysql_学习记录
前言 本篇博客主要记录一些开发中使用的到一些知识点。 正文 第一篇 CDATA语法 &lt; ! [CDATA[]]&gt; 这是一个xml语法 是的所有在CDATA中的数据都不会被解析 详细描述参见:CDATA语法 第二篇 CONCAT函数 CONCAT()函数用于将多个字符串连接成一个字符串 注意: 如有任何一个参数为NULL
1163 0
|
3天前
|
关系型数据库 MySQL 数据库
docker MySQL删除数据库时的错误(errno: 39)
docker MySQL删除数据库时的错误(errno: 39)
23 0
|
3天前
|
Java 关系型数据库 MySQL
【MySQL × SpringBoot 突发奇想】全面实现流程 · xlsx文件,Excel表格导入数据库的接口(下)
【MySQL × SpringBoot 突发奇想】全面实现流程 · xlsx文件,Excel表格导入数据库的接口
12 0
|
3天前
|
Java 关系型数据库 MySQL
【MySQL × SpringBoot 突发奇想】全面实现流程 · xlsx文件,Excel表格导入数据库的接口(上)
【MySQL × SpringBoot 突发奇想】全面实现流程 · xlsx文件,Excel表格导入数据库的接口
16 0
|
1天前
|
关系型数据库 MySQL API
实时计算 Flink版产品使用合集之可以通过mysql-cdc动态监听MySQL数据库的数据变动吗
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
12 0

推荐镜像

更多