MySQL 学习记录系列(一)

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: MySQL官方对索引的定义为:索引(index)是帮助MySQL高效获取数据的数据结构(有序)。在数据之外,数据库系统还维护者满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构上实现高级查找算法,这种数据结构就是索引。

1、索引


1.1、索引概述


MySQL官方对索引的定义为:索引(index)是帮助MySQL高效获取数据的数据结构(有序)。


在数据之外,数据库系统还维护者满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构上实现高级查找算法,这种数据结构就是索引。


如下所示:


20200508220007828.png


左边是数据表,一共有两列七条记录。


最左边的是数据记录的物理地址(注意逻辑上相邻的记录在磁盘上也并不是一定物理相邻的)。


为了加快 Col2 字段的查找速度,可以维护一个右边所示的二叉查找树,每个节点分别包含索引键值和一个指向对应数据记录物理地址的指针,这样就可以运用二叉查找快速获取到相应数据。


一般来说索引本身也很大,不可能全部存储在内存中,因此索引往往以索引文件的形式存储在磁盘上。


索引是数据库中用来提高性能的最常用的工具。


2.2、索引优势劣势


优势:


1)类似于书籍的自录索引,提高数据检索的效率,降低数据库的IO成本。


2)通过索引列对数据进行排序,降低数据排序的成本,降低CPU的消耗。


劣势:


1)实际上索引也是一张表,该表中保存了主键与索引字段,并指向实体类的记录,所以索引列也是要占用空间的。


2)虽然索引大大提高了查询效率,同时却也降低更新表的速度,如对表进行 INSERT、UPDATE、DELETE。因为更新表时,MySQL不仅要保存数据,还要保存一下索引文件每次更新添加了索引列的字段,都会调整因为更新所带来的键值变化后的索引信息。


2.3、索引结构


索引是在MySQL的存储引擎层中实现的,而不是在服务器层实现的。所以每种存储引擎的索引都不一定完全相同,也不是所有的存储引擎都支持所有的索引类型的。MySQL目前提供了以下4种索引:


.BTREE索引:最常见的索引类型,大部分索引都支持B树索引。


.HASH索引:只有Memory引擎支持,使用场景简单。


.R-tree索引(空间索引):空间索引是MyISAM引擎的一个特殊索引类型,主要用于地理空间数据类型,通常使用较少,不做特别介绍。


.Full-text(全文索引):全文索引也是MyISAM的一个特殊索引类型,主要用于全文索引,InnoDB从Mysql5.6版本开始支持全文索引。


20200508221305618.png


我们平常所说的索引,如果没有特别指明,都是指B+树(多路搜索树,并不一定是二叉的)结构组织的索引。


其中聚集索引、复合索引、前缀索引、唯一索引默认都是使用B+tree树索引,统称为索引。


2.3.1、BTREE 索引结构


BTREE 又叫 多路平衡搜索树,一棵M叉的BTREE特性如下:


.树中每个节点最多包含m个孩子。


.除根节点与叶子节点外,每个节点至少有[ceil(m/2)]个孩子。(ceil  指 向上取整)


.每个非叶子节点由n个key与n+1个指针组成,其中[ceil(m/2)-1]<=n<=m-1


.若根节点不是叶子节点,则至少有两个孩子。


.所有的叶子节点都在同一层。


以5叉BTree为例,key的数量:公式推导[ceil(m/2)-1]<=n<=m-1。所以2<=n<=4。


当n>4时,中间节点分裂到父节点,两边节点分裂。


插入CNGAHEKQMFWLTZDPRXYS数据为例(n+1个指针 :字母下的方块表示组成为每个非叶子节点)


指针:


在插入一个元素的时候,比如下方插入E的时候,会与父节点的G进行对比,如果比G小则放置在左边


实际上该指针就是这个指向,通过这个指针指向左边的数据块


小于G这个指针指向的就是小于G的数据块


Key:


方块中的元素


演变过程如下:


1).插入前4个字母CNGA


20200508222822762.png


2).插入H,n>4,中间元素G字母向上分裂到新的节点


20200508223150472.png


3)插入E,K,Q不需要分裂


20200508223338708.png


4).插入M,中间元素M字母向上分裂到父节点G


20200508223928168.png


5).插入F,W,L,T不需要分裂


20200508224001607.png


6),插入Z,中间元素T向上分裂到父节点中


20200508224253951.png


7).插入D,中间元素D向上分裂到父节点中。然后插入P,R,X,Y不需要分裂


20200508224349419.png



8).最后插入S,NPQR节点n>5,中间节点Q向上分裂,但分裂后父节点DGMT的n>5,中间节点M向上分裂


20200508225027928.png


到此,该BTREE树就已经构建完成了。


BTREE树和二叉树相比,查询数据的效率更高,因为对于相同的数据量来说,BTREE的层级结构比二叉树小,因此搜索速度快。


2.3.3、B+TREE 结构


B+Tree为BTree的变种,B+Tree与BTree的区别为:


1).n叉B+Tree最多含有n个key(非叶子节点的Key只是起到索引的作用),而BTree最多含有n-1个key。


2).B+Tree的叶子节点保存所有的key信息,依key大小顺序排列。


3).所有的非叶子节点都可以看作是key的索引部分。


20200508225854695.png


由于B+Tree只有叶子节点保存key信息,查询任何key都要从root走到叶子。所以B+Tree的查询效率更加稳定。


2.3.3、MySOL中的B+Tree


MySql索引数据结构对经典的B+Tree进行了优化。


在原B+Tree的基础上,增加一个指向相邻叶子节点的链表指针,就形成了带有顺序指针的B+Tree,提高区间访问的性能,便于范围搜索。


MySQL中的B+Tree索引结构示意图:


20200508230043613.png


2.4、索引分类


1)单值索引:即一个索引只包含单个列,一个表可以有多个单列索引


2)唯一索引:索引列的值必须唯一,但允许有空值


3)复合索引:即一个索引包含多个列


2.5索引语法


索引在创建表的时候,可以同时创建,也可以随时增加新的索引。


准备环境:


CREATE TABLE `city` (
  `city_id` INT ( 11 ) NOT NULL AUTO_INCREMENT,
  `city_name` VARCHAR ( 50 ) NOT NULL,
  `country_id` INT ( 11 ) NOT NULL,
  PRIMARY KEY (`city_id`)
) ENGINE = INNODB DEFAULT CHARSET = utf8;
CREATE TABLE country ( country_id INT ( 11 ) NOT NULL AUTO_INCREMENT, countryname VARCHAR ( 100 ) NOT NULL, PRIMARY KEY ( country_id ) ) ENGINE = INNODB DEFAULT CHARSET = utf8;


insert into city(city_id,city_name,country_id)values(1,'西安',1);
insert into city(city_id,city_name,country_id)values(2,'NewYork',2);
insert into city(city_id,city_name,country_id)values(3,'北京',1);
insert into city(city_id,city_name,country_id)values(4,'上海',1);
insert into country(country_id,country_name)values(1,'China'); 
insert into country(country_id,country_name)values(2,'America'); 
insert into country(country_id,country_name)values(3,'Japan'); 
insert into country(country_id,country_name)values(4,'Uk');


2.5.1、创建索引


在MySQL中,该字段如果是主键,则默认存在该字段的索引


语法:


CREATE [UNIQUE | FULLTEXT | SPATIAL] INDEX index_name
[usING index_type]
on tb1_name(index_col_name,...)
index_col_name : column_name[(length)][ASC I DESc]


示例:为city表中的city_name字段创建索引;


create index idx_city_name on city(city_name);


2.5.2、查看索引


show index from table_name;


示例:查看city表中的索引信息;


show index from city;


2.5.3、删除索引


drop index idx_city_name on city;


2.5.4、ALTER 命令


1). alter table tb_name add primary key(column_list);


该语句添加一个主键,这意味着索引值必须是唯一的,且不能为NULL


2). alter table tb_name add unique index_name(column_list);


这条语句创建索引的值必须是唯一的(除了NULL外,NULL可能会出现多次)


3). alter table tb_name add index index_name(column_list);


添加普通索引,索引值可以出现多次。


4). alter table tb_name add fulltext index_name(column_list);


该语句指定了索引为FULLTEXT,用于全文索引


2.6、索引设计原则


索引的设计可以遵循一些已有的原则,创建索引的时候请尽量考虑符合这些原则,便于提升索引的使用效率,更高效的使用索引。


索引字段的选择,最佳候选列应当从where子句的条件中提取,如果where子句中的组合比较多,那么应当挑选最常用、过滤效果最好的列的组合


使用唯一索引,区分度越高,使用索引的效率越高。


索引可以有效的提升查询数据的效率,但索引数量不是多多益善,索引越多,维护索引的代价自然也就水涨船高。对于插入、更新、删除等DML操作比较频繁的表来说,索引过多,会引入相当高的维护代价,降低DML操作的效率,增加相应操作的时间消耗。另外索引过多的话,MySQL也会犯选择困难病,虽然最终仍然会找到一个可用的索引,但无疑提高了选择的代价。


使用短索引,索引创建之后也是使用硬盘来存储的,因此提升索引访问的I/O效率,也可以提升总体的访问效率。假如构成索引的字段总长度比较短,那么在给定大小的存储块内可以存储更多的索引值,相应的可以有效的提升MySQL访问索引的I/O效率。


利用最左前缀,N个列组合而成的组合索引,那么相当于是创建了N个索引,如果查询时where子句中使用了组成该索引的前几个字段,那么这条查询SQL可以利用组合索引来提升查询效率。


创建复合索引:


CREATE INDEX idx_name_email_status on tb_seller(NAME,email,STATUS);


就相当于


.对name 创建索引;

.对name,email创建了索引;

.对name,email,status 创建了索引;

相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
2月前
|
分布式计算 关系型数据库 MySQL
大数据-88 Spark 集群 案例学习 Spark Scala 案例 SuperWordCount 计算结果数据写入MySQL
大数据-88 Spark 集群 案例学习 Spark Scala 案例 SuperWordCount 计算结果数据写入MySQL
56 3
|
6月前
|
SQL 关系型数据库 MySQL
关于MySQL数据库的学习指南总结
【6月更文挑战第17天】MySQL是流行的关系型DBMS,适合各种应用。学习要点包括安装配置、数据类型、SQL(如SELECT、INSERT)、关系模型、表设计、SQL查询(如WHERE、ORDER BY)、事务处理、用户管理、性能优化和高级技术如存储过程、触发器。了解ACID特性,使用索引和内存优化提升性能,通过备份恢复确保数据安全。不断学习新技术以提升技能。
109 3
|
2月前
|
关系型数据库 MySQL Java
Django学习二:配置mysql,创建model实例,自动创建数据库表,对mysql数据库表已经创建好的进行直接操作和实验。
这篇文章是关于如何使用Django框架配置MySQL数据库,创建模型实例,并自动或手动创建数据库表,以及对这些表进行操作的详细教程。
91 0
Django学习二:配置mysql,创建model实例,自动创建数据库表,对mysql数据库表已经创建好的进行直接操作和实验。
|
2月前
|
Java 关系型数据库 MySQL
springboot学习五:springboot整合Mybatis 连接 mysql数据库
这篇文章是关于如何使用Spring Boot整合MyBatis来连接MySQL数据库,并进行基本的增删改查操作的教程。
222 0
springboot学习五:springboot整合Mybatis 连接 mysql数据库
|
2月前
|
Java 关系型数据库 MySQL
springboot学习四:springboot链接mysql数据库,使用JdbcTemplate 操作mysql
这篇文章是关于如何使用Spring Boot框架通过JdbcTemplate操作MySQL数据库的教程。
80 0
springboot学习四:springboot链接mysql数据库,使用JdbcTemplate 操作mysql
|
2月前
|
关系型数据库 MySQL 数据库
mysql关系型数据库的学习
mysql关系型数据库的学习
23 0
|
2月前
|
Kubernetes 关系型数据库 MySQL
k8s学习--利用helm部署应用mysql,加深helm的理解
k8s学习--利用helm部署应用mysql,加深helm的理解
290 0
|
3月前
|
SQL 关系型数据库 MySQL
学习MySQL操作的有效方法
学习MySQL操作的有效方法
50 3
|
3月前
|
SQL 关系型数据库 MySQL
如何学习 MySQL?
如何学习 MySQL?
41 3
|
4月前
|
SQL 关系型数据库 MySQL
学习mysql基础操作
【8月更文挑战第20天】学习mysql基础操作
43 1