MySQL 学习记录系列(一)

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS PostgreSQL,高可用系列 2核4GB
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: MySQL官方对索引的定义为:索引(index)是帮助MySQL高效获取数据的数据结构(有序)。在数据之外,数据库系统还维护者满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构上实现高级查找算法,这种数据结构就是索引。

1、索引


1.1、索引概述


MySQL官方对索引的定义为:索引(index)是帮助MySQL高效获取数据的数据结构(有序)。


在数据之外,数据库系统还维护者满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构上实现高级查找算法,这种数据结构就是索引。


如下所示:


20200508220007828.png


左边是数据表,一共有两列七条记录。


最左边的是数据记录的物理地址(注意逻辑上相邻的记录在磁盘上也并不是一定物理相邻的)。


为了加快 Col2 字段的查找速度,可以维护一个右边所示的二叉查找树,每个节点分别包含索引键值和一个指向对应数据记录物理地址的指针,这样就可以运用二叉查找快速获取到相应数据。


一般来说索引本身也很大,不可能全部存储在内存中,因此索引往往以索引文件的形式存储在磁盘上。


索引是数据库中用来提高性能的最常用的工具。


2.2、索引优势劣势


优势:


1)类似于书籍的自录索引,提高数据检索的效率,降低数据库的IO成本。


2)通过索引列对数据进行排序,降低数据排序的成本,降低CPU的消耗。


劣势:


1)实际上索引也是一张表,该表中保存了主键与索引字段,并指向实体类的记录,所以索引列也是要占用空间的。


2)虽然索引大大提高了查询效率,同时却也降低更新表的速度,如对表进行 INSERT、UPDATE、DELETE。因为更新表时,MySQL不仅要保存数据,还要保存一下索引文件每次更新添加了索引列的字段,都会调整因为更新所带来的键值变化后的索引信息。


2.3、索引结构


索引是在MySQL的存储引擎层中实现的,而不是在服务器层实现的。所以每种存储引擎的索引都不一定完全相同,也不是所有的存储引擎都支持所有的索引类型的。MySQL目前提供了以下4种索引:


.BTREE索引:最常见的索引类型,大部分索引都支持B树索引。


.HASH索引:只有Memory引擎支持,使用场景简单。


.R-tree索引(空间索引):空间索引是MyISAM引擎的一个特殊索引类型,主要用于地理空间数据类型,通常使用较少,不做特别介绍。


.Full-text(全文索引):全文索引也是MyISAM的一个特殊索引类型,主要用于全文索引,InnoDB从Mysql5.6版本开始支持全文索引。


20200508221305618.png


我们平常所说的索引,如果没有特别指明,都是指B+树(多路搜索树,并不一定是二叉的)结构组织的索引。


其中聚集索引、复合索引、前缀索引、唯一索引默认都是使用B+tree树索引,统称为索引。


2.3.1、BTREE 索引结构


BTREE 又叫 多路平衡搜索树,一棵M叉的BTREE特性如下:


.树中每个节点最多包含m个孩子。


.除根节点与叶子节点外,每个节点至少有[ceil(m/2)]个孩子。(ceil  指 向上取整)


.每个非叶子节点由n个key与n+1个指针组成,其中[ceil(m/2)-1]<=n<=m-1


.若根节点不是叶子节点,则至少有两个孩子。


.所有的叶子节点都在同一层。


以5叉BTree为例,key的数量:公式推导[ceil(m/2)-1]<=n<=m-1。所以2<=n<=4。


当n>4时,中间节点分裂到父节点,两边节点分裂。


插入CNGAHEKQMFWLTZDPRXYS数据为例(n+1个指针 :字母下的方块表示组成为每个非叶子节点)


指针:


在插入一个元素的时候,比如下方插入E的时候,会与父节点的G进行对比,如果比G小则放置在左边


实际上该指针就是这个指向,通过这个指针指向左边的数据块


小于G这个指针指向的就是小于G的数据块


Key:


方块中的元素


演变过程如下:


1).插入前4个字母CNGA


20200508222822762.png


2).插入H,n>4,中间元素G字母向上分裂到新的节点


20200508223150472.png


3)插入E,K,Q不需要分裂


20200508223338708.png


4).插入M,中间元素M字母向上分裂到父节点G


20200508223928168.png


5).插入F,W,L,T不需要分裂


20200508224001607.png


6),插入Z,中间元素T向上分裂到父节点中


20200508224253951.png


7).插入D,中间元素D向上分裂到父节点中。然后插入P,R,X,Y不需要分裂


20200508224349419.png



8).最后插入S,NPQR节点n>5,中间节点Q向上分裂,但分裂后父节点DGMT的n>5,中间节点M向上分裂


20200508225027928.png


到此,该BTREE树就已经构建完成了。


BTREE树和二叉树相比,查询数据的效率更高,因为对于相同的数据量来说,BTREE的层级结构比二叉树小,因此搜索速度快。


2.3.3、B+TREE 结构


B+Tree为BTree的变种,B+Tree与BTree的区别为:


1).n叉B+Tree最多含有n个key(非叶子节点的Key只是起到索引的作用),而BTree最多含有n-1个key。


2).B+Tree的叶子节点保存所有的key信息,依key大小顺序排列。


3).所有的非叶子节点都可以看作是key的索引部分。


20200508225854695.png


由于B+Tree只有叶子节点保存key信息,查询任何key都要从root走到叶子。所以B+Tree的查询效率更加稳定。


2.3.3、MySOL中的B+Tree


MySql索引数据结构对经典的B+Tree进行了优化。


在原B+Tree的基础上,增加一个指向相邻叶子节点的链表指针,就形成了带有顺序指针的B+Tree,提高区间访问的性能,便于范围搜索。


MySQL中的B+Tree索引结构示意图:


20200508230043613.png


2.4、索引分类


1)单值索引:即一个索引只包含单个列,一个表可以有多个单列索引


2)唯一索引:索引列的值必须唯一,但允许有空值


3)复合索引:即一个索引包含多个列


2.5索引语法


索引在创建表的时候,可以同时创建,也可以随时增加新的索引。


准备环境:


CREATE TABLE `city` (
  `city_id` INT ( 11 ) NOT NULL AUTO_INCREMENT,
  `city_name` VARCHAR ( 50 ) NOT NULL,
  `country_id` INT ( 11 ) NOT NULL,
  PRIMARY KEY (`city_id`)
) ENGINE = INNODB DEFAULT CHARSET = utf8;
CREATE TABLE country ( country_id INT ( 11 ) NOT NULL AUTO_INCREMENT, countryname VARCHAR ( 100 ) NOT NULL, PRIMARY KEY ( country_id ) ) ENGINE = INNODB DEFAULT CHARSET = utf8;


insert into city(city_id,city_name,country_id)values(1,'西安',1);
insert into city(city_id,city_name,country_id)values(2,'NewYork',2);
insert into city(city_id,city_name,country_id)values(3,'北京',1);
insert into city(city_id,city_name,country_id)values(4,'上海',1);
insert into country(country_id,country_name)values(1,'China'); 
insert into country(country_id,country_name)values(2,'America'); 
insert into country(country_id,country_name)values(3,'Japan'); 
insert into country(country_id,country_name)values(4,'Uk');


2.5.1、创建索引


在MySQL中,该字段如果是主键,则默认存在该字段的索引


语法:


CREATE [UNIQUE | FULLTEXT | SPATIAL] INDEX index_name
[usING index_type]
on tb1_name(index_col_name,...)
index_col_name : column_name[(length)][ASC I DESc]


示例:为city表中的city_name字段创建索引;


create index idx_city_name on city(city_name);


2.5.2、查看索引


show index from table_name;


示例:查看city表中的索引信息;


show index from city;


2.5.3、删除索引


drop index idx_city_name on city;


2.5.4、ALTER 命令


1). alter table tb_name add primary key(column_list);


该语句添加一个主键,这意味着索引值必须是唯一的,且不能为NULL


2). alter table tb_name add unique index_name(column_list);


这条语句创建索引的值必须是唯一的(除了NULL外,NULL可能会出现多次)


3). alter table tb_name add index index_name(column_list);


添加普通索引,索引值可以出现多次。


4). alter table tb_name add fulltext index_name(column_list);


该语句指定了索引为FULLTEXT,用于全文索引


2.6、索引设计原则


索引的设计可以遵循一些已有的原则,创建索引的时候请尽量考虑符合这些原则,便于提升索引的使用效率,更高效的使用索引。


索引字段的选择,最佳候选列应当从where子句的条件中提取,如果where子句中的组合比较多,那么应当挑选最常用、过滤效果最好的列的组合


使用唯一索引,区分度越高,使用索引的效率越高。


索引可以有效的提升查询数据的效率,但索引数量不是多多益善,索引越多,维护索引的代价自然也就水涨船高。对于插入、更新、删除等DML操作比较频繁的表来说,索引过多,会引入相当高的维护代价,降低DML操作的效率,增加相应操作的时间消耗。另外索引过多的话,MySQL也会犯选择困难病,虽然最终仍然会找到一个可用的索引,但无疑提高了选择的代价。


使用短索引,索引创建之后也是使用硬盘来存储的,因此提升索引访问的I/O效率,也可以提升总体的访问效率。假如构成索引的字段总长度比较短,那么在给定大小的存储块内可以存储更多的索引值,相应的可以有效的提升MySQL访问索引的I/O效率。


利用最左前缀,N个列组合而成的组合索引,那么相当于是创建了N个索引,如果查询时where子句中使用了组成该索引的前几个字段,那么这条查询SQL可以利用组合索引来提升查询效率。


创建复合索引:


CREATE INDEX idx_name_email_status on tb_seller(NAME,email,STATUS);


就相当于


.对name 创建索引;

.对name,email创建了索引;

.对name,email,status 创建了索引;

相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
MySQL数据库入门学习
本课程通过最流行的开源数据库MySQL带你了解数据库的世界。 &nbsp; 相关的阿里云产品:云数据库RDS MySQL 版 阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务,提供容灾、备份、恢复、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼。 了解产品详情:&nbsp;https://www.aliyun.com/product/rds/mysql&nbsp;
目录
相关文章
|
1月前
|
NoSQL 算法 Redis
【Docker】(3)学习Docker中 镜像与容器数据卷、映射关系!手把手带你安装 MySql主从同步 和 Redis三主三从集群!并且进行主从切换与扩容操作,还有分析 哈希分区 等知识点!
Union文件系统(UnionFS)是一种**分层、轻量级并且高性能的文件系统**,它支持对文件系统的修改作为一次提交来一层层的叠加,同时可以将不同目录挂载到同一个虚拟文件系统下(unite several directories into a single virtual filesystem) Union 文件系统是 Docker 镜像的基础。 镜像可以通过分层来进行继承,基于基础镜像(没有父镜像),可以制作各种具体的应用镜像。
315 5
|
2月前
|
关系型数据库 MySQL 数据管理
Mysql基础学习day03-作业
本内容包含数据库建表语句及多表查询示例,涵盖内连接、外连接、子查询及聚合统计,适用于员工与部门数据管理场景。
68 1
|
2月前
|
SQL 关系型数据库 MySQL
Mysql基础学习day01
本课程为MySQL基础学习第一天内容,涵盖MySQL概述、安装、SQL简介及其分类(DDL、DML、DQL、DCL)、数据库操作(查询、创建、使用、删除)及表操作(创建、约束、数据类型)。适合初学者入门学习数据库基本概念和操作方法。
171 6
|
2月前
|
SQL 关系型数据库 MySQL
Mysql基础学习day02-作业
本教程介绍了数据库表的创建与管理操作,包括创建员工表、插入测试数据、删除记录、更新数据以及多种查询操作,涵盖了SQL语句的基本使用方法,适合初学者学习数据库操作基础。
82 0
|
2月前
|
SQL 关系型数据库 MySQL
Mysql基础学习day03
本课程为MySQL基础学习第三天内容,主要讲解多表关系与多表查询。内容涵盖物理外键与逻辑外键的区别、一对多、一对一及多对多关系的实现方式,以及内连接、外连接、子查询等多表查询方法,并通过具体案例演示SQL语句的编写与应用。
79 0
|
2月前
|
SQL 关系型数据库 MySQL
Mysql基础学习day01-作业
本教程包含三个数据库表的创建练习:学生表(student)要求具备主键、自增长、非空、默认值及唯一约束;课程表(course)定义主键、非空唯一字段及数值精度限制;员工表(employee)包含自增主键、非空字段、默认值、唯一电话号及日期时间类型字段。每个表的结构设计均附有详细SQL代码示例。
75 0
|
2月前
|
SQL 关系型数据库 MySQL
Mysql基础学习day02
本课程为MySQL基础学习第二天内容,涵盖数据定义语言(DDL)的表查询、修改与删除操作,以及数据操作语言(DML)的增删改查功能。通过具体SQL语句与实例演示,帮助学习者掌握MySQL表结构操作及数据管理技巧。
118 0
|
分布式计算 关系型数据库 MySQL
大数据-88 Spark 集群 案例学习 Spark Scala 案例 SuperWordCount 计算结果数据写入MySQL
大数据-88 Spark 集群 案例学习 Spark Scala 案例 SuperWordCount 计算结果数据写入MySQL
142 3
|
11月前
|
SQL 存储 关系型数据库
【MySQL基础篇】全面学习总结SQL语法、DataGrip安装教程
本文详细介绍了MySQL中的SQL语法,包括数据定义(DDL)、数据操作(DML)、数据查询(DQL)和数据控制(DCL)四个主要部分。内容涵盖了创建、修改和删除数据库、表以及表字段的操作,以及通过图形化工具DataGrip进行数据库管理和查询。此外,还讲解了数据的增、删、改、查操作,以及查询语句的条件、聚合函数、分组、排序和分页等知识点。
998 55
【MySQL基础篇】全面学习总结SQL语法、DataGrip安装教程
|
关系型数据库 MySQL Java
Django学习二:配置mysql,创建model实例,自动创建数据库表,对mysql数据库表已经创建好的进行直接操作和实验。
这篇文章是关于如何使用Django框架配置MySQL数据库,创建模型实例,并自动或手动创建数据库表,以及对这些表进行操作的详细教程。
475 0
Django学习二:配置mysql,创建model实例,自动创建数据库表,对mysql数据库表已经创建好的进行直接操作和实验。