mysql--索引 (查询)

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS PostgreSQL,集群系列 2核4GB
简介:

什么是索引

  • 如果没有索引,扫描的记录数大于有索引的记录数

  • 索引存放索引列的值(比如id为索引列,那么存放索引列的值),和该索引值对应的行在内存中的地址(或者直接存储该行的数据)

  • SELECT * FROM user WHERE username= 'jiajun' ,username建立索引,如果索引采用的数据结构是hash表,那么这个时候,通过计算jiajun的hash值,O(1)复杂度就可以找到该记录的位置

hash索引

  • 在等值查找下,此时无hash冲突,这种情况下,效率是很高的

  • 但是在范围查找下,由于hash不是有序的,那么范围查找下,hash表的优势并不能发挥出来。

  • 在hash冲突下,查找效率会降下来

磁盘读取

  • 磁盘读取步骤:定柱面,定磁道,定磁块

  • 磁盘时间主要消耗在定位柱面,那么如果要提高速度,在数据量一样的情况下,将尽量多的数据放在磁盘块上,那么这样可以减少磁头定位柱面移动的次数,减少IO的次数。

二叉查找树

  • 左子树所有的节点的值小于他的根节点的值

  • 右子树所有的节点的值大于他的根节点的值

  • 任意节点的左子树和右子树都是二叉查找树

  • 没有键值相等的节点

900751-20170801104347974-847682171.jpg

分析

  • 二叉查找树的查找的复杂度到了lgn

  • 但是有没有办法减少IO的次数,也就是能不能降低树的高度

B-树

(m阶树 m/2<=k<=m)

  • 根节点至少两个子节点

  • 所有叶子节点都在同一层

  • 中间节点包含k-1个元素和k个孩子

  • 节点中的元素从小到大排列

  • 每个节点即包含索引列的值,和该数据记录(或该数据记录的值)

900751-20170801104407990-1215444102.png

分析

  • 相对于二叉查找树,B树变得矮胖,因为每个节点存放的元素更多,所以相同元素情况下,降低了树的高度,那么就可以减少IO的次数

  • 每个节点存放了数据(该行记录的值或者该行记录在内存的地址),所以不同的查询性能是不一样的。

B+树

  • 在B-树的基础上

  • 除了叶子结点,其他节点不包含记录(数据库中的行)的位置

  • 叶子节点包含了所有的索引值,并且从小到大排列,以及记录(数据库中行)的位置

900751-20170801104426755-509747057.jpg

分析

  • 如果节点的大小一样,那么如果我们除了叶节点之外,其他节点不包含数据,那么就可以放更多的元素(索引值),这样的话这棵树就变的更加矮胖,那么IO的次数可以进一步减少

  • 因为叶节点的元素是顺序排列,而且叶节点间形成链表,那么有序查找时提高范围查询的效率

  • 相对于B树,由于所有的数据是存放在叶节点,那么意味着每次查找都必须到从根查找到叶节点,那么这就意味着查询性能平均。

总结

  • 索引是一种数据,可以避免了全表查询,可以类比目录和书。

  • 索引需要一种数据结构来存储

  • 利用散列表(hash)的方式查询复杂度可以到O(1),但是再范围查询时,hash起不了提高性能的作用

  • IO操作是耗时,为了提高查询性能,可以减少IO的次数

  • 对于树的存储结构来说,为了提高性能,减少IO的次数,可以低树的高度

  • 读取一个节点一次IO,在数据量一样的情况下,如果每个节点的能存放更多元素,那么就可以降低树的高度。

  • B树降低了树的高度,而在节点大小一样的情况下,因为B树的节点存放了元素有又存放了数据,而B+树将数据全部存放在叶节点,那么这样的话,每个节点可以存放更多的元素,那么就可以再一次降低树的高度

  • B+树的查询性能更加稳定,并且更有利于范围查找

  • 如果是聚集索引(InnoDB引擎),那么节点存放的该记录的数据,数据文件本身就是索引文件

  • 如果是非聚集索引(MyISAM引擎),那么节点存放的是该行记录的地址。索引文件和数据文件是分离

索引的种类

  • 普通索引,允许出现相同的内容

  • 唯一索引,索引值唯一,允许空值

  • 主键索引,创建主键的时候自动创建主键索引,唯一并且不能为空

  • 组合索引,多列组合索引

索引的使用

  • ALTER TABLE table_name ADD INDEX index_name (column_list) 增加普通索引

  • ALTER TABLE table_name ADD UNIQUE (column_list) 增加唯一索引

  • ALTER TABLE table_name ADD PRIMARY KEY (column_list) 增加主键索引

注意点

  • 如果此时为 username,age,sex建联合索引

  • 最左匹配指优先匹配最左索引,(username)(username,age)(username,age,sex),只要查询条件用到最左边的列,一般就会使用索引。顺序可以不同,比如(age,username),这是查询优化器的功劳。

  • 模糊查询只有%号不在第一个字符,索引才可能被使用,比如username like '%jiajun'所以不被采用

  • 如果or中有一个条件没有索引,sql语句不会用到索引,比如usernmae ='jiajun' or pwd='666',此时索引不被采用

  • 组合索引中,如果查询条件不是索引的第一列,索引可能不会被采用,比如此时where age =1

  • 如果列是字符型,比如username是字符型而且是索引列,如果此是查询username=1 ,没有加引号,那么这个时候也不会用索引

  • 可以用 show status like 'Handler_read%' 来查看索引使用情况。

  • 建议实践为主

索引原则

  • 索引应该设计在where后的列,而不是select后的列

  • 索引应该建在区分度大的列,比如状态只有1 和2就没必要建索引了

  • 对字符串进行索引的时候,应该制定一个前缀长度,比如一个列为char(200),如果前面几个字符就要较大区分度,那么对前几个字符建立索引就行了,这样减少了占用空间,也提高了速度

  • 不要创建太多索引,索引会占空间,而且更新的时候会降低速度,并且如果有过多的索引,Mysql执行计划的时候,会考虑各个索引,这也会浪费时间

索引优缺点

  • 毫无疑问,在使用正确的情况下,索引能提高查询速度

  • 索引也能提高分组和排序的速度

  • 由于修改删除添加时,要调维护索引文件,对树进行调整,所以性能降低了

  • 索引文件也是需要占用空间的



本文转自 杰思 51CTO博客,原文链接:http://blog.51cto.com/12700807/1953226

相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
2天前
|
SQL 关系型数据库 MySQL
深入解析MySQL的EXPLAIN:指标详解与索引优化
MySQL 中的 `EXPLAIN` 语句用于分析和优化 SQL 查询,帮助你了解查询优化器的执行计划。本文详细介绍了 `EXPLAIN` 输出的各项指标,如 `id`、`select_type`、`table`、`type`、`key` 等,并提供了如何利用这些指标优化索引结构和 SQL 语句的具体方法。通过实战案例,展示了如何通过创建合适索引和调整查询语句来提升查询性能。
32 9
|
1月前
|
缓存 关系型数据库 MySQL
MySQL索引策略与查询性能调优实战
在实际应用中,需要根据具体的业务需求和查询模式,综合运用索引策略和查询性能调优方法,不断地测试和优化,以提高MySQL数据库的查询性能。
|
7天前
|
缓存 关系型数据库 MySQL
MySQL 索引优化以及慢查询优化
通过本文的介绍,希望您能够深入理解MySQL索引优化和慢查询优化的方法,并在实际应用中灵活运用这些技术,提升数据库的整体性能。
46 18
|
2天前
|
SQL 关系型数据库 MySQL
MySQL 窗口函数详解:分析性查询的强大工具
MySQL 窗口函数从 8.0 版本开始支持,提供了一种灵活的方式处理 SQL 查询中的数据。无需分组即可对行集进行分析,常用于计算排名、累计和、移动平均值等。基本语法包括 `function_name([arguments]) OVER ([PARTITION BY columns] [ORDER BY columns] [frame_clause])`,常见函数有 `ROW_NUMBER()`, `RANK()`, `DENSE_RANK()`, `SUM()`, `AVG()` 等。窗口框架定义了计算聚合值时应包含的行。适用于复杂数据操作和分析报告。
33 11
|
6天前
|
缓存 关系型数据库 MySQL
MySQL 索引优化以及慢查询优化
通过本文的介绍,希望您能够深入理解MySQL索引优化和慢查询优化的方法,并在实际应用中灵活运用这些技术,提升数据库的整体性能。
17 7
|
5天前
|
缓存 关系型数据库 MySQL
MySQL 索引优化与慢查询优化:原理与实践
通过本文的介绍,希望您能够深入理解MySQL索引优化与慢查询优化的原理和实践方法,并在实际项目中灵活运用这些技术,提升数据库的整体性能。
25 5
|
6天前
|
存储 关系型数据库 MySQL
mysql怎么查询longblob类型数据的大小
通过本文的介绍,希望您能深入理解如何查询MySQL中 `LONG BLOB`类型数据的大小,并结合优化技术提升查询性能,以满足实际业务需求。
33 6
|
9天前
|
存储 关系型数据库 MySQL
Mysql索引:深入理解InnoDb聚集索引与MyisAm非聚集索引
通过本文的介绍,希望您能深入理解InnoDB聚集索引与MyISAM非聚集索引的概念、结构和应用场景,从而在实际工作中灵活运用这些知识,优化数据库性能。
54 7
|
24天前
|
关系型数据库 MySQL Java
MySQL索引优化与Java应用实践
【11月更文挑战第25天】在大数据量和高并发的业务场景下,MySQL数据库的索引优化是提升查询性能的关键。本文将深入探讨MySQL索引的多种类型、优化策略及其在Java应用中的实践,通过历史背景、业务场景、底层原理的介绍,并结合Java示例代码,帮助Java架构师更好地理解并应用这些技术。
24 2
|
1月前
|
SQL 前端开发 关系型数据库
SpringBoot使用mysql查询昨天、今天、过去一周、过去半年、过去一年数据
SpringBoot使用mysql查询昨天、今天、过去一周、过去半年、过去一年数据
60 9