Mysql合理建立索引,索引优化

本文涉及的产品
云数据库 RDS MySQL Serverless,0.5-2RCU 50GB
简介: MySQL官方对索引的定义为:索引(Index)是帮助MySQL高效获取数据的数据结构。 我们可以简单理解为:快速查找排好序的一种数据结构。Mysql索引主要有两种结构:B+Tree索引和Hash索引。 索引就相当于字典前的目录,如果这个目录划分规划更好,那么我们找到想要的数据就会更方便,也就提高了查询的效率。

写在前面


在我们日常使用数据库的时候,肯定避免不了对数据库的优化。那么对数据库的优化又少了不索引的知识。 是的,建立索引能极大地提高查询的效率。那么你知道吗,如果合理建立索引,可以更大地榨出数据库的性能——也就等同于进一步提高查询效率。 写下这篇文章就是为了记录一下对索引的优化,合理建立索引。


什么是索引


MySQL官方对索引的定义为:索引(Index)是帮助MySQL高效获取数据的数据结构。 我们可以简单理解为:快速查找排好序的一种数据结构。Mysql索引主要有两种结构:B+Tree索引和Hash索引。 索引就相当于字典前的目录,如果这个目录划分规划更好,那么我们找到想要的数据就会更方便,也就提高了查询的效率。 索引的类型有:


  • normal:表示普通索引
  • unique:表示唯一的,不允许有重复值的索引
  • full textl: 表示全文搜索的索引,用于搜索很长一篇文章的时候,效果最好。

建立索引的场景


索引不是越多越好,因为每次更新、插入数据,就需要对索引文件进行变动,会减低该类型操作的执行效率。 如果建立索引的字段太多,影响就会很大。 所以我们只在合理的字段上建立索引


  • 在经常用来当查询条件(where,on,group by,order by)的字段上建立索引。
  • 在数据的维度比较大的字段上建立索引。
  • 对数据较小的列使用索引,可以使索引文件更小,同时内存中也可以装载更多的索引键。
  • 为较长的字符串使用前缀索引。比如数据的长度大部分是150个字节,我们只建立前100个字节的索引。


常见的可以用于建立索引的字段场景: ① 用户id 在订单表中的用户id字段上建立索引,根据用户id筛选订单,则会很快查询出用户的订单。 用户一般是在自己的后台查看订单,所以表中的其他用户数据与他无关,如果没有建立索引,每次查询都是全表扫描,则会很慢。(我们每个人在淘宝平台上占的订单比例都不到0.0001) ② 商品名 同上,如果不建立索引,我们在淘宝输入框搜索键盘,怎么快速查询出键盘商品? ③ 日期 常用的活跃数据,一般都是是最近产生的,很少人没事去翻半年前的订单数据吧? 合适的还有很多很多场景,需要各位小伙伴自己好好思量。


索引不生效的场景


并不是建立了索引就在查询语句中生效

  • 当语句中带有or的时候,索引会失效
  • 当索引的字段使用like查询,并且使用了前通配比如%Siam,索引失效。后通配会生效Siam%
  • 当索引的字段是字符类型,但是储存的值是数字,比如 user_name:’123456’,在查询语句中要 user_name = ‘123456’而不能 user_name = 123456 否则发生类型转换,索引失效,其他类型的字段 比如日期等 也同理
  • 当使用的条件语句,预计结果数量超过全表数据的一定比例时,会转为全表扫描(mysql一般是30%左右)这就是为什么在建立索引的时候要选择维度(区别度)比较高的列,性别这种字段不适合建立索引。
  • 语句中出现列数据运算才判断的,比如where age - 10 > 0 每一行都要运算之后才知道是否大于0 所以就是全表扫描,如果age > 10 则可使用索引。使用函数转换列数据也一样原理。
  • 组合索引时使用的条件语句。


上面举例的一些场景都是比较容易理解的。组合索引还没涉及,往下继续介绍。


mysql中,多个索引同时使用?


先来看一条语句


select * from test where user_name = 'siam_007' and create_time = 1563280050


假设在这个表中,user_name字段和create_time都是建立了索引的。也没有发生数据类型转换等情况。


问题:该语句有几个索引生效?


是2个吗?并不是这样子的。 虽然两个字段的索引都没有问题,如果单独使用也都能生效。 但是:MySQL会从可用的索引中猜测出效率最高的一个索引并使用它 怎么证明?使用explain语句(详解可以在网上其他资料找到) 只要在sql语句最前面加上该语法,则会显示查询类型相关的信息。


Explain select * from mysql_index_test where user_name = 'siam_007' and create_time = 1563280050


41e60766824cbab658d4b5f45334be3b.png


我建立了两个索引,都能用,都是本次查询只能使用一个。


基于这个情况,会引申出两个知识点


  • 组合索引
  • 多个单字段索引冲突


组合索引


先来说说组合索引吧,我们在新建索引的时候(可视化软件),是这样子的页面


5ca5a6b5b08ff87b5d44efcfb1712d17.png


当我们勾选上2个或者2个以上 就能把它叫为组合索引了 可以看到还有调整顺序的功能 在组合索引中,字段顺序也是极为重要的。 假设我们有这样一个索引:new : a,b,c 字段 在查询时使用where a = 1 and b = 2 and c= 3。那么这个语句肯定是生效的。 如果我们使用where b = 2 and c =3没有a条件 而a又是在组合索引中最左侧的,那么索引就不会生效。 还是要扫描全部行 where a,c where a,b where b,a,c 这样子使用都是可以生效的。 组合索引要注意字段顺序,是指在创建索引时候的排序,而不是sql语句中where的顺序,我们使用where b = 2 and a = 1 and c = 3也是 可以生效的 那么组合索引的字段顺序要如何排比较好? 后面会有新的一篇文章会讲这个


多个单字段索引冲突


如果我们在表中,拥有两个索引,比如user_name 用户名, user_phone 用户手机号 现在有这样子的数据量: 100W条数据 user_name=’我是用户名’ 100条数据 user_phone=’110’ 5条数据 user_name=’我是用户名’ and user_phone=’110’ 假设有这样子一条语句:


select * from test where user_name = '我是用户名' and user_phone='110'


有两个字段都有索引可用,mysql会选择一个使用。这是属于mysql的内部处理判断 正常情况下,如果用user_phone索引生效的话,会很快得到结果(先筛选出100条 再筛选) 如果user_name生效,则要先筛选100W条数据,再筛选user_phone mysql的内部判断可能使得user_name索引生效,此时效率就会很低了,我们可以强制使用某个索引 phone是索引名 是新建的时候填的


select * from test index(phone) where user_name = '我是用户名' and user_phone='110'


此种情况出现的概率比较小,毕竟mysql的解释器很复杂,也做了足够多的优化。只有排查慢日志并且分析确定索引冲突的情况才需要强制使用索引。


优化 (总结)


  • 只在经常使用的字段上建立索引,否则会拖慢数据更新和插入的速度。
  • 只在维度高的字段上建立索引,否则会使得数据比例过大,转为全表扫描。
  • 优先对数据量比较小的字段建立索引,可以使索引文件更小,同时内存中也可以装载更多的索引键。
  • 规范sql语句的生成,禁止发生列运算类型转换的发生。
  • 长字符串可以使用前缀索引,只对字符串的前面一定字符长度建立索引。
  • 组合索引的顺序合理优化(会有新文章介绍)
  • 当多个单字段索引发生冲突时,强制使用某个索引。
相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
15天前
|
关系型数据库 MySQL 索引
mysql 分析5语句的优化--索引添加删除
mysql 分析5语句的优化--索引添加删除
12 0
|
21天前
|
存储 关系型数据库 MySQL
轻松入门MySQL:数据库设计之范式规范,优化企业管理系统效率(21)
轻松入门MySQL:数据库设计之范式规范,优化企业管理系统效率(21)
|
21天前
|
存储 SQL 关系型数据库
轻松入门MySQL:加速进销存!利用MySQL存储过程轻松优化每日销售统计(15)
轻松入门MySQL:加速进销存!利用MySQL存储过程轻松优化每日销售统计(15)
|
21天前
|
存储 关系型数据库 MySQL
轻松入门MySQL:优化进销存管理,掌握MySQL索引,提升系统效率(11)
轻松入门MySQL:优化进销存管理,掌握MySQL索引,提升系统效率(11)
|
15天前
|
SQL 缓存 关系型数据库
mysql性能优化-慢查询分析、优化索引和配置
mysql性能优化-慢查询分析、优化索引和配置
80 1
|
21天前
|
存储 关系型数据库 MySQL
MySQL数据库性能大揭秘:表设计优化的高效策略(优化数据类型、增加冗余字段、拆分表以及使用非空约束)
MySQL数据库性能大揭秘:表设计优化的高效策略(优化数据类型、增加冗余字段、拆分表以及使用非空约束)
|
21天前
|
缓存 关系型数据库 MySQL
MySQL查询优化:提速查询效率的13大秘籍(合理使用索引合并、优化配置参数、使用分区优化性能、避免不必要的排序和group by操作)(下)
MySQL查询优化:提速查询效率的13大秘籍(合理使用索引合并、优化配置参数、使用分区优化性能、避免不必要的排序和group by操作)(下)
|
1天前
|
SQL Oracle 关系型数据库
下次老板问你MySQL如何优化时,你可以这样说,老板默默给你加工资
现在进入国企或者事业单位做技术的网友越来越多了,随着去O的力度越来越大,很多国企单位都开始从Oracle向MySQL转移,相对于Oracle而言,MySQL最大的问题就是性能,所以,这个时候,在公司如果能够处理好MySQL的性能瓶颈,那么你也就很容易从人群中脱颖而出,受到老板的青睐。
16 1
|
9天前
|
SQL 关系型数据库 数据库
【后端面经】【数据库与MySQL】SQL优化:如何发现SQL中的问题?
【4月更文挑战第12天】数据库优化涉及硬件升级、操作系统调整、服务器/引擎优化和SQL优化。SQL优化目标是减少磁盘IO和内存/CPU消耗。`EXPLAIN`命令用于检查SQL执行计划,关注`type`、`possible_keys`、`key`、`rows`和`filtered`字段。设计索引时考虑外键、频繁出现在`where`、`order by`和关联查询中的列,以及区分度高的列。大数据表改结构需谨慎,可能需要停机、低峰期变更或新建表。面试中应准备SQL优化案例,如覆盖索引、优化`order by`、`count`和索引提示。优化分页查询时避免大偏移量,可利用上一批的最大ID进行限制。
34 3
|
12天前
|
存储 关系型数据库 MySQL
【MySQL实战笔记】 04 | 深入浅出索引(上)-02
【4月更文挑战第9天】InnoDB数据库使用B+树作为索引模型,其中主键索引的叶子节点存储完整行数据,非主键索引则存储主键值。主键查询只需搜索一棵树,而非主键查询需两次搜索,因此推荐使用主键查询以提高效率。在插入新值时,B+树需要维护有序性,可能导致数据页分裂影响性能。自增主键在插入时可避免数据挪动和页分裂,且占用存储空间小,通常更为理想。然而,如果场景仅需唯一索引,可直接设为主键以减少查询步骤。
13 1
【MySQL实战笔记】 04 | 深入浅出索引(上)-02