Mysql合理建立索引,索引优化

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云数据库 RDS PostgreSQL,集群系列 2核4GB
简介: MySQL官方对索引的定义为:索引(Index)是帮助MySQL高效获取数据的数据结构。 我们可以简单理解为:快速查找排好序的一种数据结构。Mysql索引主要有两种结构:B+Tree索引和Hash索引。 索引就相当于字典前的目录,如果这个目录划分规划更好,那么我们找到想要的数据就会更方便,也就提高了查询的效率。

写在前面


在我们日常使用数据库的时候,肯定避免不了对数据库的优化。那么对数据库的优化又少了不索引的知识。 是的,建立索引能极大地提高查询的效率。那么你知道吗,如果合理建立索引,可以更大地榨出数据库的性能——也就等同于进一步提高查询效率。 写下这篇文章就是为了记录一下对索引的优化,合理建立索引。


什么是索引


MySQL官方对索引的定义为:索引(Index)是帮助MySQL高效获取数据的数据结构。 我们可以简单理解为:快速查找排好序的一种数据结构。Mysql索引主要有两种结构:B+Tree索引和Hash索引。 索引就相当于字典前的目录,如果这个目录划分规划更好,那么我们找到想要的数据就会更方便,也就提高了查询的效率。 索引的类型有:


  • normal:表示普通索引
  • unique:表示唯一的,不允许有重复值的索引
  • full textl: 表示全文搜索的索引,用于搜索很长一篇文章的时候,效果最好。

建立索引的场景


索引不是越多越好,因为每次更新、插入数据,就需要对索引文件进行变动,会减低该类型操作的执行效率。 如果建立索引的字段太多,影响就会很大。 所以我们只在合理的字段上建立索引


  • 在经常用来当查询条件(where,on,group by,order by)的字段上建立索引。
  • 在数据的维度比较大的字段上建立索引。
  • 对数据较小的列使用索引,可以使索引文件更小,同时内存中也可以装载更多的索引键。
  • 为较长的字符串使用前缀索引。比如数据的长度大部分是150个字节,我们只建立前100个字节的索引。


常见的可以用于建立索引的字段场景: ① 用户id 在订单表中的用户id字段上建立索引,根据用户id筛选订单,则会很快查询出用户的订单。 用户一般是在自己的后台查看订单,所以表中的其他用户数据与他无关,如果没有建立索引,每次查询都是全表扫描,则会很慢。(我们每个人在淘宝平台上占的订单比例都不到0.0001) ② 商品名 同上,如果不建立索引,我们在淘宝输入框搜索键盘,怎么快速查询出键盘商品? ③ 日期 常用的活跃数据,一般都是是最近产生的,很少人没事去翻半年前的订单数据吧? 合适的还有很多很多场景,需要各位小伙伴自己好好思量。


索引不生效的场景


并不是建立了索引就在查询语句中生效

  • 当语句中带有or的时候,索引会失效
  • 当索引的字段使用like查询,并且使用了前通配比如%Siam,索引失效。后通配会生效Siam%
  • 当索引的字段是字符类型,但是储存的值是数字,比如 user_name:’123456’,在查询语句中要 user_name = ‘123456’而不能 user_name = 123456 否则发生类型转换,索引失效,其他类型的字段 比如日期等 也同理
  • 当使用的条件语句,预计结果数量超过全表数据的一定比例时,会转为全表扫描(mysql一般是30%左右)这就是为什么在建立索引的时候要选择维度(区别度)比较高的列,性别这种字段不适合建立索引。
  • 语句中出现列数据运算才判断的,比如where age - 10 > 0 每一行都要运算之后才知道是否大于0 所以就是全表扫描,如果age > 10 则可使用索引。使用函数转换列数据也一样原理。
  • 组合索引时使用的条件语句。


上面举例的一些场景都是比较容易理解的。组合索引还没涉及,往下继续介绍。


mysql中,多个索引同时使用?


先来看一条语句


select * from test where user_name = 'siam_007' and create_time = 1563280050


假设在这个表中,user_name字段和create_time都是建立了索引的。也没有发生数据类型转换等情况。


问题:该语句有几个索引生效?


是2个吗?并不是这样子的。 虽然两个字段的索引都没有问题,如果单独使用也都能生效。 但是:MySQL会从可用的索引中猜测出效率最高的一个索引并使用它 怎么证明?使用explain语句(详解可以在网上其他资料找到) 只要在sql语句最前面加上该语法,则会显示查询类型相关的信息。


Explain select * from mysql_index_test where user_name = 'siam_007' and create_time = 1563280050


41e60766824cbab658d4b5f45334be3b.png


我建立了两个索引,都能用,都是本次查询只能使用一个。


基于这个情况,会引申出两个知识点


  • 组合索引
  • 多个单字段索引冲突


组合索引


先来说说组合索引吧,我们在新建索引的时候(可视化软件),是这样子的页面


5ca5a6b5b08ff87b5d44efcfb1712d17.png


当我们勾选上2个或者2个以上 就能把它叫为组合索引了 可以看到还有调整顺序的功能 在组合索引中,字段顺序也是极为重要的。 假设我们有这样一个索引:new : a,b,c 字段 在查询时使用where a = 1 and b = 2 and c= 3。那么这个语句肯定是生效的。 如果我们使用where b = 2 and c =3没有a条件 而a又是在组合索引中最左侧的,那么索引就不会生效。 还是要扫描全部行 where a,c where a,b where b,a,c 这样子使用都是可以生效的。 组合索引要注意字段顺序,是指在创建索引时候的排序,而不是sql语句中where的顺序,我们使用where b = 2 and a = 1 and c = 3也是 可以生效的 那么组合索引的字段顺序要如何排比较好? 后面会有新的一篇文章会讲这个


多个单字段索引冲突


如果我们在表中,拥有两个索引,比如user_name 用户名, user_phone 用户手机号 现在有这样子的数据量: 100W条数据 user_name=’我是用户名’ 100条数据 user_phone=’110’ 5条数据 user_name=’我是用户名’ and user_phone=’110’ 假设有这样子一条语句:


select * from test where user_name = '我是用户名' and user_phone='110'


有两个字段都有索引可用,mysql会选择一个使用。这是属于mysql的内部处理判断 正常情况下,如果用user_phone索引生效的话,会很快得到结果(先筛选出100条 再筛选) 如果user_name生效,则要先筛选100W条数据,再筛选user_phone mysql的内部判断可能使得user_name索引生效,此时效率就会很低了,我们可以强制使用某个索引 phone是索引名 是新建的时候填的


select * from test index(phone) where user_name = '我是用户名' and user_phone='110'


此种情况出现的概率比较小,毕竟mysql的解释器很复杂,也做了足够多的优化。只有排查慢日志并且分析确定索引冲突的情况才需要强制使用索引。


优化 (总结)


  • 只在经常使用的字段上建立索引,否则会拖慢数据更新和插入的速度。
  • 只在维度高的字段上建立索引,否则会使得数据比例过大,转为全表扫描。
  • 优先对数据量比较小的字段建立索引,可以使索引文件更小,同时内存中也可以装载更多的索引键。
  • 规范sql语句的生成,禁止发生列运算类型转换的发生。
  • 长字符串可以使用前缀索引,只对字符串的前面一定字符长度建立索引。
  • 组合索引的顺序合理优化(会有新文章介绍)
  • 当多个单字段索引发生冲突时,强制使用某个索引。
相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
7天前
|
缓存 关系型数据库 MySQL
MySQL索引策略与查询性能调优实战
在实际应用中,需要根据具体的业务需求和查询模式,综合运用索引策略和查询性能调优方法,不断地测试和优化,以提高MySQL数据库的查询性能。
|
8天前
|
SQL 关系型数据库 MySQL
大厂面试官:聊下 MySQL 慢查询优化、索引优化?
MySQL慢查询优化、索引优化,是必知必备,大厂面试高频,本文深入详解,建议收藏。关注【mikechen的互联网架构】,10年+BAT架构经验分享。
大厂面试官:聊下 MySQL 慢查询优化、索引优化?
|
29天前
|
存储 关系型数据库 MySQL
阿里面试:为什么要索引?什么是MySQL索引?底层结构是什么?
尼恩是一位资深架构师,他在自己的读者交流群中分享了关于MySQL索引的重要知识点。索引是帮助MySQL高效获取数据的数据结构,主要作用包括显著提升查询速度、降低磁盘I/O次数、优化排序与分组操作以及提升复杂查询的性能。MySQL支持多种索引类型,如主键索引、唯一索引、普通索引、全文索引和空间数据索引。索引的底层数据结构主要是B+树,它能够有效支持范围查询和顺序遍历,同时保持高效的插入、删除和查找性能。尼恩还强调了索引的优缺点,并提供了多个面试题及其解答,帮助读者在面试中脱颖而出。相关资料可在公众号【技术自由圈】获取。
|
12天前
|
SQL 关系型数据库 MySQL
MySQL慢查询优化、索引优化、以及表等优化详解
本文详细介绍了MySQL优化方案,包括索引优化、SQL慢查询优化和数据库表优化,帮助提升数据库性能。关注【mikechen的互联网架构】,10年+BAT架构经验倾囊相授。
MySQL慢查询优化、索引优化、以及表等优化详解
|
16天前
|
缓存 监控 关系型数据库
如何优化MySQL查询速度?
如何优化MySQL查询速度?【10月更文挑战第31天】
44 3
|
19天前
|
缓存 关系型数据库 MySQL
如何优化 MySQL 数据库的性能?
【10月更文挑战第28天】
43 1
|
26天前
|
NoSQL 关系型数据库 MySQL
MySQL与Redis协同作战:百万级数据统计优化实践
【10月更文挑战第21天】 在处理大规模数据集时,传统的单体数据库解决方案往往力不从心。MySQL和Redis的组合提供了一种高效的解决方案,通过将数据库操作与高速缓存相结合,可以显著提升数据处理的性能。本文将分享一次实际的优化案例,探讨如何利用MySQL和Redis共同实现百万级数据统计的优化。
68 9
|
20天前
|
监控 关系型数据库 MySQL
数据库优化:MySQL索引策略与查询性能调优实战
【10月更文挑战第27天】本文深入探讨了MySQL的索引策略和查询性能调优技巧。通过介绍B-Tree索引、哈希索引和全文索引等不同类型,以及如何创建和维护索引,结合实战案例分析查询执行计划,帮助读者掌握提升查询性能的方法。定期优化索引和调整查询语句是提高数据库性能的关键。
97 1
|
26天前
|
NoSQL 关系型数据库 MySQL
MySQL与Redis协同作战:优化百万数据查询的实战经验
【10月更文挑战第13天】 在处理大规模数据集时,传统的关系型数据库如MySQL可能会遇到性能瓶颈。为了提升数据处理的效率,我们可以结合使用MySQL和Redis,利用两者的优势来优化数据查询。本文将分享一次实战经验,探讨如何通过MySQL与Redis的协同工作来优化百万级数据统计。
56 5
|
1月前
|
存储 关系型数据库 MySQL
如何在MySQL中进行索引的创建和管理?
【10月更文挑战第16天】如何在MySQL中进行索引的创建和管理?
63 1
下一篇
无影云桌面