MySQL 高频面试题目(3)

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云数据库 RDS MySQL,高可用系列 2核4GB
简介: MySQL 高频面试题目(3)

五、为什么不用红黑树?

红黑树也是BST,但是不是严格平衡的,通过变色和旋转来保持平衡。

必须满足5个约束:

1,节点分为红色或者黑色。

2,根节点必须是黑色的

3,叶子节点都是黑色的NULL节点

4,红色节点的两个子节点都是黑色(不允许两个相邻的红色节点)

5,从任意节点出发,到其每个叶子节点的路径包含相同数量的黑色节点


基于以上规则可以推导出:

从根节点到叶子节点的最长路径(红黑相间的路径)不大于最短路径(全节点的二倍)

为什么不用红黑树?1,只有两路 2,不够平衡


红黑树一般只放在内存里边用,例如:java的TreeMap,它可以用来实现一致性哈希。


六、MySQL中索引的数据结构——B树索引和Hash索引

Hash索引:以KV的形式检索数据,也就是说,它会根据索引字段生成hash码,指针指向数据(memory存储引擎可以使用Hash索引)


image.png


Hash索引的优点:(1) 时间复杂度O(1),查询速度比较快,因为Hash索引里边的顺序存储,所以不能用于排序。

(2)查询数据的时候要根据键值计算哈希吗,所以它只能支持等值查询,不支持范围查询,和排序,在有大量重复键值情况下,哈希索引的效率是极低的,因为存在所谓的哈希碰撞问题。


B+树索引


MyISAM: 其中包含三个配置文件 frm 表的结构和定义信息,myd 表的数据,myi 表的索引


image.png


MyISAM的B+Tree里边,叶子节点村粗的是数据文件对应额磁盘地址,所以从索引文件.MYI中找到键值后,会到数据文件.MYD中获取相应的数据记录。


image.png


非主键索引和主键索引数据的方式是没有任何区别的,一样是在索引文件中找到磁盘地址,然后到数据文件里边获取数据。


image.png


InnoDB:


image.png


在InnoDB的某个索引的叶子节点上,它直接存储了我们的数据。所以,在InnoDB中索引即数据,就是这个原因。


聚集索引的概念:就是索引键值的逻辑顺序跟表数据行的物理存储顺序是一直的。

InnoDB组织数据的方式就是(聚集)索引组织表(clustered index organize table)。如果一张表创建了主键索引,那么这个主键索引就是聚集索引,决定数据行的物理存储顺序。


image.png


InnoDB中,主键索引和辅助索引有主次之分,如果主键有索引,那么主键索引就是聚集索引。其他的索引统一叫做“二级索引”(secondary index)。


二级索引检索数据的流程是这样的:

当我们用Name索引查询一条纪律,它会在二级索引的叶子节点找到了Name=qingshan,拿到了主键值,也就是Id=1,然后再到主键索引的叶子节点拿到数据。为什么不存地址而是存储键值?因为地址会变化。


从这个角度来讲,因为主键索引比二级索引少扫描了一颗B+ Tree(避免了回表,),它的速度会快一点。


七、主键索引的选取与加索引的技巧

主键索引的选取:

1,如果我们定义了主键(Primary key ),那么InnoDB会选择主键作为聚集索引。

2,如果没有显示定义主键,则InnoDB会选择第一个不包含NULL值的唯一索引作为主键索引。

3,如果也没有这样额唯一索引,则InnoDB会选择内置6自己长的RowID作为隐藏的聚集索引,他会随着行记录的写入而主键递增。


加索引的一些技巧:

1,列的离散度,(列的全部不同值)/所有数据的比例 简单的说列的重复值越多,离散度就越低;重复值越少,离散度就越高。 对于离散度高的,即使加了索引,查询消耗的时间更多了,在B+ Tree里边的重复值太多,MySQL的优化器发现走索引跟使用全表扫描差不多的时候,就算建了索引,也不一定会走索引。

对于离散度低的字段,不建议加索引

2,联合索引最左匹配

当我们创建三个字段的索引Index (name,age,address),相当于创建了三个索引:

Index(a)

Index(a,b)

Index(a,b,c)


3,覆盖索引

回表: 非主键索引先通过索引找到主键索引的值,再通过主键值查询索引里边没有的数据,它比基于主键索引的查询多扫描了一棵索引树,这个过程就叫回表。


在二级索引里边,不管是单列索引还是联合索引,如果select的数据列只用从索引中就能够取得,不必从数据区中读取,这时候使用的索引就叫做覆盖索引,这样就避免了回表。

因为覆盖索引减少了IO次数,减少了数据的访问量,可以大大地提升查询效率。


4,索引条件下推

索引条件下推(Index Condition Pushdown),5.6以后完善的功能,只适用于二级索引。ICP的目标是减少访问表的完整行的读数量从而减少I/O操作。


将 Index Filter 从 Server 层 Push Down 到了引擎层,减少了因回表产生的磁盘 I/O,也减少了与 Server 层的交互,提高了 SQL 执行效率


举一个例子:

Select * from student where age=22 and name like %明


对于MySQL 5.6之前,能够根据age=22能够查询出数据,name like %明 根据最左匹配原则索引无效,所以查询过程是这样的

(1)根据联合索引查出所有姓名wang的二级索引数据(3个主键值:)

(2)回表,到主键索引上查询所有符合条件的数据

(3)把这三条数据返回server层,在Server层过滤出以zi结尾的员工。


image.png


ICP是默认开启的,也就是说针对二级索引,只要能把条件下推给存储引擎,它就会下推,不需要我们干预。


image.png


image.png

相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
23天前
|
存储 SQL 关系型数据库
MySQL进阶突击系列(03) MySQL架构原理solo九魂17环连问 | 给大厂面试官的一封信
本文介绍了MySQL架构原理、存储引擎和索引的相关知识点,涵盖查询和更新SQL的执行过程、MySQL各组件的作用、存储引擎的类型及特性、索引的建立和使用原则,以及二叉树、平衡二叉树和B树的区别。通过这些内容,帮助读者深入了解MySQL的工作机制,提高数据库管理和优化能力。
|
2月前
|
SQL 关系型数据库 MySQL
大厂面试官:聊下 MySQL 慢查询优化、索引优化?
MySQL慢查询优化、索引优化,是必知必备,大厂面试高频,本文深入详解,建议收藏。关注【mikechen的互联网架构】,10年+BAT架构经验分享。
大厂面试官:聊下 MySQL 慢查询优化、索引优化?
|
3月前
|
存储 关系型数据库 MySQL
阿里面试:为什么要索引?什么是MySQL索引?底层结构是什么?
尼恩是一位资深架构师,他在自己的读者交流群中分享了关于MySQL索引的重要知识点。索引是帮助MySQL高效获取数据的数据结构,主要作用包括显著提升查询速度、降低磁盘I/O次数、优化排序与分组操作以及提升复杂查询的性能。MySQL支持多种索引类型,如主键索引、唯一索引、普通索引、全文索引和空间数据索引。索引的底层数据结构主要是B+树,它能够有效支持范围查询和顺序遍历,同时保持高效的插入、删除和查找性能。尼恩还强调了索引的优缺点,并提供了多个面试题及其解答,帮助读者在面试中脱颖而出。相关资料可在公众号【技术自由圈】获取。
|
2月前
|
SQL 缓存 关系型数据库
美团面试:Mysql 有几级缓存? 每一级缓存,具体是什么?
在40岁老架构师尼恩的读者交流群中,近期有小伙伴因未能系统梳理MySQL缓存机制而在美团面试中失利。为此,尼恩对MySQL的缓存机制进行了系统化梳理,包括一级缓存(InnoDB缓存)和二级缓存(查询缓存)。同时,他还将这些知识点整理进《尼恩Java面试宝典PDF》V175版本,帮助大家提升技术水平,顺利通过面试。更多技术资料请关注公号【技术自由圈】。
美团面试:Mysql 有几级缓存? 每一级缓存,具体是什么?
|
2月前
|
SQL 算法 关系型数据库
面试:什么是死锁,如何避免或解决死锁;MySQL中的死锁现象,MySQL死锁如何解决
面试:什么是死锁,死锁产生的四个必要条件,如何避免或解决死锁;数据库锁,锁分类,控制事务;MySQL中的死锁现象,MySQL死锁如何解决
|
2月前
|
SQL 关系型数据库 MySQL
美团面试:Mysql如何选择最优 执行计划,为什么?
在40岁老架构师尼恩的读者交流群中,近期有小伙伴面试美团时遇到了关于MySQL执行计划的面试题:“MySQL如何选择最优执行计划,为什么?”由于缺乏系统化的准备,小伙伴未能给出满意的答案,面试失败。为此,尼恩为大家系统化地梳理了MySQL执行计划的相关知识,帮助大家提升技术水平,展示“技术肌肉”,让面试官“爱到不能自已”。相关内容已收录进《尼恩Java面试宝典PDF》V175版本,供大家参考学习。
|
3月前
|
SQL 关系型数据库 MySQL
阿里面试:MYSQL 事务ACID,底层原理是什么? 具体是如何实现的?
尼恩,一位40岁的资深架构师,通过其丰富的经验和深厚的技術功底,为众多读者提供了宝贵的面试指导和技术分享。在他的读者交流群中,许多小伙伴获得了来自一线互联网企业的面试机会,并成功应对了诸如事务ACID特性实现、MVCC等相关面试题。尼恩特别整理了这些常见面试题的系统化解答,形成了《MVCC 学习圣经:一次穿透MYSQL MVCC》PDF文档,旨在帮助大家在面试中展示出扎实的技术功底,提高面试成功率。此外,他还编写了《尼恩Java面试宝典》等资料,涵盖了大量面试题和答案,帮助读者全面提升技术面试的表现。这些资料不仅内容详实,而且持续更新,是求职者备战技术面试的宝贵资源。
阿里面试:MYSQL 事务ACID,底层原理是什么? 具体是如何实现的?
|
3月前
|
SQL 关系型数据库 MySQL
京东面试:什么情况下 mysql RR不能解决幻读? RR隔离mysql如何实现?
老架构师尼恩在其读者交流群中分享了关于MySQL事务隔离级别的深入解析,特别针对RR级隔离如何解决幻读问题进行了详细讨论。文章不仅解释了ACID中的隔离性概念,还列举了四种事务隔离级别(未提交读、提交读、可重复读、串行读)的特点及应用场景。尼恩通过具体的例子和图表,清晰地展示了不同隔离级别下的并发事务问题(脏读、不可重复读、幻读)及其解决方案,特别是RR级隔离下的MVCC机制如何通过快照读和当前读来防止幻读。此外,尼恩还提供了相关面试题的解答技巧和参考资料,帮助读者更好地准备技术面试。更多详细内容和实战案例可在《尼恩Java面试宝典》中找到。
|
3月前
|
SQL 关系型数据库 MySQL
美团面试:mysql 索引失效?怎么解决? (重点知识,建议收藏,读10遍+)
本文详细解析了MySQL索引失效的多种场景及解决方法,包括破坏最左匹配原则、索引覆盖原则、前缀匹配原则、`ORDER BY`排序不当、`OR`关键字使用不当、索引列上有计算或函数、使用`NOT IN`和`NOT EXISTS`不当、列的比对等。通过实例演示和`EXPLAIN`命令分析,帮助读者深入理解索引失效的原因,并提供相应的优化建议。文章还推荐了《尼恩Java面试宝典》等资源,助力面试者提升技术水平,顺利通过面试。
|
3月前
|
存储 关系型数据库 MySQL
面试官:MySQL一次到底插入多少条数据合适啊?
本文探讨了数据库插入操作的基础知识、批量插入的优势与挑战,以及如何确定合适的插入数据量。通过面试对话的形式,详细解析了单条插入与批量插入的区别,磁盘I/O、内存使用、事务大小和锁策略等关键因素。最后,结合MyBatis框架,提供了实际应用中的批量插入策略和优化建议。希望读者不仅能掌握技术细节,还能理解背后的原理,从而更好地优化数据库性能。