MySQL 高频面试题目(2)

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: MySQL 高频面试题目(2)

InnoDB内存区域的各个缓冲区


image.png


redo log:主要节省的是随机写磁盘的IO消耗(转成顺序写)

change buffer:主要节省是随机读磁盘的IO消耗。


changebuffer的作用?


答:InnoDb的页和操作系统的页大小不一致,InnoDB页大小一般为16K,操作系统的页为4K,InnoDB的页写入到磁盘的时,一个页需要分四次写。


如果存储引擎正在写入页的数据到磁盘时发生了宕机,可能出现页只写一部分的情况,比如只写了4K,就宕机了,这种情况叫做部分写失效(partial page write),可能会导致数据丢失。因为写入一半,这个页已经损坏了,所以无法使用redo log进行恢复。所以提出了double write技术,其跟redo log一样,double write由两部分组成,一部分是内存中的double write,一个部分是磁盘上的double write。因为double write是顺序写入的,不会带来很大的开销。


Change buffer:


在MySQL5.5之前,叫插入缓冲(insert buffer),只针对insert做了优化,现在对delete和update也有效,叫做写缓冲(change buffer)。


它是一种应用在非唯一普通索引页(non-unique secondary index page)不在缓冲池中,对页进行了写操作,并不会立刻将磁盘页加载到缓冲池,而仅仅记录缓冲变更(buffer changes),等未来数据被读取时,再将数据合并(merge)恢复到缓冲池中的技术。写缓冲的目的是降低写操作的磁盘IO,提升数据库性能。 change buffer记录到数据页的操作:在访问这个数据页的时候,或者通过后台线程,或者数据shut down、redo log写满时触发。如果数据库大部分索引都是非唯一性索引,并且业务是写多读少,不会在写数据后立即读取,就可以使用Change buffer(写缓存)。

Change buffer占Buffer pool的比例,默认25%。


Binlog

Binlog以时间的形式记录了所有的DDL和DML语句(因为它记录的是操作而不是数据值,属于逻辑日志),可以用来做主从复制和数据恢复。


跟redo log不一样,它的文件内容是可以追加的,没有固定大小操作,在开启了binlog功能的情况下,我们可以把binlog导出成SQL语句,把所有的操作重放一遍,来实现数据的恢复。


Redo log(重做日志):因为刷脏不是实时的,缓存中的脏数据,数据库宕机或者重启,这些数据就会丢失。所以数据内存必须有一个持久化的措施。InnoDB把所有对页面的修改操作写入一个日志文件。如果有未同步到磁盘的数据,数据库在启动的时候,会从日志文件进行恢复操作。事务ACID中的持久性就是用Redolog来实现。


同样存储到磁盘,为何存储到日志里边,而不存储到dbfilie里边,因为记录日志是顺序IO,刷盘是随机IO,本质是集中存储和分散存储的区别,因此先把修改写入日志文件,在保证内存安全性的情况下,可以延迟刷盘时间,进而提升系统吞吐。



崩溃恢复的时候,如何判断事务是否需要提交?


1、binlog无记录,redolog无记录:在redolog写之前crash,恢复操作:回滚事务


2、Binlog无记录,redolog状态prepare:在binlog写完之前的crash,恢复操作:回滚事务


3、Binlog有记录,redolog状态prepare:在binlog写完提交事务之前的crash:t提交事务


4、Binlog有记录,redolog状态commit:正常完成的事务,不需要恢复



三、一条SQL更新语句是如何执行的?


更新过程:将数据读到内存的缓冲池 buffer pool中,当然InnoDB的数据数据页并不是都是在访问的时候才缓存到buffer pool,通过预读机制,也就是说,设计者认为访问某个page的数据的时候,相邻的一些page可能会很快被访问到,所以先把这些page放到buffer pool中缓存起来;当然预读取也会带来一些副作用,就是导致占用的内存空间更多,剩余的空闲页更少。如果buffer pool size不是很大,而预读取的数据很多,那么很有可能真正需要缓存的热点数据被预读取数据挤出buffer pool淘汰掉了,下次访问的时候又要先去磁盘。为了解决这个问题,使用LRU缓存,map+双向链表的数据结构,


(1)先存储到缓存log buffer中,默认情况下会事务提交成功,数据会自动同步到磁盘,


(2)记录redo log,并将这行记录状态设置为prepare,


(3)写入binlog,并且提交事务,


(4)将redo log里这个事务的相关状态标记为commit;两阶段提交能够保证数据的一致性。


image.png


四、解释一下什么是索引?

数据库索引,是数据库管理系统(DBMS)中一个排序的数据结构,以协助快速查询,更新数据库表中的数据。类似一本书的目录。


InnoDB中索引的类型:

普通索引(Normal):最普通的索引,没有任何的限制

唯一索引(Unique):唯一所以要求键值不能重复。另外需要注意的是,主键索引是一种特殊的唯一索引,它还多了一个限制条件,要求键值不能为空。主键索引引用primay key创建。

全文索引(Fulltext):针对比较大的数据,比如我们存放的是消息内容,一篇几KB的数据的这种情况


五、B树与B+树的区别 (没有整理好,需要继续整理)


image.png


1、B树的路数比节点数多1,B+树的路数与节点数相同

2、B树中每个节点存储的是数据+键值+引用指针,B+ Tree的根节点和枝节点都不会存储数据,只有叶子节点存储数据。因为每个节点的页是16K,不存储data之后,可以存储更多的key值,从而减少IO次数。

3、•B+树的叶子结点都是相链的,因此对整棵树的便利只需要一次线性遍历叶子结点即可。而且由于数据顺序排列并且相连,所以便于区间查找和搜索。而B树则需要进行每一层的递归遍历。相邻的元素可能在内存中不相邻,所以缓存命中性没有B+树好。

4、B树也有优点,其优点在于,由于B树的每一个节点都包含key和value,因此经常访问的元素可能离根节点更近,因此访问也更迅速。


备注信息:InnoDB存储引擎中有页(page)的概念,页是其磁盘管理的最小单位,在InnoDB存储引擎中默认每个页的大小为16K,B+树将每个节点的大小设置和页大小一样,都为16K,因此读取一个节点,只需要一次IO。


 而B树中每个节点中不仅包含数据的key值,还会包含除了key值外的所有data值。而每一页的存储空间是有限的,如果data数据较大时将会导致每个节点(即一个页)能存储的key的数量很小,当存储的数据量很大时同样会导致B-Tree的深度很大,增大查询时的磁盘IO次数,进而影响查询效率。而B+树中,所有数据节点都是按照键值大小顺序存放在同一层的叶子节点上,而非叶子节点上只存储key值信息, 这样可以大大加大每个节点存储的key值数量, 降低B+树的高度,减少查询时的IO次数。


 做一个推理:InnoDb表的存储引擎中一页的大小为16k,一般表的主键类型占用8个字节,指针占用8个字节,那么一页可以存放16kb/(8b*8b)=1000个键值(关键字),所以一个高度为3的B+树可以存储1000^3即10亿条记录。查询时只需要两次IO操作就可找到要查找的记录。大大节约了查询时间。


image.png


相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
打赏
0
0
0
0
7
分享
相关文章
MySQL进阶突击系列(03) MySQL架构原理solo九魂17环连问 | 给大厂面试官的一封信
本文介绍了MySQL架构原理、存储引擎和索引的相关知识点,涵盖查询和更新SQL的执行过程、MySQL各组件的作用、存储引擎的类型及特性、索引的建立和使用原则,以及二叉树、平衡二叉树和B树的区别。通过这些内容,帮助读者深入了解MySQL的工作机制,提高数据库管理和优化能力。
美团面试:MySQL为什么 不用 Docker部署?
45岁老架构师尼恩在读者交流群中分享了关于“MySQL为什么不推荐使用Docker部署”的深入分析。通过系统化的梳理,尼恩帮助读者理解为何大型MySQL数据库通常不使用Docker部署,主要涉及性能、管理复杂度和稳定性等方面的考量。文章详细解释了有状态容器的特点、Docker的资源隔离问题以及磁盘IO性能损耗,并提供了小型MySQL使用Docker的最佳实践。此外,尼恩还介绍了Share Nothing架构的优势及其应用场景,强调了配置管理和数据持久化的挑战。最后,尼恩建议读者参考《尼恩Java面试宝典PDF》以提升技术能力,更好地应对面试中的难题。
大厂面试官:聊下 MySQL 慢查询优化、索引优化?
MySQL慢查询优化、索引优化,是必知必备,大厂面试高频,本文深入详解,建议收藏。关注【mikechen的互联网架构】,10年+BAT架构经验分享。
大厂面试官:聊下 MySQL 慢查询优化、索引优化?
阿里面试:为什么要索引?什么是MySQL索引?底层结构是什么?
尼恩是一位资深架构师,他在自己的读者交流群中分享了关于MySQL索引的重要知识点。索引是帮助MySQL高效获取数据的数据结构,主要作用包括显著提升查询速度、降低磁盘I/O次数、优化排序与分组操作以及提升复杂查询的性能。MySQL支持多种索引类型,如主键索引、唯一索引、普通索引、全文索引和空间数据索引。索引的底层数据结构主要是B+树,它能够有效支持范围查询和顺序遍历,同时保持高效的插入、删除和查找性能。尼恩还强调了索引的优缺点,并提供了多个面试题及其解答,帮助读者在面试中脱颖而出。相关资料可在公众号【技术自由圈】获取。
京东面试:MySQL MVCC是如何实现的?如何通过MVCC实现读已提交、可重复读隔离级别的?
1.请解释什么是MVCC,它在数据库中的作用是什么? 2.在MySQL中,MVCC是如何实现的?请简述其工作原理。 3.MVCC是如何解决读-写和写-写冲突的? 4.在并发环境中,当多个事务同时读取同一行数据时,MVCC是如何保证每个事务看到的数据版本是一致的? 5.MVCC如何帮助提高数据库的并发性能?
京东面试:MySQL MVCC是如何实现的?如何通过MVCC实现读已提交、可重复读隔离级别的?
MySQL 面试题
MySQL 的一些基础面试题
美团面试:Mysql 有几级缓存? 每一级缓存,具体是什么?
在40岁老架构师尼恩的读者交流群中,近期有小伙伴因未能系统梳理MySQL缓存机制而在美团面试中失利。为此,尼恩对MySQL的缓存机制进行了系统化梳理,包括一级缓存(InnoDB缓存)和二级缓存(查询缓存)。同时,他还将这些知识点整理进《尼恩Java面试宝典PDF》V175版本,帮助大家提升技术水平,顺利通过面试。更多技术资料请关注公号【技术自由圈】。
美团面试:Mysql 有几级缓存? 每一级缓存,具体是什么?
面试:什么是死锁,如何避免或解决死锁;MySQL中的死锁现象,MySQL死锁如何解决
面试:什么是死锁,死锁产生的四个必要条件,如何避免或解决死锁;数据库锁,锁分类,控制事务;MySQL中的死锁现象,MySQL死锁如何解决
美团面试:Mysql如何选择最优 执行计划,为什么?
在40岁老架构师尼恩的读者交流群中,近期有小伙伴面试美团时遇到了关于MySQL执行计划的面试题:“MySQL如何选择最优执行计划,为什么?”由于缺乏系统化的准备,小伙伴未能给出满意的答案,面试失败。为此,尼恩为大家系统化地梳理了MySQL执行计划的相关知识,帮助大家提升技术水平,展示“技术肌肉”,让面试官“爱到不能自已”。相关内容已收录进《尼恩Java面试宝典PDF》V175版本,供大家参考学习。

热门文章

最新文章

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等