MySQL 高频面试题目(2)

本文涉及的产品
云数据库 RDS MySQL Serverless,0.5-2RCU 50GB
简介: MySQL 高频面试题目(2)

InnoDB内存区域的各个缓冲区


image.png


redo log:主要节省的是随机写磁盘的IO消耗(转成顺序写)

change buffer:主要节省是随机读磁盘的IO消耗。


changebuffer的作用?


答:InnoDb的页和操作系统的页大小不一致,InnoDB页大小一般为16K,操作系统的页为4K,InnoDB的页写入到磁盘的时,一个页需要分四次写。


如果存储引擎正在写入页的数据到磁盘时发生了宕机,可能出现页只写一部分的情况,比如只写了4K,就宕机了,这种情况叫做部分写失效(partial page write),可能会导致数据丢失。因为写入一半,这个页已经损坏了,所以无法使用redo log进行恢复。所以提出了double write技术,其跟redo log一样,double write由两部分组成,一部分是内存中的double write,一个部分是磁盘上的double write。因为double write是顺序写入的,不会带来很大的开销。


Change buffer:


在MySQL5.5之前,叫插入缓冲(insert buffer),只针对insert做了优化,现在对delete和update也有效,叫做写缓冲(change buffer)。


它是一种应用在非唯一普通索引页(non-unique secondary index page)不在缓冲池中,对页进行了写操作,并不会立刻将磁盘页加载到缓冲池,而仅仅记录缓冲变更(buffer changes),等未来数据被读取时,再将数据合并(merge)恢复到缓冲池中的技术。写缓冲的目的是降低写操作的磁盘IO,提升数据库性能。 change buffer记录到数据页的操作:在访问这个数据页的时候,或者通过后台线程,或者数据shut down、redo log写满时触发。如果数据库大部分索引都是非唯一性索引,并且业务是写多读少,不会在写数据后立即读取,就可以使用Change buffer(写缓存)。

Change buffer占Buffer pool的比例,默认25%。


Binlog

Binlog以时间的形式记录了所有的DDL和DML语句(因为它记录的是操作而不是数据值,属于逻辑日志),可以用来做主从复制和数据恢复。


跟redo log不一样,它的文件内容是可以追加的,没有固定大小操作,在开启了binlog功能的情况下,我们可以把binlog导出成SQL语句,把所有的操作重放一遍,来实现数据的恢复。


Redo log(重做日志):因为刷脏不是实时的,缓存中的脏数据,数据库宕机或者重启,这些数据就会丢失。所以数据内存必须有一个持久化的措施。InnoDB把所有对页面的修改操作写入一个日志文件。如果有未同步到磁盘的数据,数据库在启动的时候,会从日志文件进行恢复操作。事务ACID中的持久性就是用Redolog来实现。


同样存储到磁盘,为何存储到日志里边,而不存储到dbfilie里边,因为记录日志是顺序IO,刷盘是随机IO,本质是集中存储和分散存储的区别,因此先把修改写入日志文件,在保证内存安全性的情况下,可以延迟刷盘时间,进而提升系统吞吐。



崩溃恢复的时候,如何判断事务是否需要提交?


1、binlog无记录,redolog无记录:在redolog写之前crash,恢复操作:回滚事务


2、Binlog无记录,redolog状态prepare:在binlog写完之前的crash,恢复操作:回滚事务


3、Binlog有记录,redolog状态prepare:在binlog写完提交事务之前的crash:t提交事务


4、Binlog有记录,redolog状态commit:正常完成的事务,不需要恢复



三、一条SQL更新语句是如何执行的?


更新过程:将数据读到内存的缓冲池 buffer pool中,当然InnoDB的数据数据页并不是都是在访问的时候才缓存到buffer pool,通过预读机制,也就是说,设计者认为访问某个page的数据的时候,相邻的一些page可能会很快被访问到,所以先把这些page放到buffer pool中缓存起来;当然预读取也会带来一些副作用,就是导致占用的内存空间更多,剩余的空闲页更少。如果buffer pool size不是很大,而预读取的数据很多,那么很有可能真正需要缓存的热点数据被预读取数据挤出buffer pool淘汰掉了,下次访问的时候又要先去磁盘。为了解决这个问题,使用LRU缓存,map+双向链表的数据结构,


(1)先存储到缓存log buffer中,默认情况下会事务提交成功,数据会自动同步到磁盘,


(2)记录redo log,并将这行记录状态设置为prepare,


(3)写入binlog,并且提交事务,


(4)将redo log里这个事务的相关状态标记为commit;两阶段提交能够保证数据的一致性。


image.png


四、解释一下什么是索引?

数据库索引,是数据库管理系统(DBMS)中一个排序的数据结构,以协助快速查询,更新数据库表中的数据。类似一本书的目录。


InnoDB中索引的类型:

普通索引(Normal):最普通的索引,没有任何的限制

唯一索引(Unique):唯一所以要求键值不能重复。另外需要注意的是,主键索引是一种特殊的唯一索引,它还多了一个限制条件,要求键值不能为空。主键索引引用primay key创建。

全文索引(Fulltext):针对比较大的数据,比如我们存放的是消息内容,一篇几KB的数据的这种情况


五、B树与B+树的区别 (没有整理好,需要继续整理)


image.png


1、B树的路数比节点数多1,B+树的路数与节点数相同

2、B树中每个节点存储的是数据+键值+引用指针,B+ Tree的根节点和枝节点都不会存储数据,只有叶子节点存储数据。因为每个节点的页是16K,不存储data之后,可以存储更多的key值,从而减少IO次数。

3、•B+树的叶子结点都是相链的,因此对整棵树的便利只需要一次线性遍历叶子结点即可。而且由于数据顺序排列并且相连,所以便于区间查找和搜索。而B树则需要进行每一层的递归遍历。相邻的元素可能在内存中不相邻,所以缓存命中性没有B+树好。

4、B树也有优点,其优点在于,由于B树的每一个节点都包含key和value,因此经常访问的元素可能离根节点更近,因此访问也更迅速。


备注信息:InnoDB存储引擎中有页(page)的概念,页是其磁盘管理的最小单位,在InnoDB存储引擎中默认每个页的大小为16K,B+树将每个节点的大小设置和页大小一样,都为16K,因此读取一个节点,只需要一次IO。


 而B树中每个节点中不仅包含数据的key值,还会包含除了key值外的所有data值。而每一页的存储空间是有限的,如果data数据较大时将会导致每个节点(即一个页)能存储的key的数量很小,当存储的数据量很大时同样会导致B-Tree的深度很大,增大查询时的磁盘IO次数,进而影响查询效率。而B+树中,所有数据节点都是按照键值大小顺序存放在同一层的叶子节点上,而非叶子节点上只存储key值信息, 这样可以大大加大每个节点存储的key值数量, 降低B+树的高度,减少查询时的IO次数。


 做一个推理:InnoDb表的存储引擎中一页的大小为16k,一般表的主键类型占用8个字节,指针占用8个字节,那么一页可以存放16kb/(8b*8b)=1000个键值(关键字),所以一个高度为3的B+树可以存储1000^3即10亿条记录。查询时只需要两次IO操作就可找到要查找的记录。大大节约了查询时间。


image.png


相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
6天前
|
SQL 关系型数据库 MySQL
Python与MySQL数据库交互:面试实战
【4月更文挑战第16天】本文介绍了Python与MySQL交互的面试重点,包括使用`mysql-connector-python`或`pymysql`连接数据库、执行SQL查询、异常处理、防止SQL注入、事务管理和ORM框架。易错点包括忘记关闭连接、忽视异常处理、硬编码SQL、忽略事务及过度依赖低效查询。通过理解这些问题和提供策略,可提升面试表现。
25 6
|
6天前
|
存储 Oracle 关系型数据库
【MySQL面试题pro版-12】
【MySQL面试题pro版-12】
13 0
|
6天前
|
SQL 关系型数据库 MySQL
【MySQL面试题pro版-10】
【MySQL面试题pro版-10】
13 1
|
6天前
|
缓存 关系型数据库 MySQL
【MySQL面试题pro版-9】
【MySQL面试题pro版-9】
20 1
|
6天前
|
存储 SQL 关系型数据库
【MySQL面试题pro版-8】
【MySQL面试题pro版-8】
11 0
|
6天前
|
存储 SQL 关系型数据库
【MySQL面试题pro版-7】
【MySQL面试题pro版-7】
17 0
|
6天前
|
存储 关系型数据库 MySQL
【MySQL面试题pro版-6】
【MySQL面试题pro版-6】
18 0
|
6天前
|
SQL 存储 关系型数据库
MySQL面试题系列-16
MySQL面试题系列-16
16 0
|
6天前
|
SQL 存储 关系型数据库
MySQL面试题系列-15
MySQL面试题系列-15
12 0
|
6天前
|
SQL 存储 关系型数据库
MySQL面试题系列-7
MySQL面试题系列-7
19 1