MySQL面试题系列-2

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,高可用系列 2核4GB
简介: MySQL面试题系列-2


MySQL是一个关系型数据库管理系统,由瑞典 MySQL AB 公司开发,属于 Oracle 旗下产品。MySQL是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MySQL是最好的RDBMS (Relational Database Management System,关系数据库管理系统)应用软件之一。

mysql的innodb和myisam索引区别

InnoDB和MyISAM是MySQL中的两种存储引擎,它们在事务处理、锁定级别、索引结构以及全文索引等方面存在区别:

  1. 事务处理:InnoDB支持事务处理,能够进行提交和回滚操作,而MyISAM不支持事务处理。
  2. 锁定级别:InnoDB支持行级锁,提供更高的并发性能;MyISAM仅支持表级锁,可能在执行写操作时导致整张表被锁定。
  3. 索引结构:InnoDB使用聚簇索引,数据文件和主键索引绑定在一起,通过主键索引的查询效率较高;MyISAM使用非聚簇索引,数据文件与索引分开存储。
  4. 全文索引:MyISAM支持全文索引,对于全文搜索有较好的性能;InnoDB直到MySQL 5.6版本才开始支持全文索引。
  5. 外键约束:InnoDB支持外键约束,用于保证数据的完整性;MyISAM不支持外键。
  6. 计数操作:MyISAM保存了表的行数,对SELECT COUNT(*)操作较快;InnoDB没有保存这个信息,需要全表扫描来计算行数。
  7. 恢复能力:系统崩溃后,MyISAM表的恢复相对困难;InnoDB因其事务日志而具有更好的恢复能力。
  8. 内存使用:InnoDB采用缓冲池来缓存数据和索引,减少磁盘I/O;MyISAM对内存的使用不如InnoDB高效。
  9. 自动提交:对于InnoDB,每条SQL语句默认封装成事务并自动提交,可以通过显式地使用BEGINCOMMIT来控制事务;而MyISAM不涉及事务的自动提交问题。

综上所述,InnoDB适合处理并发高及需要事务支持的场景,而MyISAM适合读取密集型的应用且不需要事务支持的情况。在选择存储引擎时,应考虑应用的具体需求,比如是否需要事务支持、并发访问量、是否需要全文索引等因素。

InnoDB引擎的4大特性

InnoDB引擎作为MySQL的默认存储引擎,拥有以下四大特性:

  1. 支持事务处理:InnoDB引擎支持完整的ACID事务,允许用户进行可靠的提交和回滚操作。这是通过其MVCC(多版本并发控制)机制以及强大的恢复能力实现的,确保了在并发环境下数据一致性和完整性。
  2. 外键约束:InnoDB支持外键约束,这有助于保持数据库中数据的参照完整性。通过外键可以创建一个表与另一个表之间的链接,确保数据的相关性和准确性。
  3. MVCC(多版本并发控制):InnoDB通过MVCC实现了非锁定读,这意味着在读取数据时不会对其进行锁定,从而允许其他事务同时对数据进行写入。这种机制提高了数据库在高并发情况下的性能。
  4. 行级锁定:InnoDB提供了行级锁定功能,相比于MyISAM的表级锁,行级锁可以更精细地控制并发访问,减少锁冲突,提高并发性能,特别适合于在线事务处理(OLTP)类型的应用。

除了上述特性,InnoDB还具有一个高度优化的缓冲池来减少磁盘I/O操作,以及聚集索引来提高主键查询的效率。这些技术特性共同作用,使得InnoDB成为处理大数据量和需要高并发访问场景下的理想选择。

插入缓存的合并频率是多少?

在MySQL中,InnoDB存储引擎有一个名为"插入缓冲"(Insert Buffer)的组件,它用于优化辅助索引(非聚簇索引)上的插入操作。当多个插入操作涉及到同一个辅助索引页时,这些变更会被合并到所谓的"插入缓冲"中,而不是直接更新索引页。

在MySQL 5.6版本之前,InnoDB有一个被称为"自适应哈希索引"(Adaptive Hash Index)的功能,它会根据表的大小和负载自动开启或关闭。插入缓冲的默认合并频率与自适应哈希索引有关,通常是每秒一次。但是,这个频率是动态调整的,并且受到很多因素的影响,如系统负载、I/O性能等。

从MySQL 5.6开始,InnoDB不再使用自适应哈希索引,而是引入了一个新的称为"更改缓冲"(Change Buffer)的机制来处理对辅助索引的随机插入操作。更改缓冲的合并策略也有所不同,并且会考虑更多的因素,比如数据页是否已经被加载到内存中。

在现代版本的MySQL中,插入缓冲被更改缓冲所替代,而更改缓冲的具体合并时机更加智能,不依赖于固定的频率,而是根据服务器的工作负载和数据访问模式来动态调整。因此,没有一个固定的"合并频率"可以描述当前InnoDB引擎的行为。相反,InnoDB引擎会根据需要自动合并更改缓冲中的操作到辅助索引页中。

要了解特定MySQL版本和配置下插入缓存(或更改缓冲)的合并行为,最好查阅该版本的官方文档或相关资源。

二次写空间组成?

InnoDB引擎的二次写(Doublewrite)由两部分组成:

  • 内存中的Doublewrite Buffer:这是位于InnoDB存储引擎内存中的一个缓冲区,其大小通常配置为2MB。这个缓冲区用于在写入数据页到磁盘之前,先将数据的一份副本写入这个buffer。这样做的目的是为了在发生部分写失败或掉电等异常情况时,能够从这个buffer中恢复数据,保证数据的完整性。
  • 物理磁盘上的共享表空间:在InnoDB存储引擎的共享表空间(ibdata文件)中,有一块专门的区域用于二次写,它由连续的128个页面组成,分为两个区(extent),每个区的大小也是2MB。当数据被写入内存中的doublewrite buffer后,接下来会写入到这个共享表空间的doublewrite区域。如果写入成功,数据才会被写入到最终的位置。

二次写机制是InnoDB确保在发生故障时数据可靠性和一致性的一种技术。通过这种双重保障措施,即使在系统崩溃或其他异常情况下,InnoDB也能通过这个“双保险”机制来减少数据丢失和损坏的风险。

自适应hash索引有什么坏处

自适应哈希索引(Adaptive Hash Index,AHI)是InnoDB存储引擎特有的一种优化技术,虽然它能在某些情况下提供性能上的提升,但也存在一些潜在的缺点和限制:

  1. 占用Buffer Pool内存:AHI会在InnoDB的buffer pool中创建额外的哈希索引结构。这会增加内存的使用量,如果内存有限,可能会导致原有数据被置换出缓存,从而影响其他操作的性能。
  2. 只适用于等值查询:AHI主要针对的是等值查询,即精确匹配某个值的查询。对于范围查找、模糊查询或者需要排序(ORDER BY)的操作,AHI无法提供优化支持。
  3. 可能降低写操作性能:尽管AHI可以加速读操作,但在某些情况下可能会对写操作产生负面影响。因为每次数据变更都可能需要更新哈希索引,这会增加写操作的复杂性和开销。
  4. 可能导致数据不一致:在系统崩溃或其他异常情况下,由于AHI是在内存中构建的,因此可能存在数据丢失或损坏的风险。虽然InnoDB有恢复机制,但在极端情况下仍可能面临数据一致性问题。
  5. 自动创建可能导致不可预测性:AHI会根据服务器的工作负载自动创建和删除。这种自动行为可能导致数据库管理员难以预测和控制索引的使用情况,从而影响系统的稳定性和管理的便捷性。
  6. 不支持热数据的二级索引优化:虽然AHI可以基于二级索引的频繁访问来创建哈希索引以加速搜索,但这仅限于等值比较,不支持其他类型的优化。

总的来说,AHI在特定的应用场景下可以提高查询效率,尤其是在处理大量等值查询时。但是,它也有一些局限性和潜在的副作用,特别是在写密集型的工作负载或者需要复杂查询支持的应用中,AHI可能不是最佳选择。因此,在使用AHI时,需要根据具体的应用场景和工作负载来权衡其利弊。

相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
1月前
|
存储 SQL 关系型数据库
MySQL进阶突击系列(03) MySQL架构原理solo九魂17环连问 | 给大厂面试官的一封信
本文介绍了MySQL架构原理、存储引擎和索引的相关知识点,涵盖查询和更新SQL的执行过程、MySQL各组件的作用、存储引擎的类型及特性、索引的建立和使用原则,以及二叉树、平衡二叉树和B树的区别。通过这些内容,帮助读者深入了解MySQL的工作机制,提高数据库管理和优化能力。
|
2月前
|
SQL 关系型数据库 MySQL
大厂面试官:聊下 MySQL 慢查询优化、索引优化?
MySQL慢查询优化、索引优化,是必知必备,大厂面试高频,本文深入详解,建议收藏。关注【mikechen的互联网架构】,10年+BAT架构经验分享。
大厂面试官:聊下 MySQL 慢查询优化、索引优化?
|
3月前
|
存储 关系型数据库 MySQL
阿里面试:为什么要索引?什么是MySQL索引?底层结构是什么?
尼恩是一位资深架构师,他在自己的读者交流群中分享了关于MySQL索引的重要知识点。索引是帮助MySQL高效获取数据的数据结构,主要作用包括显著提升查询速度、降低磁盘I/O次数、优化排序与分组操作以及提升复杂查询的性能。MySQL支持多种索引类型,如主键索引、唯一索引、普通索引、全文索引和空间数据索引。索引的底层数据结构主要是B+树,它能够有效支持范围查询和顺序遍历,同时保持高效的插入、删除和查找性能。尼恩还强调了索引的优缺点,并提供了多个面试题及其解答,帮助读者在面试中脱颖而出。相关资料可在公众号【技术自由圈】获取。
|
8天前
|
存储 SQL 关系型数据库
MySQL 面试题
MySQL 的一些基础面试题
|
2月前
|
SQL 缓存 关系型数据库
美团面试:Mysql 有几级缓存? 每一级缓存,具体是什么?
在40岁老架构师尼恩的读者交流群中,近期有小伙伴因未能系统梳理MySQL缓存机制而在美团面试中失利。为此,尼恩对MySQL的缓存机制进行了系统化梳理,包括一级缓存(InnoDB缓存)和二级缓存(查询缓存)。同时,他还将这些知识点整理进《尼恩Java面试宝典PDF》V175版本,帮助大家提升技术水平,顺利通过面试。更多技术资料请关注公号【技术自由圈】。
美团面试:Mysql 有几级缓存? 每一级缓存,具体是什么?
|
2月前
|
SQL 算法 关系型数据库
面试:什么是死锁,如何避免或解决死锁;MySQL中的死锁现象,MySQL死锁如何解决
面试:什么是死锁,死锁产生的四个必要条件,如何避免或解决死锁;数据库锁,锁分类,控制事务;MySQL中的死锁现象,MySQL死锁如何解决
|
2月前
|
SQL 关系型数据库 MySQL
美团面试:Mysql如何选择最优 执行计划,为什么?
在40岁老架构师尼恩的读者交流群中,近期有小伙伴面试美团时遇到了关于MySQL执行计划的面试题:“MySQL如何选择最优执行计划,为什么?”由于缺乏系统化的准备,小伙伴未能给出满意的答案,面试失败。为此,尼恩为大家系统化地梳理了MySQL执行计划的相关知识,帮助大家提升技术水平,展示“技术肌肉”,让面试官“爱到不能自已”。相关内容已收录进《尼恩Java面试宝典PDF》V175版本,供大家参考学习。
|
3月前
|
SQL 关系型数据库 MySQL
阿里面试:MYSQL 事务ACID,底层原理是什么? 具体是如何实现的?
尼恩,一位40岁的资深架构师,通过其丰富的经验和深厚的技術功底,为众多读者提供了宝贵的面试指导和技术分享。在他的读者交流群中,许多小伙伴获得了来自一线互联网企业的面试机会,并成功应对了诸如事务ACID特性实现、MVCC等相关面试题。尼恩特别整理了这些常见面试题的系统化解答,形成了《MVCC 学习圣经:一次穿透MYSQL MVCC》PDF文档,旨在帮助大家在面试中展示出扎实的技术功底,提高面试成功率。此外,他还编写了《尼恩Java面试宝典》等资料,涵盖了大量面试题和答案,帮助读者全面提升技术面试的表现。这些资料不仅内容详实,而且持续更新,是求职者备战技术面试的宝贵资源。
阿里面试:MYSQL 事务ACID,底层原理是什么? 具体是如何实现的?
|
3月前
|
SQL 关系型数据库 MySQL
美团面试:mysql 索引失效?怎么解决? (重点知识,建议收藏,读10遍+)
本文详细解析了MySQL索引失效的多种场景及解决方法,包括破坏最左匹配原则、索引覆盖原则、前缀匹配原则、`ORDER BY`排序不当、`OR`关键字使用不当、索引列上有计算或函数、使用`NOT IN`和`NOT EXISTS`不当、列的比对等。通过实例演示和`EXPLAIN`命令分析,帮助读者深入理解索引失效的原因,并提供相应的优化建议。文章还推荐了《尼恩Java面试宝典》等资源,助力面试者提升技术水平,顺利通过面试。
|
3月前
|
存储 关系型数据库 MySQL
面试官:MySQL一次到底插入多少条数据合适啊?
本文探讨了数据库插入操作的基础知识、批量插入的优势与挑战,以及如何确定合适的插入数据量。通过面试对话的形式,详细解析了单条插入与批量插入的区别,磁盘I/O、内存使用、事务大小和锁策略等关键因素。最后,结合MyBatis框架,提供了实际应用中的批量插入策略和优化建议。希望读者不仅能掌握技术细节,还能理解背后的原理,从而更好地优化数据库性能。