MySQL系统架构

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS PostgreSQL,集群系列 2核4GB
简介: 最近在准备给新人培训,对于DBA相关的新人,最推荐的莫过于学习官方文档,像Oracle的concept,MySQL的reference等,MySQL被Oracle收购以后,文档也越来越完整和形象,对于刚学习的新人,学习官方文档有助于跟为系统得学习。

最近在准备给新人培训,对于DBA相关的新人,最推荐的莫过于学习官方文档,像Oracle的concept,MySQL的reference等,MySQL被Oracle收购以后,文档也越来越完整和形象,对于刚学习的新人,学习官方文档有助于跟为系统得学习。

本篇主要讲MySQL8.0InnoDB的架构。

跟其他关系型数据库一样,MySQL的架构也分为In-Memory 和On-Disk两部分。
_
在内存结构中,主要由4大块组成。

Buffer Pool(以下简称bp)

bp在整个内存中占绝大多数,MySQL官方一般建议设置为服务器物理内存的80%。这边建议MySQL整体内存控制在80%左右,bp最好不要超过70%,不然容易OOM。
理解了bp的原理,对于数据库也有差不多理解了一半了。bp主要结构是个list,用的是LRU算法的变种(least recently used)。
主要用来缓存数据块(page,也叫页),mysql默认为16k,oracle为8k。如果内存达到了阈值,那么就会把最近最少使用到的page驱逐(evicted)出内存。然后把新页插入到中间位置,一般为整条list的热端5/8处。
查看下图可以看到,整个bp分为两个sublist,上端为热端,缓存热点数据(频繁被访问);另外一端为冷端,随时被驱逐出内存。
也正是因为磁盘访问数据不如内存,才有了bp的存在,大家也可以想象一下,如果磁盘数据比内存快,还有bp存在的价值吗?
所有用户访问的数据,都要先经过bp,但如果走全表扫描,按道理也有把数据缓存在bp中,那么势必会把大量数据驱逐出去,当然我们也可以通过调整参数来优化,这个我们在这篇知识普及文档中暂不提及。
可以通过设置 innodb_buffer_pool_size来调整bp的大小,可以在实例启动前在my.cnf中配置,也可以在实例运行中动态设置。
并且可以通过设置innodb_buffer_pool_instances的数量来调整bp池的数量,有利于减少LRU mutex的争议和扫描量,最近刚好有碰到这个bug:
https://bugs.mysql.com/bug.php?id=98869。如果是运行中动态设置bp,还可以通过监控 Innodb_buffer_pool_resize_status参数来查看resize的状态(也同样会写到error log中);如果是增大bp,则会增加chunks数量和page,覆盖hash table和list,并且指针指向内存中新的地址,增加新页到free list;如果是减少bp,则释放和重组bp,在chunks中移除page,覆盖hash table和list,并且指针指向内存中新的地址。
可以通过运行: SHOW ENGINE INNODB STATUS,在BUFFER POOL AND MEMORY部分看到bp相关统计数据。
_F1BBC2DF_5A3A_496C_83C9_6B559615802C__20200609221418
附:https://dev.mysql.com/doc/refman/8.0/en/innodb-buffer-pool.html

Change Buffer(以下简称cb)

cp是mysql内存结构中比较特殊的一个,它是用来缓存不在bp中的二级索引(secondary index,相对于cluster index来说)变化的page,是DML的结果,并定期合并、读到bp中。二级索引可以值是不唯一的,cp也是占用bp的内存,在shutdown 实例以后,会成为系统表空间的一部分。cp存在的意义是为了在执行DML的时候,异步二级索引的写入,到达尽可能的顺序写,提高IO效率,对I/O-bound型有一定优化作用。可以通过设置 innodb_change_buffering来控制什么类型的DML能够在cp中。通过innodb_change_buffer_max_size来设置在bp中占用的百分比。可以通过show engine innodb status中的INSERT BUFFER AND ADAPTIVE HASH INDEX 来监控cp相关数据统计。
_1C4A4CBC_9900_4C19_A778_AA2FDAEF5487__20200611204851

Adaptive Hash Index

mysql本身不支持哈希索引,但内部有使用到自适哈希索引,维护hash表。可以通过 innodb_adaptive_hash_index 来启用,也可以动态修改。
hash index通过B-TREE索引键前缀创建,基于需求和最经常访问的搜索pattern。mysql基于自己的算法来自行创建哈希索引,并且hash table是分区的,通过控制innodb_adaptive_hash_index_parts来设置分区数量,在特定情况下可以启动加速查询的效果,对like和%不友好。

Redo Log Buffer

redo log buffer也是基本所有关系型数据库都有的,redo log也叫 WAL,用来缓存数据变化,在脏数据flush到数据文件前,需要先写入到redo log buffer,再写入到redo log中,一个目的是用来保证数据一致性,保证数据库crash以后能够通过redo log进行恢复。第二个主要用来降低IO,如果每次数据库的DML都直接写入到数据文件中,则会大大影响性能。可以通过innodb_log_buffer_size来控制内存大小,默认为16M。定期有线程对齐进行flush,确保更新都刷入到redo log中,并且redo log的page size为512k,也就是一个扇区的大小,并且是顺序写,保证了性能和一致性,不至于需要double write.通过设置innodb_flush_log_at_trx_commit=1来获得ACID的保证,每次事务提交马上flush到redo log,如果对数据一致性不严格的,可以通过设置0来定期刷新,提高性能。定期刷新可以通过设置innodb_flush_log_at_timeout来控制,默认为1秒钟。

至此mysql内存相关的4个主要的组成部分已经讲完,另外还有很多小的内存区域,比如由来缓存数据字典等,以后碰到再讲,接着会介绍mysql on-disk部分的架构。
https://yq.aliyun.com/articles/764516?spm=a2c4e.11155435.0.0.71de331269m7Gf

相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
12天前
|
存储 SQL 关系型数据库
Mysql高可用架构方案
本文阐述了Mysql高可用架构方案,介绍了 主从模式,MHA模式,MMM模式,MGR模式 方案的实现方式,没有哪个方案是完美的,开发人员在选择何种方案应用到项目中也没有标准答案,合适的才是最好的。
69 3
Mysql高可用架构方案
|
1月前
|
监控 关系型数据库 MySQL
深入了解MySQL主从复制:构建高效稳定的数据同步架构
深入了解MySQL主从复制:构建高效稳定的数据同步架构
119 1
|
2月前
|
NoSQL 关系型数据库 MySQL
微服务架构下的数据库选择:MySQL、PostgreSQL 还是 NoSQL?
在微服务架构中,数据库的选择至关重要。不同类型的数据库适用于不同的需求和场景。在本文章中,我们将深入探讨传统的关系型数据库(如 MySQL 和 PostgreSQL)与现代 NoSQL 数据库的优劣势,并分析在微服务架构下的最佳实践。
|
7天前
|
SQL 存储 缓存
【赵渝强老师】MySQL的体系架构
本文介绍了MySQL的体系架构,包括Server层的7个主要组件(Connectors、Connection Pool、Management Service & Utilities、SQL Interface、Parser、Optimizer、Query Caches & Buffers)及其作用,以及存储引擎层的支持情况,重点介绍了InnoDB存储引擎。文中还提供了相关图片和视频讲解。
【赵渝强老师】MySQL的体系架构
|
3月前
|
SQL 关系型数据库 MySQL
(二十五)MySQL主从实践篇:超详细版读写分离、双主热备架构搭建教学
在上篇《主从原理篇》中,基本上把主从复制原理、主从架构模式、数据同步方式、复制技术优化.....等各类细枝末节讲清楚了,本章则准备真正对聊到的几种主从模式落地实践,但实践的内容通常比较枯燥乏味,因为就是调整各种配置、设置各种参数等步骤。
542 2
|
4月前
|
SQL 存储 关系型数据库
(一)全解MySQL之架构篇:自顶向下深入剖析MySQL整体架构!
无论你是前端还是后端,只要是一个合格的开发者,对于MySQL这个名词相信都不陌生,MySQL逐渐成为了最受欢迎的关系型数据库,无论你是大前端,亦或是Java、Go、Python、C/C++、PHP....等这些语言的程序员,对于MySQL是必然要掌握的核心技术之一,程序员不能没有MySQL,就像西方不能失去耶路撒冷一般。
798 0
|
4月前
|
开发框架 前端开发 关系型数据库
ABP框架使用Mysql数据库,以及基于SQLServer创建Mysql数据库的架构和数据
ABP框架使用Mysql数据库,以及基于SQLServer创建Mysql数据库的架构和数据
|
5月前
|
SQL 关系型数据库 MySQL
MySQL高可用架构设计:从主从复制到分布式集群
MySQL高可用性涉及主从复制、半同步复制和Group/InnoDB Cluster。主从复制通过二进制日志同步数据,保证故障时可切换。半同步复制确保事务在至少一个从服务器确认后才提交。Group Replication是多主复制,支持自动故障切换。InnoDB Cluster是8.0的集成解决方案,简化集群管理。使用这些技术能提升数据库的稳定性和可靠性。
480 2
|
5月前
|
存储 关系型数据库 MySQL
架构面试题汇总:mysql索引汇总(2024版)
架构面试题汇总:mysql索引汇总(2024版)
|
5月前
|
存储 关系型数据库 MySQL
架构面试题汇总:40道题吃透mysql(2024版)
架构面试题汇总:40道题吃透mysql(2024版)