MySQL 5.7.6 WL#7868 Innodb page flush优化

本文涉及的产品
云数据库 RDS MySQL Serverless,0.5-2RCU 50GB
简介:
在上期的我们的月报( 2015/2)中,我们已经针对Oracle MySQL以及社区版本最新的对innodb page flush的优化做了详细的介绍。
在最近release的5.7.6版本中又有了进一步的改进。

 

 

修改一、更精确的loop计算时间
 

 

Page cleaner会每做srv_flushing_avg_loops次后,会去计算刷脏和redo lsn增长的速度。由于每次Page cleaner的工作量是自适应的,一次flush操作的时间可能超过1秒,因此做N次loop的总时间可能超过N秒。

 

在新版本中,统一采用当前时间和上次计算速率时间差来确认是否需要重新计算速率。因此参数innodb_flushing_avg_loops的行为实际上等同于每这么多秒后重计算速率。

 

 

修改二、根据buffer pool实例的脏页分布来决定刷脏

 

我们知道从5.7版本开始支持多个page cleaner线程以实现并行刷脏。在5.7.6之前的版本中,page cleaner协调线程根据当前的负载情况,会计算出预计需要flush的总page数和目标lsn,然后在多个bp instance间做个均分。

 

考虑一种场景:如果bp实例间的负载不平衡,某个实例在目标lsn之前的脏页很多,而有些实例很少,那么应该多作刷脏动作的bp就可能产生堆积。 我们之前在webscalesql google公开讨论组有过类似的讨论,感兴趣的可以看看。

 

回到正题上来,在5.7.6版本中,计算目标page数的方法大概如下:
#根据当前脏页占比和lsn增长状态,计算利用IO CAPACITY的百分比(pct_total)
#计算目标lsn:
     target_lsn = oldest_lsn + lsn_avg_rate * buf_flush_lsn_scan_factor
其中oldest_lsn表示当前buffer pool中最老page的lsn,lsn_avg_rate表示每秒Lsn推进的平均速率,buf_flush_lsn_scan_factor目前是hardcode的,值为3。

 

#统计每个buffer pool 小于target_lsn的page数pages_for_lsn
初步估定每个bp instance 的n_pages_requested= pages_for_lsn /buf_flush_lsn_scan_factor
每个bp的pages_for_lsn被累加到sum_pages_for_lsn

 

#同时根据io capacity的百分比估算的总的page flush的量
sum_pages_for_lsn /= buf_flush_lsn_scan_factor;
n_pages = (PCT_IO(pct_total) + avg_page_rate + sum_pages_for_lsn) / 3;

 

n_pages若超过innodb_io_capacity_max,则设置为innodb_io_capacity_max

 

#轮询每个Buffer pool instance:
如果当前有足够的redo 空间时:n_pages_requested  = n_pages / srv_buf_pool_instances
否则:n_pages_requested = n_pages_requested  * n_pages / sum_pages_for_lsn
也就是说,在redo 空间足够时,依然采用均衡的刷脏逻辑。

 

在早期版本中,会根据两个条件来判断每个bp刷脏的进度:目标LSN及page数。而到了5.7.6版本里,大多数情况下只根据更加准确的请求刷page数来进行判定 (系统空闲时进行100% io capactiy的page flush、崩溃恢复时、以及实例shutdown时的刷脏除外)

 

虽然计算方式比较清晰,但有些factor的定值依然让人很困惑,也许是官方测试的比较理想的配置。不过最好还是设置成可配置的,由用户根据自己具体的负载情况来进行定制。

 

 

修改三、用户线程在检查redo 空间时不参与刷脏

 

当redo file中未做checkpoint的日志量过多时,在早期版本中中用户线程会进行batch flush操作,将每个buffer pool instance的lsn推进到某个指定的LSN。如果某个bp instance已经有别的线程在flush,则跳过尝试下一个instance,同时认为这次的flush操作是失败的,会返回重试。

 

当用户线程参与到刷脏时,通常会认为这是个性能拐点,TPS会出现急剧下降,大量线程陷入condtion wait。因此在5.7.6里,当用户线程需要推进LSN时,不再主动发起刷脏,而是轮询每个bp instance,直到所有的bp instance 的lsn超过其目标LSN,每次轮询默认sleep重试时间为10000微妙

 

事实上, Percona Server在5.6版本里已经使用相同的策略了。

 

修改四、为page cleaner线程设置更高的优先级

 

在Linux平台下,对于page cleaner的协调线程和worker线程,其CPU优先级被设置为-20,即最高优先级,通过函数set_priority设置。目前还不支持参数配置

 

修改五、防止checkpoint LSN被覆盖

 

在之前的版本中,尽管每次在写redo时,都会去检察redo文件是否容留了足够百分比的可用空间,但实际上并没有考虑即将写入到的redo log长度。如果我们操作一些极大的记录时,产生很长的redo log记录,可能导致检查点LSN被覆盖掉,造成不能做安全的crash recovery。

 

在新的逻辑里,在检测到当前写入的redo 可能造成覆盖检察点时,就会sleep等待page cleaner线程刷脏,并做redo log checkpoint。直到checkpoint的LSN推进到安全的位置。

 

 

除了上述几点外,还加入了更丰富的监控项
相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
16天前
|
存储 关系型数据库 MySQL
MySQL引擎对决:深入解析MyISAM和InnoDB的区别
MySQL引擎对决:深入解析MyISAM和InnoDB的区别
31 0
|
1天前
|
SQL 关系型数据库 MySQL
【MySQL】SQL优化
【MySQL】SQL优化
|
2天前
|
SQL 关系型数据库 MySQL
不允许你不知道的 MySQL 优化实战(一)
不允许你不知道的 MySQL 优化实战(一)
10 2
|
3天前
|
存储 缓存 关系型数据库
掌握MySQL数据库这些优化技巧,事半功倍!
掌握MySQL数据库这些优化技巧,事半功倍!
|
4天前
|
缓存 关系型数据库 MySQL
MySQL数据库优化技巧:提升性能的关键策略
索引是提高查询效率的关键。根据查询频率和条件,创建合适的索引能够加快查询速度。但要注意,过多的索引可能会增加写操作的开销,因此需要权衡。
|
4天前
|
SQL Oracle 关系型数据库
下次老板问你MySQL如何优化时,你可以这样说,老板默默给你加工资
现在进入国企或者事业单位做技术的网友越来越多了,随着去O的力度越来越大,很多国企单位都开始从Oracle向MySQL转移,相对于Oracle而言,MySQL最大的问题就是性能,所以,这个时候,在公司如果能够处理好MySQL的性能瓶颈,那么你也就很容易从人群中脱颖而出,受到老板的青睐。
22 1
|
13天前
|
SQL 关系型数据库 数据库
【后端面经】【数据库与MySQL】SQL优化:如何发现SQL中的问题?
【4月更文挑战第12天】数据库优化涉及硬件升级、操作系统调整、服务器/引擎优化和SQL优化。SQL优化目标是减少磁盘IO和内存/CPU消耗。`EXPLAIN`命令用于检查SQL执行计划,关注`type`、`possible_keys`、`key`、`rows`和`filtered`字段。设计索引时考虑外键、频繁出现在`where`、`order by`和关联查询中的列,以及区分度高的列。大数据表改结构需谨慎,可能需要停机、低峰期变更或新建表。面试中应准备SQL优化案例,如覆盖索引、优化`order by`、`count`和索引提示。优化分页查询时避免大偏移量,可利用上一批的最大ID进行限制。
39 3
|
1月前
|
存储 关系型数据库 MySQL
MySQL InnoDB数据存储结构
MySQL InnoDB数据存储结构
|
1月前
|
存储 缓存 关系型数据库
MySQL的varchar水真的太深了——InnoDB记录存储结构
varchar(M) 能存多少个字符,为什么提示最大16383?innodb怎么知道varchar真正有多长?记录为NULL,innodb如何处理?某个列数据占用的字节数非常多怎么办?影响每行实际可用空间的因素有哪些?本篇围绕innodb默认行格式dynamic来说说原理。
835 6
MySQL的varchar水真的太深了——InnoDB记录存储结构
|
3月前
|
存储 SQL 关系型数据库
系统设计场景题—MySQL使用InnoDB,通过二级索引查第K大的数,时间复杂度是多少?
系统设计场景题—MySQL使用InnoDB,通过二级索引查第K大的数,时间复杂度是多少?
47 1
系统设计场景题—MySQL使用InnoDB,通过二级索引查第K大的数,时间复杂度是多少?