参数优化|学习笔记

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: 快速学习参数优化

开发者学堂课程【云数据库优化经典案例:参数优化】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/67/detail/1162


参数优化


参数优化有很多客户问到 madc 参数是否可以自己去配置,我们有很多的参数,比如,内存的参数和数据安全的参数,这一块基本上用户是无法配置的。

我们可以配置 tapk , sortpython,等等,按照用户应用的特点可以去配置。

(一)一个参数引发的血案

图片8.png

这是一个参数引发的血案,背景介绍是某客户正在将本地的业务系统迁移上云,在 rads 上运行时间明显要比线下自建数据库运行时间要慢一倍,导致客户系统割接延期的风险。

所以我们当时就要排查为什么他的本地ck,这个ck为什么在用户本地自建。

第二,跨压力式。所以我们去分析,这也是非常经典的案例。

图片9.png

出现这样一个情况之后,我们才去分析一个 ck 从一个平台迁移到另一个平台,那我们去看是不是发生了第一个数据库跨平台迁移,比如 PG 是不是迁移到 MySQL ,ORALCE 迁到 MySQL。

第二个去看他的版本是不是发生了变迁,MySQL 5.1版本上升到5.5版本,5.5版本上升到5.6版本。

因为这样的大版本发生变迁最终会影响 ck 的执行计划, ck 的执行计划会受限于优化器,参数配置,包括其中硬件配置的影响。所以我们可以通过以上三个点的经验来一一排查。

图片10.png

如果没有出现跨数据库的迁移,用户是 rads 5.6,那我们再具体对一下优化器参数,因为这个优化器最终会影响 ck 的执行计划。那我们可以看到,备了用户本地的 ck 优化器,以及云上 RADS 这个优化器,基本上没有太大的变化。这个前面两个我们就排除了。

分析 CK 的执行计划  

大家可以看到这个 ck 是非常复杂的,因为他有12行的执行计划,所以我们如何快速判断这个执行计划有没有问题呢,当然我们可以通过一个简单的方法,我们可以通过每一行的 ROWS 乘起来,因为  MyCQL 的执行计划的算法是签到循环,就是 rows 这个每一行的乘积,对比这个 rows 没有太大的变化。

所以前面这个优化器的参数,执行计划的总函数也去看一下,所以前面两个排除。

image.png

第三个我们来看一下参数配置,参数配置的时候我们就发现了一些端倪,我们发现用户在配置文件,用户在对这三个参数进行特别大的调高,相对云上 RDS ,tmp-table-size=256k,但是用户他 tmp-table-size=128M,那这个就是我们很大的一个疑点,那我们把这三个参数一一的去排查。  

image.png

然后我们最终发现 tmp-table-size 由256k 调整至128MB 之后,这个性能从18.17sec下降至7.29sec,所以最终这个问题是由于这个参数调回128MB 之后,他的性能就比我们云上的要快。所以说到这个ck非常非常复杂,他会产生很多临时结构机,原来的256k 已经不满足 ck 中间的转换机,所以我们这时候调到128MB 的时候就和本地的数据和机了。

image.png

所以我们出现这样一个问题之后,一个ck跨平台出现数值下降,第一个看他的执行计划,第二个看他的数据库版本和优化器规则,然后我们要去对比这个参数设置以及可能他的硬件配置。

(二)参数最佳实践

image.png

在2015年的时候,在那个双十一,他的硬件配置是一个T的内存,cp 是64核的,按理来说他的数据库的配置是非常高的,但是怎么数据库他这边怎么都压不上去,但我们去看了之后发现,他的 MyCQL 的参数用了128MB,是非常低的配置,所以他整个一个T的内存都无法去使用,所以他那个参数配置太低了,而不能把硬件的配置发挥出来,所以我们把内存参数调整了之后,他那个数据库这个 tps 上升了几百倍,所以我们要综合去看。

所以这个参数我们还要提几个点,第一个关于 Query-cache-size,那个数据库做那个安全,有些ads是关于 Query-cache , 有些用户本地 Query-cache是打开的,这个时候很显然执行一次就缓存,但是 Query-cache 是关闭的,ck 非常强,这个时候就要关注这个 Query-cache 。

第三个,非常容易出错的是我们支持 Tokudb-buffer 这个引擎,但是没有为这个Tokudb-buffer 配 pool-ratio,所以导致这个 Tokudb 插入非常慢,那这个时候我们即用了 Temp 引擎又 Tokudb 引擎,一定要为 Tokudb 配 pool-ratio。

第四个是 Back-log,Back-log 这个短连接,这个应用一定要去了解一下,我们的数据库建立链接的这个队列,如果我们的短连接设的比较频繁,要把这个 Back-log 设的长一点

相关文章
|
机器学习/深度学习 缓存 监控
Pytorch学习笔记(7):优化器、学习率及调整策略、动量
Pytorch学习笔记(7):优化器、学习率及调整策略、动量
1099 0
Pytorch学习笔记(7):优化器、学习率及调整策略、动量
|
6月前
|
机器学习/深度学习 算法 网络架构
深度学习中的自动超参数优化技术探究
在深度学习模型的训练中,选择合适的超参数对模型性能至关重要。本文探讨了自动超参数优化技术在深度学习中的应用,分析了不同方法的优缺点,并着重讨论了基于贝叶斯优化和进化算法的最新进展。 【7月更文挑战第8天】
111 5
|
7月前
|
机器学习/深度学习 并行计算 算法
深度学习中的自动化超参数优化方法探究
传统的深度学习模型优化通常依赖于人工调整超参数,这一过程繁琐且耗时。本文探讨了当前流行的自动化超参数优化方法,包括贝叶斯优化、遗传算法和进化策略等,分析它们在提高模型效率和性能方面的应用与挑战。
|
8月前
|
Kubernetes Oracle Java
JVM调参实践总结
这篇文档探讨了JVM调优的最佳实践,重点关注Oracle的HotSpot VM。内容涵盖Java版本选择,建议使用Java 11、17或稳定版Java 8,尤其是对于需要免费版本的用户,可以选择OpenJDK。接着讨论了JVM类型,推荐根据需求平衡稳定性、性能和费用。在部署时,应考虑64位JVM,并确保与操作系统和CPU架构兼容。JVM运行模式建议使用Java 8及以后版本默认的混合模式。垃圾收集器的选择是一个关键点,需根据应用需求平衡吞吐量、延迟和内存占用。默认的垃圾收集器如Parallel Scavenge和Parallel Old适用于多数情况,但特定场景可能需要CMS或G1收集器。
56 1
|
8月前
|
机器学习/深度学习 Python
超参数优化:提升机器学习模型性能
【5月更文挑战第31天】超参数优化对提升机器学习模型性能至关重要。网格搜索和随机搜索是常见方法,Python示例展示了如何使用GridSearchCV进行网格搜索。其他高级技术包括基于梯度的优化和贝叶斯优化。优化时注意选择合适评估指标、划分训练验证集,并进行迭代调整。自动化工具可简化这一过程。超参数优化是一个持续演进的领域,对于构建高性能模型具有关键作用。
120 0
|
8月前
|
数据可视化 PyTorch 算法框架/工具
贝叶斯优化实战(四)(4)
贝叶斯优化实战(四)
71 0
|
8月前
|
机器学习/深度学习 存储 移动开发
贝叶斯优化实战(四)(2)
贝叶斯优化实战(四)
61 0
|
8月前
|
存储 数据可视化 PyTorch
贝叶斯优化实战(一)(2)
贝叶斯优化实战(一)
184 0
|
8月前
|
机器学习/深度学习 移动开发 数据可视化
贝叶斯优化实战(一)(4)
贝叶斯优化实战(一)
222 0
|
SQL 存储 NoSQL
调优建议|学习笔记
快速学习调优建议
347 0
调优建议|学习笔记