让MySQL插上缓存的翅膀

本文涉及的产品
云原生多模数据库 Lindorm,多引擎 多规格 0-4节点
云数据库 MongoDB,独享型 2核8GB
推荐场景:
构建全方位客户视图
云原生内存数据库 Tair,内存型 2GB
简介: 本文重点介绍阿里云数据库MySQL的内核查询加速技术Fast Query Cache功能。

阿里云关系型数据库RDS(Relational Database Service) MySQL 是一种高效、稳定、安全可靠、可弹性伸缩的在线MySQL数据库服务。为了提供极具竞争力的MySQL服务,阿里云RDS MySQL在包括内核、管理系统上都有深度的技术加强和优化,本系列文章将会逐一对RDS MySQL特性进行拆解,主要从效能、稳定性、安全三个角度分享相比开源MySQL自建核心优势。

本文重点介绍阿里云数据库MySQL的内核查询加速技术Fast Query Cache功能。

数据库是企业的核心资产,尤其是基于互联网业务的现代企业,较于传统型企业,其系统的数据量和访问量都高出很多,并且存在突峰爆发的场景。数据库的稳定表现往往直接关系的企业业务的连续性,甚至可能关系企业生死。

1. OLTP数据库的请求特点和优化方案

大部分的业务数据库系统都是在线事务性(OLTP)的,究其特点,一是单次操作数据库的关系数据量很少,如几条记录或者几十条记录;二是对数据库的读请求量要远高于写请求量,即读写比严重不平衡,如电商业务订单系统,一条订单随业务推展而状态改变约在10次,而对应的查询次数要超过200次。所以OLTP类数据库的资源主要消耗于对小数据量的查询请求处理。

为了解决这种读写比倾斜严重的问题,一般会采取如下几种方案:

方案一:扩容数据库硬件,尤其是增加内存,我们称之为 数据库的Scale up的方案。对应MySQL增加Buffer Pool大小,可快速有效提升性能。

方案二:可称之为数据库的Scale out方案,增加数据库读副本,MySQL相对比较容易做到,通过建立多个只读备库可极大的扩充数据库的读请求处理能力。但本方案带来一个问题,就是应用要实现对读写请求的路由识别,只将读请求(非事务内)路由到只读库,否则大量写请求路由到只读库后业务将会出现大量失败,“不小心”还会导致数据写入错误。另外,应用还需要关注只读库与源库的数据延迟时间,时间太长一般业务都难以接受,经验来看秒级延迟是基本要求。

方案三:对业务系统进行架构改造,做大量的解耦工作,针对核心表做成中心服务化形式对外提供服务,如阿里淘宝天猫的几大C系统模式。该方案的核心就是引入缓存系统,一般开源如Redis系统,利用缓存承接大量的读请求,但整体系统需要考虑缓存失效的问题,同时还要分别维护缓存和数据库两套系统,技术研发成本较高。

2. 开源MySQL的Query Cache方案和问题

从上述三种方案比较来看,方案三增加查询结果集缓存是对数据库非常理想的解决方案,这也是大型互联网公司普遍采用的方案,但此方案毕竟要涉及不少的应用系统改造,工程量较大,故MySQL引入了一种查询缓存技术(Query Cache)。

MySQL Query Cache的执行流程图如下,其保存查询返回的完整结果,当新查询命中该缓存会立刻返回结果,跳过了SQL解析、优化和执行等复杂阶段。同时Query Cache会跟踪查询中涉及的每个表,如果这些表发生变化,那么和这个表相关的所有缓存都将失效。

640.png

MySQL Query Cache原理上是通过使用额外内存来节约CPU资源来达到查询加速的目标,是一项非常实用的技术,与MySQL组合Redis方案相比,具有以下几个优势:

  • 应用透明,使用Query Cache可以不更改客户端应用程序,只需要在Server端进行简单配置,而使用Redis则需要更改客户端应用程序。
  • 数据一致,使用Query Cache无数据同步问题,并且可以保证事务级一致性,而使用Redis则涉及数据同步,无法实现事务级一致性。
  • 成熟稳定,MySQL有成熟的事务引擎及复制技术,可以保证数据不丢失,而Redis的持久化及复制技术不够成熟,使用Redis需要考虑到数据丢失的问题。

但开源MySQL 实现的Query Cache不够优雅,实际应用中存在不少问题:

  • 并发处理不够好,在多核情况下,可能并发越高性能退化越严重。
  • 当缓存命中率较低时,性能无提升甚至会出现严重退化。
  • 内存管理问题,内存利用率低并且回收不及时,造成内存浪费。
  • 当向某个表写入数据的时候,必须将这个表所有的缓存设置为失效,如果缓存空间很大,则消耗也会很大,可能使系统僵死一段时间,因为这个操作是靠全局锁操作来保护的。

3. 阿里云数据库MySQL的Fast Query Cache

阿里云数据库MySQL针对开源MySQL问题,通过对Query Cache重新设计,实现了一种更好的查询缓存机制,称为Fast Query Cache,解决了以上几个主要问题:

  • 优化并发控制:
    取消全局锁同步机制,并采用无锁机制,重新设计并发场景下的同步问题,能够充分利用多核的处理能力,保证高并发场景下的性能。
  • 优化缓存机制:
    动态检测缓存利用率,实时调整缓存策略,解决命中率偏低或读写混合等场景下的性能退化问题。
  • 优化内存管理:取消内存预分配机制,采用更加灵活的动态内存分配机制,无效的内存及时回收,保证内存的真实利用率。

阿里云数据库MySQL Fast Query Cache 开启方法和开源Query Cache完全一致,通过query_cache_type参数设置为“ON”打开。在实际测试中,采用4核8GB内存的机器,利用sysbench压测,总共数据量有250MB(25张表,每张表40000条记录),效果非常好。

1) 全部命中只读场景

Sysbench oltp_point_select,用例中仅包括主键上的点查(point select),将Query Cache设为512MB,内存大于测试数据量,缓存命中率达到99%以上。

640-1.png

测试结果显示,在较高并发的场景下,MySQL原生Query Cache并发处理性能出现较大幅度的降低,Fast Query Cache在各个并发场景下无性能降低,最高时能够提高一倍的QPS。

2) 高命中率只读场景

Sysbench oltp_read_only,用例中包含返回多条记录的范围查询,将Query Cache设为512MB,内存才相对比较充足,命中率可以达到80%以上。

640-2.png

测试结果显示,随着并发数的增加,MySQL原生Query Cache的性能出现明显的降低,Fast Query Cache的性能则会不断提升,最高时能够提高一倍多的QPS。

3) 低命中率只读场景

Sysbench oltp_read_only,用例中包含返回多条记录的范围查询,将Query Cache设为16MB,内存明显严重不足,缓存命中率只有10%左右,内存不足时会涉及缓存项的大量淘汰,影响性能。

640-3.png

测试结果显示,MySQL原生Query Cache的性能降低明显,最多出现了接近50%的性能损失,Fast Query Cache优化了低命中率场景,将性能损失控制在2%以内。

4) 读写混合场景

Sysbench oltp_read_write,每个事务中都有对表的更新操作,可以认为缓存基本处于失效状态,频繁的更新操作涉及缓存的主动淘汰,理论上会比较影响性能。

640-4.png

测试结果显示,Fast Query Cache在读写混合场景下不会出现过多的性能降低,整体性能影响控制在2%以内。

4. 总结

最后,阿里云数据库MySQL Fast Query Cache大大增强了数据库查询性能,通过增加一点点的内存换取巨大的性能提升,在主要业务场景(读场景)中性能提升达到1倍,将会取得巨大的收益,在使用方式上和开源MySQL Query Cache保持完全一致,具备领先业界的产品竞争力。

目前Fast Query Cache已经在RDS 和 云专属集群RDS中具备。云数据库专属集群RDS,用户100%独占底层物理机,且支持用户通过弹性资源功能灵活调配数据库实例资源占用,这样开启Fast Query Cache将会再获得一倍性能收益,结合CPU超配技术最少获得的一倍收益,则相比于在物理机自建,专属集群整体成本可达到后者约30%,是目前云上企业最好的数据库节省成本方案。

相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
2月前
|
SQL 缓存 关系型数据库
MySQL技能完整学习列表6、查询优化——3、查询缓存——4、SQL优化技巧
MySQL技能完整学习列表6、查询优化——3、查询缓存——4、SQL优化技巧
81 0
|
2天前
|
存储 缓存 关系型数据库
MySQL数据库缓存query_cache 19
【7月更文挑战第19天】MySQL数据库缓存query_cache
135 73
|
2月前
|
缓存 关系型数据库 MySQL
MySQL 查询优化:提速查询效率的13大秘籍(索引设计、查询优化、缓存策略、子查询优化以及定期表分析和优化)(中)
MySQL 查询优化:提速查询效率的13大秘籍(索引设计、查询优化、缓存策略、子查询优化以及定期表分析和优化)(中)
182 0
|
1月前
|
存储 缓存 监控
MySQL 8.0中查询缓存的废弃与原因分析
MySQL 8.0中查询缓存的废弃与原因分析
44 1
|
1月前
|
缓存 分布式计算 关系型数据库
数据管理DMS操作报错合集之当进行RDS实例的可用区迁移时,提示“缓存清理”是什么意思
数据管理DMS(Data Management Service)是阿里云提供的数据库管理和运维服务,它支持多种数据库类型,包括RDS、PolarDB、MongoDB等。在使用DMS进行数据库操作时,可能会遇到各种报错情况。以下是一些常见的DMS操作报错及其可能的原因与解决措施的合集。
|
2月前
|
缓存 NoSQL 关系型数据库
在Python Web开发过程中:数据库与缓存,MySQL和NoSQL数据库的主要差异是什么?
MySQL与NoSQL的主要区别在于数据结构、查询语言和可扩展性。MySQL是关系型数据库,依赖预定义的数据表结构,使用SQL进行复杂查询,适合垂直扩展。而NoSQL提供灵活的存储方式(如JSON、哈希表),无统一查询语言,支持横向扩展,适用于处理大规模、非结构化数据和高并发场景。选择哪种取决于应用需求、数据模型及扩展策略。
232 0
|
2月前
|
缓存 NoSQL 关系型数据库
解决MySQL与Redis缓存一致性的问题
选择适合的策略取决于系统的需求和复杂性,通常需要根据业务场景综合考虑,以实现MySQL与Redis缓存的一致性。 买CN2云服务器,免备案服务器,高防服务器,就选蓝易云。百度搜索:蓝易云
35 0
|
2月前
|
SQL 缓存 关系型数据库
MySQL的万字总结(缓存,索引,Explain,事务,redo日志等)
MySQL的万字总结(缓存,索引,Explain,事务,redo日志等)
102 0
|
29天前
|
存储 缓存 NoSQL
redis缓存优化
采用获取一次缓存,如果为空的情况,获取分布式锁,让一个线程去重建缓存,另外的线程未获取到锁的情况,休眠短时间,然后再自旋获取缓存。
26 0
|
8天前
|
canal 缓存 NoSQL
Redis常见面试题(一):Redis使用场景,缓存、分布式锁;缓存穿透、缓存击穿、缓存雪崩;双写一致,Canal,Redis持久化,数据过期策略,数据淘汰策略
Redis使用场景,缓存、分布式锁;缓存穿透、缓存击穿、缓存雪崩;先删除缓存还是先修改数据库,双写一致,Canal,Redis持久化,数据过期策略,数据淘汰策略
Redis常见面试题(一):Redis使用场景,缓存、分布式锁;缓存穿透、缓存击穿、缓存雪崩;双写一致,Canal,Redis持久化,数据过期策略,数据淘汰策略