让MySQL插上缓存的翅膀

本文涉及的产品
云数据库 MongoDB,独享型 2核8GB
推荐场景:
构建全方位客户视图
Redis 开源版,标准版 2GB
推荐场景:
搭建游戏排行榜
云数据库 Tair(兼容Redis),内存型 2GB
简介: 本文重点介绍阿里云数据库MySQL的内核查询加速技术Fast Query Cache功能。

阿里云关系型数据库RDS(Relational Database Service) MySQL 是一种高效、稳定、安全可靠、可弹性伸缩的在线MySQL数据库服务。为了提供极具竞争力的MySQL服务,阿里云RDS MySQL在包括内核、管理系统上都有深度的技术加强和优化,本系列文章将会逐一对RDS MySQL特性进行拆解,主要从效能、稳定性、安全三个角度分享相比开源MySQL自建核心优势。

本文重点介绍阿里云数据库MySQL的内核查询加速技术Fast Query Cache功能。

数据库是企业的核心资产,尤其是基于互联网业务的现代企业,较于传统型企业,其系统的数据量和访问量都高出很多,并且存在突峰爆发的场景。数据库的稳定表现往往直接关系的企业业务的连续性,甚至可能关系企业生死。

1. OLTP数据库的请求特点和优化方案

大部分的业务数据库系统都是在线事务性(OLTP)的,究其特点,一是单次操作数据库的关系数据量很少,如几条记录或者几十条记录;二是对数据库的读请求量要远高于写请求量,即读写比严重不平衡,如电商业务订单系统,一条订单随业务推展而状态改变约在10次,而对应的查询次数要超过200次。所以OLTP类数据库的资源主要消耗于对小数据量的查询请求处理。

为了解决这种读写比倾斜严重的问题,一般会采取如下几种方案:

方案一:扩容数据库硬件,尤其是增加内存,我们称之为 数据库的Scale up的方案。对应MySQL增加Buffer Pool大小,可快速有效提升性能。

方案二:可称之为数据库的Scale out方案,增加数据库读副本,MySQL相对比较容易做到,通过建立多个只读备库可极大的扩充数据库的读请求处理能力。但本方案带来一个问题,就是应用要实现对读写请求的路由识别,只将读请求(非事务内)路由到只读库,否则大量写请求路由到只读库后业务将会出现大量失败,“不小心”还会导致数据写入错误。另外,应用还需要关注只读库与源库的数据延迟时间,时间太长一般业务都难以接受,经验来看秒级延迟是基本要求。

方案三:对业务系统进行架构改造,做大量的解耦工作,针对核心表做成中心服务化形式对外提供服务,如阿里淘宝天猫的几大C系统模式。该方案的核心就是引入缓存系统,一般开源如Redis系统,利用缓存承接大量的读请求,但整体系统需要考虑缓存失效的问题,同时还要分别维护缓存和数据库两套系统,技术研发成本较高。

2. 开源MySQL的Query Cache方案和问题

从上述三种方案比较来看,方案三增加查询结果集缓存是对数据库非常理想的解决方案,这也是大型互联网公司普遍采用的方案,但此方案毕竟要涉及不少的应用系统改造,工程量较大,故MySQL引入了一种查询缓存技术(Query Cache)。

MySQL Query Cache的执行流程图如下,其保存查询返回的完整结果,当新查询命中该缓存会立刻返回结果,跳过了SQL解析、优化和执行等复杂阶段。同时Query Cache会跟踪查询中涉及的每个表,如果这些表发生变化,那么和这个表相关的所有缓存都将失效。

640.png

MySQL Query Cache原理上是通过使用额外内存来节约CPU资源来达到查询加速的目标,是一项非常实用的技术,与MySQL组合Redis方案相比,具有以下几个优势:

  • 应用透明,使用Query Cache可以不更改客户端应用程序,只需要在Server端进行简单配置,而使用Redis则需要更改客户端应用程序。
  • 数据一致,使用Query Cache无数据同步问题,并且可以保证事务级一致性,而使用Redis则涉及数据同步,无法实现事务级一致性。
  • 成熟稳定,MySQL有成熟的事务引擎及复制技术,可以保证数据不丢失,而Redis的持久化及复制技术不够成熟,使用Redis需要考虑到数据丢失的问题。

但开源MySQL 实现的Query Cache不够优雅,实际应用中存在不少问题:

  • 并发处理不够好,在多核情况下,可能并发越高性能退化越严重。
  • 当缓存命中率较低时,性能无提升甚至会出现严重退化。
  • 内存管理问题,内存利用率低并且回收不及时,造成内存浪费。
  • 当向某个表写入数据的时候,必须将这个表所有的缓存设置为失效,如果缓存空间很大,则消耗也会很大,可能使系统僵死一段时间,因为这个操作是靠全局锁操作来保护的。

3. 阿里云数据库MySQL的Fast Query Cache

阿里云数据库MySQL针对开源MySQL问题,通过对Query Cache重新设计,实现了一种更好的查询缓存机制,称为Fast Query Cache,解决了以上几个主要问题:

  • 优化并发控制:
    取消全局锁同步机制,并采用无锁机制,重新设计并发场景下的同步问题,能够充分利用多核的处理能力,保证高并发场景下的性能。
  • 优化缓存机制:
    动态检测缓存利用率,实时调整缓存策略,解决命中率偏低或读写混合等场景下的性能退化问题。
  • 优化内存管理:取消内存预分配机制,采用更加灵活的动态内存分配机制,无效的内存及时回收,保证内存的真实利用率。

阿里云数据库MySQL Fast Query Cache 开启方法和开源Query Cache完全一致,通过query_cache_type参数设置为“ON”打开。在实际测试中,采用4核8GB内存的机器,利用sysbench压测,总共数据量有250MB(25张表,每张表40000条记录),效果非常好。

1) 全部命中只读场景

Sysbench oltp_point_select,用例中仅包括主键上的点查(point select),将Query Cache设为512MB,内存大于测试数据量,缓存命中率达到99%以上。

640-1.png

测试结果显示,在较高并发的场景下,MySQL原生Query Cache并发处理性能出现较大幅度的降低,Fast Query Cache在各个并发场景下无性能降低,最高时能够提高一倍的QPS。

2) 高命中率只读场景

Sysbench oltp_read_only,用例中包含返回多条记录的范围查询,将Query Cache设为512MB,内存才相对比较充足,命中率可以达到80%以上。

640-2.png

测试结果显示,随着并发数的增加,MySQL原生Query Cache的性能出现明显的降低,Fast Query Cache的性能则会不断提升,最高时能够提高一倍多的QPS。

3) 低命中率只读场景

Sysbench oltp_read_only,用例中包含返回多条记录的范围查询,将Query Cache设为16MB,内存明显严重不足,缓存命中率只有10%左右,内存不足时会涉及缓存项的大量淘汰,影响性能。

640-3.png

测试结果显示,MySQL原生Query Cache的性能降低明显,最多出现了接近50%的性能损失,Fast Query Cache优化了低命中率场景,将性能损失控制在2%以内。

4) 读写混合场景

Sysbench oltp_read_write,每个事务中都有对表的更新操作,可以认为缓存基本处于失效状态,频繁的更新操作涉及缓存的主动淘汰,理论上会比较影响性能。

640-4.png

测试结果显示,Fast Query Cache在读写混合场景下不会出现过多的性能降低,整体性能影响控制在2%以内。

4. 总结

最后,阿里云数据库MySQL Fast Query Cache大大增强了数据库查询性能,通过增加一点点的内存换取巨大的性能提升,在主要业务场景(读场景)中性能提升达到1倍,将会取得巨大的收益,在使用方式上和开源MySQL Query Cache保持完全一致,具备领先业界的产品竞争力。

目前Fast Query Cache已经在RDS 和 云专属集群RDS中具备。云数据库专属集群RDS,用户100%独占底层物理机,且支持用户通过弹性资源功能灵活调配数据库实例资源占用,这样开启Fast Query Cache将会再获得一倍性能收益,结合CPU超配技术最少获得的一倍收益,则相比于在物理机自建,专属集群整体成本可达到后者约30%,是目前云上企业最好的数据库节省成本方案。

相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
19天前
|
SQL 缓存 关系型数据库
美团面试:Mysql 有几级缓存? 每一级缓存,具体是什么?
在40岁老架构师尼恩的读者交流群中,近期有小伙伴因未能系统梳理MySQL缓存机制而在美团面试中失利。为此,尼恩对MySQL的缓存机制进行了系统化梳理,包括一级缓存(InnoDB缓存)和二级缓存(查询缓存)。同时,他还将这些知识点整理进《尼恩Java面试宝典PDF》V175版本,帮助大家提升技术水平,顺利通过面试。更多技术资料请关注公号【技术自由圈】。
美团面试:Mysql 有几级缓存? 每一级缓存,具体是什么?
|
17天前
|
缓存 NoSQL 关系型数据库
mysql和缓存一致性问题
本文介绍了五种常见的MySQL与Redis数据同步方法:1. 双写一致性,2. 延迟双删策略,3. 订阅发布模式(使用消息队列),4. 基于事件的缓存更新,5. 缓存预热。每种方法的实现步骤、优缺点均有详细说明。
|
4月前
|
存储 缓存 关系型数据库
MySQL数据库缓存query_cache 19
【7月更文挑战第19天】MySQL数据库缓存query_cache
178 73
|
2月前
|
缓存 NoSQL 关系型数据库
MySQL与Redis缓存一致性的实现与挑战
在现代软件开发中,MySQL作为关系型数据库管理系统,广泛应用于数据存储;而Redis则以其高性能的内存数据结构存储特性,常被用作缓存层来提升数据访问速度。然而,当MySQL与Redis结合使用时,确保两者之间的数据一致性成为了一个重要且复杂的挑战。本文将从技术角度分享MySQL与Redis缓存一致性的实现方法及其面临的挑战。
144 2
|
3月前
|
缓存 NoSQL Redis
一天五道Java面试题----第九天(简述MySQL中索引类型对数据库的性能的影响--------->缓存雪崩、缓存穿透、缓存击穿)
这篇文章是关于Java面试中可能会遇到的五个问题,包括MySQL索引类型及其对数据库性能的影响、Redis的RDB和AOF持久化机制、Redis的过期键删除策略、Redis的单线程模型为何高效,以及缓存雪崩、缓存穿透和缓存击穿的概念及其解决方案。
|
3月前
|
缓存 NoSQL 关系型数据库
(八)漫谈分布式之缓存篇:唠唠老生常谈的MySQL与Redis数据一致性问题!
本文来聊一个跟实际工作挂钩的老生常谈的问题:分布式系统中的缓存一致性。
153 11
|
3月前
|
缓存 关系型数据库 MySQL
【缓存大对决】Memcached VS MySQL查询缓存,谁才是真正的性能之王?
【8月更文挑战第24天】在现代Web应用中,缓存技术对于提升性能与响应速度至关重要。本文对比分析了Memcached与MySQL查询缓存这两种常用方案。Memcached是一款高性能分布式内存对象缓存系统,支持跨服务器共享缓存,具备灵活性与容错性,但受限于内存大小且不支持数据持久化。MySQL查询缓存内置在MySQL服务器中,简化了缓存管理,特别适用于重复查询,但功能较为单一且扩展性有限。两者各有所长,实际应用中可根据需求单独或结合使用,实现最佳性能优化。
116 0
|
1月前
|
消息中间件 缓存 NoSQL
Redis 是一个高性能的键值对存储系统,常用于缓存、消息队列和会话管理等场景。
【10月更文挑战第4天】Redis 是一个高性能的键值对存储系统,常用于缓存、消息队列和会话管理等场景。随着数据增长,有时需要将 Redis 数据导出以进行分析、备份或迁移。本文详细介绍几种导出方法:1)使用 Redis 命令与重定向;2)利用 Redis 的 RDB 和 AOF 持久化功能;3)借助第三方工具如 `redis-dump`。每种方法均附有示例代码,帮助你轻松完成数据导出任务。无论数据量大小,总有一款适合你。
74 6
|
7天前
|
缓存 NoSQL 关系型数据库
大厂面试高频:如何解决Redis缓存雪崩、缓存穿透、缓存并发等5大难题
本文详解缓存雪崩、缓存穿透、缓存并发及缓存预热等问题,提供高可用解决方案,帮助你在大厂面试和实际工作中应对这些常见并发场景。关注【mikechen的互联网架构】,10年+BAT架构经验倾囊相授。
大厂面试高频:如何解决Redis缓存雪崩、缓存穿透、缓存并发等5大难题
|
9天前
|
存储 缓存 NoSQL
【赵渝强老师】基于Redis的旁路缓存架构
本文介绍了引入缓存后的系统架构,通过缓存可以提升访问性能、降低网络拥堵、减轻服务负载和增强可扩展性。文中提供了相关图片和视频讲解,并讨论了数据库读写分离、分库分表等方法来减轻数据库压力。同时,文章也指出了缓存可能带来的复杂度增加、成本提高和数据一致性问题。
【赵渝强老师】基于Redis的旁路缓存架构