RDS发布会解读 | AliSQL内核新特性

本文涉及的产品
RDS SQL Server Serverless,2-4RCU 50GB 3个月
推荐场景:
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
简介: AliSQL在2020年做了不少事情,有必要总结分享一下,以便让大家更好地知道有哪些特性,可以在哪些业务场景中使用到,也是为了在2021年更好地向前发展。

作者:楼方鑫(黄忠)

AliSQL在2020年做了不少事情,有必要总结分享一下,以便让大家更好地知道有哪些特性,可以在哪些业务场景中使用到,也是为了在2021年更好地向前发展。在年初时计划的一些企业级功能基本上都实现了,并且在过程中特别强调了功能的场景通用性,不再是从某个行业某个特定业务或应用场景设计(比如电商秒杀),而是从云上众多用户的不同场景出发,并且不需要用户应用或SQL改造配合(直接一个开关就可以开启的),还要求在RDS 56/57/80三个主流版本上都有同样的体验,从云场景而生并为云场景服务的技术,都是云原生技术。这一目标角度的调整的确是给自己加了不少难度,但研发让所有云上用户都能轻松受益享受技术红利的新技术和功能,仍然让整个AliSQL团队兴奋不已


先来看一下2020年已经上线并且使用非常广泛几个功能和技术:

  • InnoDB Mutex Tuning,InnoDB使用B+ Tree来组织数据,当树的Branch节点需要分裂时,可能会层层向上直到根部,这个分裂是非常昂贵并且难以并发的操作,会严重影响性能。AliSQL在InnoDB的Index Mutex上做了优化,减少了所有页面分列的代价,改进算法优化了分裂的频率和深度,使得TPCC的性能测试提升了35-45%,并且在56/57/80三个版本上都已支持,已在100000+用户的数十万实例上平稳运行一周年多了。

  • Dynamic Thread Pool,AliSQL团队通过技术创新和改进,于年初在云上默认打开了线程池,56/57/80三个版本都已支持,已有100000+用户的数十万实例运行在线程池下,也就是让线程池不再挑场景,可以轻松胜任高并发的混合请求场景,而不像其他分支(如Percona或MariaDB)的线程池那样要求都是短平快的查询。到目前为止,我们应当是唯一一家默认开启线程池功能的RDS供应商,可以让实例支持更高的连接数,可以承受更强的短连接能力,可以节约宝贵的CPU和内存资源,可以提升上千并发(真实应用中连接数上千很容易)下的性能,让RDS客户在用更少资源得到更高QPS&TPS,享受到实实在在的技术红利。

  • Faster DDL,在遇到几次用户业务高峰对小表做DDL的性能抖动后,AliSQL团队深入分析了整个DDL过程,发现在DDL过程中Buffer Pool的管理方式不够优雅,就对其进行了改进,并在56/57/80三个版本上同步实现并发布上线,目前已有100000+用户的数十万实例开启了此功能,极大地缩短了业务高峰进行DDL所需的时间,有效地消除了稳定性风险,让阿里云RDS客户享受到了实实在在的好处。

  • Performance Agent,为了更好地排查性能问题,AliSQL团队研发了一个Performance Agent插件,以秒级频率和完全无锁的方式(相比在SQL中执行show global status命令)输出了数百个性能指标,并且提供了内存视图来查询和分析这些性能数据,使得我们和客户可以基于同一份性能数据来快速高效地分析性能问题。同样在56/57/80三个版本上都实现了Performance Agent,已有100000+用户的数十万实例每秒钟都在记录实时性能数据。


再来看一下2020年上线但还未达到上述使用量的功能和技术:

  • Binlog In Redo,MySQL为了保证Binlog和InnoDB数据的一致性,使用两阶段XA事务来协调Binlog的落盘和InnoDB Redo Log的落盘,这时每一个事务的提交需要做两次刷盘操作,这对一些对时延(RT,Response Time)敏感的应用,或者使用云盘的实例是不够理想的。AliSQL团队对事务提交过程进行了仔细严谨的梳理,提出了将Binlog写到Redo Log的方案,使得事务提交时不再需要同步Binlog文件,仅需要同步Redo Log,相当于减少了一次落盘操作,从而在保证数据一致性的基础上缩短了事务提交操作的延时,并且提升了事务提交的性能。

  • Fast Query Cache,在架构设计中Cache为王,看Oracle 21中增加了对持久化内存的支持,累计达到7层缓存设计,我们当然不能放过Query Cache。Query Cache具有对应用完全透明的优势,在仔细压测分析原生Query Cache功能后,发现性能不够理想后,设计出了版本化的Fast Query Cache技术,解决了原生Query Cache中的并发性限制,使得纯读性能最高可以提升100%+,并且在写场景中基本没有额外性能损耗。欢迎大家来使用Fast Query Cache,如今已经可以自行调整内存参数进行开启,如果你还在用原生的Query Cache,则可以升级到较新的版本,来享受AliSQL带来的Cache技术红利。

  • Recycle Bin & Data Protect,在2020年业界发生了几次由删库删表引起的安全事故,我们深表痛惜和警觉,AliSQL团队设计了Recycle Bin和Data Protect功能,以主动应对类似风险。Recycle Bin会自动将删除的表先移到回收站,直到进一步清空回收站(可以额外控制权限)时才会真正删除表,在Purge之前都可以从回收站中还原数据;而Data Protect则可以严格限制可以执行删除操作的用户,从权限和目标两个维度进行控制,以帮助大家保障数据安全(需要自行开启)。


再来提前看一下2020年研发完成还未上线的功能和技术(会在2021年Q1发布上线):

  • Flashback Query,有时候可能面临执行错误DML语句(比如Delete/Update没有准确的Where条件)的紧急场景,会要求我们快速将数据恢复到错误DML语句执行之前的数据状态,过去我们需要去下载、分析Binlog文件,再利用工具去生成反向操作的SQL语句进行恢复,步骤比较复杂。在具备Flashback Query技术后,可以直接穿越到过去的时间点(误操作之前的)执行SQL语句,将准确的数据找出来进行快速恢复。

  • Buffer Pool Freely Resize,为了提升RDS的内存弹性,AliSQL团队仔细研究分析了InnoDB Buffer Pool动态调整的逻辑,识别并优化了相关逻辑,使得在线缩减Buffer Pool大小变得基本没有风险,让不重启实例的内存规格弹性在技术上先成为可能

  • MultiBlock Read,针对用户反馈的大表DDL或大查询慢的问题,AliSQL团队仔细分析了Buffer IO的代码逻辑,并找到了其中的欠缺,每次只读一个块是非常低效的行为,对于连续的数据块访问(Range Scan或Full Table Scan)可以一次性读取多个块来提升IO效率,从而使得大表扫描的速度得以大幅度提升,也就是说大查询或DDL的时间有望缩短25-50%左右

  • Faster LRU Scan,有相当一部分客户的业务发展非常好,数据量激增,给系统带来压力,在分析和支持客户发展的过程中,AliSQL团队发现原生MySQL的Buffer Pool LRU淘汰机制有欠缺,在访问的数据量远大于内存规格时,会进入低效的Singe Page Flush淘汰机制,存在着逻辑上的欠缺。对此我们优化和设计了一种更好的淘汰机制,使得同等情况下QPS & TPS可以提升10-20%,让客户在同等的资源下可以有更高的性能,为客户切切实实地节约成本。

  • Automatic Hot Queue,这是对电商热杀秒杀功能的一个技术升级,原来需要应用更改SQL传入热点队列的标识,现在则可以自动分析DML语句中的Where条件,如果是PK或UK访问,则自动计算一个热点队列标识,进行并发控制排队,无须应用更改SQL传入热点标识,只需要简简单单地在后台打开开关


我们是第一个提供RDS 80服务的云产商,给社区排查和反馈了不少问题和缺陷,其中有一些是比较严重的会导致Crash的,在这里就不一一细说了。回顾2020年,真是相当忙而快乐的一年,忙是我们在努力为客户创建价值(提供技术红利),快乐是我们的一些技术和功能在云上得到大量的使用,并且还有一些非常有意义的事情(空间压缩、安全审计等方面)在等着我们去做。

2021云数据库RDS重磅升级发布会回顾:https://yqh.aliyun.com/live/detail/21815

相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
存储 关系型数据库 数据库
探索PostgreSQL 14新特性--SEARCH和CYCLE
探索PostgreSQL 14新特性--SEARCH和CYCLE
91 0
|
存储 缓存 关系型数据库
【PostgreSQL内核】Trigger的一生
前言本文简单介绍 PostgreSQL 数据库的 Trigger 从创建、存储、触发、执行、修改,到删除的过程,贯穿 Trigger 的一生。文中引用的函数、结构体来源于 PG 14 源码,分支为 REL_14_STABLE,对应的 commit id 如下。此外还引用了 PG 14 官方文档。commit be0b0528cb64d49750fcb632faa2cfcd8d920be2 Auth
572 0
|
存储 缓存 关系型数据库
PostgreSQL 14新特性--减少索引膨胀
PostgreSQL 14新特性--减少索引膨胀
487 0
|
存储 监控 AliSQL
RDS AliSQL 面向 Binlog 的性能优化大揭密(上)—— 极致 IO 优化
RDS MySQL使用AliSQL内核,为用户提供了MySQL所有的功能,同时提供了企业级的安全、备份、恢复、监控、性能优化、只读实例、Serverless等高级特性
3413 3
RDS AliSQL 面向 Binlog 的性能优化大揭密(上)—— 极致 IO 优化
|
AliSQL 关系型数据库 MySQL
RDS AliSQL 面向 Binlog 的性能优化大揭密(下)——强效瓶颈消除
本篇将继续揭秘AliSQL在binlog高并发性能上做的企业级优化。
RDS AliSQL 面向 Binlog 的性能优化大揭密(下)——强效瓶颈消除
|
Cloud Native 关系型数据库 MySQL
直播预告 | PostgreSQL 内核解读系列第六讲:PostgreSQL 索引介绍(下)
本系列课程将面向DBA、高校学生、内核爱好者,分15个章节,系统化介绍PG核心技术原理、用法和代码实现。希望通过课程学习,让没有内核经验的同学和DBA,也可以进行简单的特性开发,更深入理解PG配置和运行原理。本节课将讲述 PostgreSQL 索引基本介绍,涵盖Hash索引、Bitmap索引、GiST索引、GIN索引、brin索引、其他索引等内容。
直播预告 | PostgreSQL 内核解读系列第六讲:PostgreSQL 索引介绍(下)
|
Cloud Native 关系型数据库 MySQL
直播预告 | PostgreSQL 内核解读系列第五讲:PostgreSQL 索引介绍
本系列课程将面向DBA、高校学生、内核爱好者,分15个章节,系统化介绍PG核心技术原理、用法和代码实现。希望通过课程学习,让没有内核经验的同学和DBA,也可以进行简单的特性开发,更深入理解PG配置和运行原理。本节课将讲述 PostgreSQL 索引基本介绍、B-Tree 索引、Hash 索引、GiS T索引、GIN 索引、TSearch2 全文搜索等内容。
直播预告 | PostgreSQL 内核解读系列第五讲:PostgreSQL 索引介绍
|
存储 SQL 缓存
PostgreSQL 内核解读系列 - 第4节 存储管理(下)
本文整理自阿里云数据库开源社区 Maintainer 于巍(花名漠雪),在PostgreSQL数据库内核解读系列的分享。本篇内容主要分为四个部分: 1. 磁盘管理 2. 空闲空间映射表(FSM) 3. 可见性映射表(VM) 4. 内存管理。
PostgreSQL 内核解读系列 - 第4节 存储管理(下)
|
SQL 存储 缓存
23 PostgreSQL 监控4 动态内核跟踪 stap 篇|学习笔记
快速学习23 PostgreSQL 监控4 动态内核跟踪 stap 篇
23 PostgreSQL 监控4 动态内核跟踪 stap 篇|学习笔记
|
SQL 存储 缓存
MySQL 分支-AliSQL 的性能优化实战|学习笔记
快速学习 MySQL 分支-AliSQL 的性能优化实战。
161 0
MySQL 分支-AliSQL 的性能优化实战|学习笔记

相关产品

  • 云数据库 RDS MySQL 版
  • 云数据库 RDS