顶会点赞!PolarDB Serverless实现了哪些突破?

本文涉及的产品
函数计算FC,每月15万CU 3个月
Serverless 应用引擎免费试用套餐包,4320000 CU,有效期3个月
简介: 这篇题为《PolarDB Serverless: A Cloud Native Database for Disaggregated Data Centers》的论文,介绍了阿里云自研数据库PolarDB基于计算存储分离,实现的最新Serverless技术架构研究进展。PolarDB Serverless论文的录用,标志着阿里云PolarDB数据库在最新一代架构的探索上迈出领先一步。

云原生的Serverless数据库,正在成为下一个五年的云数据库发展趋势。


近日,在国际数据库顶级会议2021 ACM SIGMOD上,一篇以PolarDB Serverless为主题的论文,被评委会认为指引了下一代数据库服务的发展方向。


这篇题为《PolarDB Serverless: A Cloud Native Database for Disaggregated Data Centers》的论文,介绍了阿里云自研数据库PolarDB基于计算存储分离,实现的最新Serverless技术架构研究进展。


PolarDB Serverless论文的录用,标志着阿里云PolarDB数据库在最新一代架构的探索上迈出领先一步。


以下是这项突破的核心内容介绍:


01第一代云原生数据库的困境


早期的云上数据库,大部分是以ECS中的自建数据库和云厂商托管的数据库RDS的形态存在的,到目前为止还是有非常大的用户量。


这些云上数据库架构还是传统数据库的架构,是运行在云的基础设施上,数据库本身并没有为云做太多的改造和适配。局限于其架构,各项资源等比率的限制在一个范围内,其弹性范围、资源利用率都受到较大的限制,无法充分利用云的红利。


以亚马逊Aurora和阿里云PolarDB为代表的第一代云原生数据库,第一次对数据库架构进行了改造,实现了存储和计算分离,并基于此实现了一写多读,一定程度上适配云架构,存储完成了池化和按量付费,这是对云数据库非常大的进步。


但此架构下,CPU和内存依然是强绑定的,导致计算要实现真正按需供应也非常困难。也就是说,CPU资源和内存资源是一个整体,只能作为一个最小的单位升降级。例如,在亚马逊Aurora中,计算资源和缓存资源的比例是1core CPU:2GB内存。


然而,CPU和内存资源比例的绑定对一些场景下对用户是不合理的:


例如,分析型内存数据库用户,用户使用少数CPU来定期同步和更新数据,但需要大内存,因为维表数据、或者中间结果需要缓存在内存里避免从磁盘来读的延迟。

事务型数据库,例如电商等互联网应用场景里,客户的应用往往存在热点,因此少量的内存就足够保证缓存命中率超过99%,但高峰时CPU需要弹到64c甚至更多核,CPU的需求会高于内存的需求。


简而言之,因为第一代云原生数据库无法实现计算和内存资源的解耦,这也是导致目前云原生数据库价格依然高于RDS和自建数据库,无法占据大部分市场的核心原因。


02 实现新架构的突破


不过,随着PolarDB Serverless新架构的率先提出,这种情况可能要出现极大改变。


PolarDB Serverless的最大创新之处在于:在业内首次实现了内存与计算/存储的解耦,内存进一步池化,形成三层池化,使得弹性能力有数量级的提升,同时内存池化大幅度降低了成本,实现了完全地按量使用和按需弹性,贴合各种场景。


640-1.jpg

PolarDB Serverless构建了一个全新的数据库形态,即DCaaDB(Datacenter as a Database)


整个IDC形成一个多租户的大数据库,其全部的CPU,内存,存储构成三个独立的资源池。在资源池未耗尽的情况下,任何一个用户(租户)都可能任意的弹性扩展任何一种资源到任何一个规格,用户为其SQL动态消耗的CPU、内存和存储买单,不需要预置任何的规格。


这种情况下,CPU和内存资源因其池化其使用率将会大幅度提升,云原生数据的成本将会远低于自建和RDS等一体化数据库,云原生技术的价值将会得到充分的体现,数据库市场将会重新洗牌。


640.jpg


03 背后的技术难点


在PolarDB Serverless之前,学术界已经对分离架构有一定的研究,并且也进行了一些技术上的实验,但是都没有解决分离架构下的数据库的性能和弹性问题。


PolarDB Serverless通过进行技术创新解决了困扰业界的难题:


1)

PolarDB Serverless中引入了多租户、分布式的内存池的设计,包括页面分配和生命周期管理。


第一个挑战是增加内存池设计后,确保系统能正确的执行事务。 例如,一个被修改过的数据页不应该读到老的数据,即使跨节点也是如此,我们使用全局的缓存一致的机制(类似于多核cpu之间缓存一致性机制)来实现。


还有,当主节点正在分裂或合并一个 B+Tree 索引,其他节点不应看到中间不一致的 B-tree 结构,我们需要使用全局页锁来保护它。 当节点执行只读事务时,它必须避免读取未提交事务写入的任何内容,我们通过在数据库节点之间同步全局视图来实现它。


2)

第二个挑战是高效地执行事务。Serverless架构对数据库的性能会产生负面影, 因为数据库要从远程访问数据(内存池的或者存储池)的,这会引入额外的网络延迟。


我们大量利用RDMA优化,尤其是one-sided RDMA verbs,包括使用 RDMA CAS来优化获取全局页锁的过程。 为了提高并发性,数据库节点使用乐观锁技术来避免不必要的全局页锁。


此外,PolarDB内核引入一些技术减少读写带宽,例如使用重做日志下推技术后,存储可以直接从重做日志回放出最新版本的页面,因此数据库进程不再需要写脏页到远程存储里。当数据库访问页面而本地缓存不命中时,需要跨网络从远程内存和远程存储中获取页面,这会慢于本地内存和磁盘,因此通过预取提升本地缓存的命中率是提升分析查询类负载性能的关键。


3)

在Serverless架构下,数据库从一个单内核的系统,变成了跨节点部署,并且数据库的部分逻辑嵌入到并运行在内存池和存储池服务里。架构变得更复杂,因此增加了系统故障的种类和可能性。


作为云数据库服务,第三个挑战是构建一个可靠的系统。PolarDB设计了对不同节点类型的单节点崩溃的处理策略,以保证系统中没有单点故障。 并且因为内存和存储中的状态与数据库节点解耦,使用Serverless架构的PolarDB节点的崩溃恢复时间比使用单机架构的PolarDB内核快5.3倍。


在PolarDB Serverless架构之下,我们对数据库的性能进行了一些测试,最终的测试结果也远超预期。


这些结果也让我们有理由预测,使用全资源分离的架构来实现云原生的Serverless数据库,会成为下一个五年的云数据库发展趋势。


文 | 阿里云数据库工程师江疑、 韩逸

相关实践学习
【文生图】一键部署Stable Diffusion基于函数计算
本实验教你如何在函数计算FC上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。函数计算提供一定的免费额度供用户使用。本实验答疑钉钉群:29290019867
建立 Serverless 思维
本课程包括: Serverless 应用引擎的概念, 为开发者带来的实际价值, 以及让您了解常见的 Serverless 架构模式
相关文章
|
7月前
|
关系型数据库 Serverless 分布式数据库
【公测】PolarDB PostgreSQL版Serverless功能免费使用​!
【公测】PolarDB PostgreSQL版Serverless功能免费使用​,公测于2024年3月28日开始,持续三个月,公测期间可以免费使用!
|
4月前
|
关系型数据库 MySQL Serverless
在部署云数据库PolarDB MySQL版 Serverless集群的过程中问题点
在部署PolarDB MySQL Serverless过程中,常见问题包括配置误解、网络配置错误、资源未及时释放及压测不熟练。建议深入理解配置项,确保合理设置伸缩策略;明确业务需求,使PolarDB与现有服务同处一地域与VPC;利用提醒功能管理资源生命周期;按官方指南执行压测。新用户面临的学习曲线、资源管理自动化不足及成本控制难题,可通过增强文档友好性、引入智能成本管理与用户界面优化来改善。
66 1
|
5月前
|
关系型数据库 MySQL Serverless
体验阿里云PolarDB MySQL Serverless集群
体验阿里云PolarDB MySQL Serverless集群
|
7月前
|
关系型数据库 Serverless 分布式数据库
PolarDB PostgreSQL版Serverless技术原理解读
数据库是现代企业IT系统中非常重要的一部分。在创建数据库时,客户往往需要比较保守地去配置数据库集群的资源,包括CPU、内存、存储以及连接数等多种参数配置,以确保业务能够在波峰和波谷都能平稳运行。在这种情况下,客户购买的集群资源在业务波谷时期会被闲置,导致整体成本偏高;而在业务压力增长阶段,集群资源又应对不足。Serverless数据库可以很好地解决这个问题。它能够让数据库集群资源随客户业务负载动态弹性扩缩,将客户从复杂的业务资源评估和运维工作中解放出来。 本文描述PolarDB PostgreSQL版Serverless的构建中, 如何实现弹得快、弹得准、弹得稳、弹得广的几个关键技术点。
76365 18
PolarDB PostgreSQL版Serverless技术原理解读
|
6月前
|
关系型数据库 Serverless 分布式数据库
PolarDB产品使用问题之普通版本的集群如何迁移到Serverless集群
PolarDB产品使用合集涵盖了从创建与管理、数据管理、性能优化与诊断、安全与合规到生态与集成、运维与支持等全方位的功能和服务,旨在帮助企业轻松构建高可用、高性能且易于管理的数据库环境,满足不同业务场景的需求。用户可以通过阿里云控制台、API、SDK等方式便捷地使用这些功能,实现数据库的高效运维与持续优化。
|
7月前
|
关系型数据库 Serverless 分布式数据库
【PolarDB 开源】PolarDB Serverless 模式:自动扩缩容与成本效益分析
【5月更文挑战第25天】PolarDB Serverless 提供自动扩缩容功能,适应动态工作负载,降低成本。在业务高峰期增加资源保障性能,低谷期减少资源实现成本优化。通过对比传统模式下的成本浪费,示例说明了Serverless如何节省开支。代码演示了连接与查询PolarDB Serverless数据库的基本操作。要充分利用该模式,需合理规划业务、监控性能并结合其他云服务。PolarDB Serverless是弹性、经济的数据库选择,未来将持续创新,助力企业高效发展。
429 1
|
6月前
|
存储 关系型数据库 分布式数据库
PolarDB产品使用问题之如何在本地进行部署
PolarDB产品使用合集涵盖了从创建与管理、数据管理、性能优化与诊断、安全与合规到生态与集成、运维与支持等全方位的功能和服务,旨在帮助企业轻松构建高可用、高性能且易于管理的数据库环境,满足不同业务场景的需求。用户可以通过阿里云控制台、API、SDK等方式便捷地使用这些功能,实现数据库的高效运维与持续优化。
457 0
|
7月前
|
关系型数据库 Serverless 分布式数据库
PolarDB Serverless
【5月更文挑战第12天】PolarDB Serverless
96 4
|
7月前
|
关系型数据库 Serverless 分布式数据库
体验PolarDB PostgreSQL Serverless极致弹性
体验PolarDB PostgreSQL Serverless极致弹性
|
7月前
|
关系型数据库 Serverless 分布式数据库
PolarDB的Serverless能力与同类型产品的对比
【2月更文挑战第21天】PolarDB的Serverless能力与同类型产品的对比
58 2

热门文章

最新文章

相关产品

  • 函数计算