顶会点赞!PolarDB Serverless实现了哪些突破?

本文涉及的产品
Serverless 应用引擎免费试用套餐包,4320000 CU,有效期3个月
函数计算FC,每月15万CU 3个月
简介: 云原生的Serverless数据库,正在成为下一个五年的云数据库发展趋势。近日,在国际数据库顶级会议2021 ACM SIGMOD上,一篇以PolarDB Serverless为主题的论文,被评委会认为指引了下一代数据库服务的发展方向。这篇题为《PolarDB Serverless: A Cloud Native Database for Disaggregated Data Centers》的论文,介绍了阿里云自研数据库PolarDB基于计算存储分离,实现的最新Serverless技术架构研究进展。PolarDB Serverless论文的录用,标志着阿里云PolarDB数据库在最新一

云原生的Serverless数据库,正在成为下一个五年的云数据库发展趋势。


近日,在国际数据库顶级会议2021 ACM SIGMOD上,一篇以PolarDB Serverless为主题的论文,被评委会认为指引了下一代数据库服务的发展方向。


这篇题为《PolarDB Serverless: A Cloud Native Database for Disaggregated Data Centers》的论文,介绍了阿里云自研数据库PolarDB基于计算存储分离,实现的最新Serverless技术架构研究进展。


PolarDB Serverless论文的录用,标志着阿里云PolarDB数据库在最新一代架构的探索上迈出领先一步。


以下是这项突破的核心内容介绍:


01第一代云原生数据库的困境


早期的云上数据库,大部分是以ECS中的自建数据库和云厂商托管的数据库RDS的形态存在的,到目前为止还是有非常大的用户量。


这些云上数据库架构还是传统数据库的架构,是运行在云的基础设施上,数据库本身并没有为云做太多的改造和适配。局限于其架构,各项资源等比率的限制在一个范围内,其弹性范围、资源利用率都受到较大的限制,无法充分利用云的红利。


以亚马逊Aurora和阿里云PolarDB为代表的第一代云原生数据库,第一次对数据库架构进行了改造,实现了存储和计算分离,并基于此实现了一写多读,一定程度上适配云架构,存储完成了池化和按量付费,这是对云数据库非常大的进步。


但此架构下,CPU和内存依然是强绑定的,导致计算要实现真正按需供应也非常困难。也就是说,CPU资源和内存资源是一个整体,只能作为一个最小的单位升降级。例如,在亚马逊Aurora中,计算资源和缓存资源的比例是1core CPU:2GB内存。


然而,CPU和内存资源比例的绑定对一些场景下对用户是不合理的:


例如,分析型内存数据库用户,用户使用少数CPU来定期同步和更新数据,但需要大内存,因为维表数据、或者中间结果需要缓存在内存里避免从磁盘来读的延迟。

事务型数据库,例如电商等互联网应用场景里,客户的应用往往存在热点,因此少量的内存就足够保证缓存命中率超过99%,但高峰时CPU需要弹到64c甚至更多核,CPU的需求会高于内存的需求。


简而言之,因为第一代云原生数据库无法实现计算和内存资源的解耦,这也是导致目前云原生数据库价格依然高于RDS和自建数据库,无法占据大部分市场的核心原因。


02 实现新架构的突破


不过,随着PolarDB Serverless新架构的率先提出,这种情况可能要出现极大改变。


PolarDB Serverless的最大创新之处在于:在业内首次实现了内存与计算/存储的解耦,内存进一步池化,形成三层池化,使得弹性能力有数量级的提升,同时内存池化大幅度降低了成本,实现了完全地按量使用和按需弹性,贴合各种场景。


image.gifimage.png


PolarDB Serverless构建了一个全新的数据库形态,即DCaaDB(Datacenter as a Database)


整个IDC形成一个多租户的大数据库,其全部的CPU,内存,存储构成三个独立的资源池。在资源池未耗尽的情况下,任何一个用户(租户)都可能任意的弹性扩展任何一种资源到任何一个规格,用户为其SQL动态消耗的CPU、内存和存储买单,不需要预置任何的规格。


这种情况下,CPU和内存资源因其池化其使用率将会大幅度提升,云原生数据的成本将会远低于自建和RDS等一体化数据库,云原生技术的价值将会得到充分的体现,数据库市场将会重新洗牌。


image.gifimage.png


03 背后的技术难点


在PolarDB Serverless之前,学术界已经对分离架构有一定的研究,并且也进行了一些技术上的实验,但是都没有解决分离架构下的数据库的性能和弹性问题。


PolarDB Serverless通过进行技术创新解决了困扰业界的难题:


1)

PolarDB Serverless中引入了多租户、分布式的内存池的设计,包括页面分配和生命周期管理。


第一个挑战是增加内存池设计后,确保系统能正确的执行事务。 例如,一个被修改过的数据页不应该读到老的数据,即使跨节点也是如此,我们使用全局的缓存一致的机制(类似于多核cpu之间缓存一致性机制)来实现。


还有,当主节点正在分裂或合并一个 B+Tree 索引,其他节点不应看到中间不一致的 B-tree 结构,我们需要使用全局页锁来保护它。 当节点执行只读事务时,它必须避免读取未提交事务写入的任何内容,我们通过在数据库节点之间同步全局视图来实现它。


2)

第二个挑战是高效地执行事务。Serverless架构对数据库的性能会产生负面影, 因为数据库要从远程访问数据(内存池的或者存储池)的,这会引入额外的网络延迟。


我们大量利用RDMA优化,尤其是one-sided RDMA verbs,包括使用 RDMA CAS来优化获取全局页锁的过程。 为了提高并发性,数据库节点使用乐观锁技术来避免不必要的全局页锁。


此外,PolarDB内核引入一些技术减少读写带宽,例如使用重做日志下推技术后,存储可以直接从重做日志回放出最新版本的页面,因此数据库进程不再需要写脏页到远程存储里。当数据库访问页面而本地缓存不命中时,需要跨网络从远程内存和远程存储中获取页面,这会慢于本地内存和磁盘,因此通过预取提升本地缓存的命中率是提升分析查询类负载性能的关键。


3)

在Serverless架构下,数据库从一个单内核的系统,变成了跨节点部署,并且数据库的部分逻辑嵌入到并运行在内存池和存储池服务里。架构变得更复杂,因此增加了系统故障的种类和可能性。


作为云数据库服务,第三个挑战是构建一个可靠的系统。PolarDB设计了对不同节点类型的单节点崩溃的处理策略,以保证系统中没有单点故障。 并且因为内存和存储中的状态与数据库节点解耦,使用Serverless架构的PolarDB节点的崩溃恢复时间比使用单机架构的PolarDB内核快5.3倍。


在PolarDB Serverless架构之下,我们对数据库的性能进行了一些测试,最终的测试结果也远超预期。


这些结果也让我们有理由预测,使用全资源分离的架构来实现云原生的Serverless数据库,会成为下一个五年的云数据库发展趋势。

相关实践学习
【文生图】一键部署Stable Diffusion基于函数计算
本实验教你如何在函数计算FC上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。函数计算提供一定的免费额度供用户使用。本实验答疑钉钉群:29290019867
建立 Serverless 思维
本课程包括: Serverless 应用引擎的概念, 为开发者带来的实际价值, 以及让您了解常见的 Serverless 架构模式
目录
打赏
0
0
0
0
38
分享
相关文章
PolarDB PostgreSQL企业版固定规格集群的Serverless功能正式上线
云原生数据库PolarDB的Serverless功能具备动态弹性扩缩容能力。企业版固定规格集群现已支持Serverless功能,适用于业务波峰波谷明显、负载不确定或期望降低运维成本的场景。
PolarDB Serverless 的自动扩缩容机制
PolarDB Serverless 作为一种创新的数据库服务模式,其自动扩缩容功能是其重要的特性之一。这一功能为用户带来了诸多优势,同时也有着复杂而精密的运作机制。
164 58
扩缩容操作对PolarDB Serverless的性能有多大影响?
PolarDB Serverless 的扩缩容操作对性能会产生一定的影响,但通过合理的规划、监测和措施,可以将这种影响控制在较小的范围内。同时,随着技术的不断进步和优化,扩缩容操作对性能的影响也会逐渐减小,为用户提供更稳定、高效的数据库服务体验。
149 57
扩缩容操作对 PolarDB Serverless 性能的影响
扩缩容操作对 PolarDB Serverless 性能的影响
119 47
瑶池数据库微课堂 | PolarDB Serverless弹性&价格力观测
瑶池数据库微课堂介绍阿里云PolarDB Serverless的弹性与性价比优势。通过瑶池解决方案体验馆,用户可免费实操,直观感受Serverless的秒级弹性及超高性价比。内容涵盖Serverless概念、操作步骤、压测演示及性能曲线分析,展示PolarDB在不同负载下的自动扩展能力。适合希望了解云数据库弹性和成本效益的技术人员。
100 2
鹰角网络:EMR Serverless Spark 在《明日方舟》游戏业务的应用
鹰角网络为应对游戏业务高频活动带来的数据潮汐、资源弹性及稳定性需求,采用阿里云 EMR Serverless Spark 替代原有架构。迁移后实现研发效率提升,支持业务快速发展、计算效率提升,增强SLA保障,稳定性提升,降低运维成本,并支撑全球化数据架构部署。
222 56
鹰角网络:EMR Serverless Spark 在《明日方舟》游戏业务的应用
Serverless MCP 运行时业界首发,函数计算让 AI 应用最后一公里提速
作为云上托管 MCP 服务的最佳运行时,函数计算 FC 为阿里云百炼 MCP 提供弹性调用能力,用户只需提交 npx 命令即可“零改造”将开源 MCP Server 部署到云上,函数计算 FC 会准备好计算资源,并以弹性、可靠的方式运行 MCP 服务,按实际调用时长和次数计费,欢迎你在阿里云百炼和函数计算 FC 上体验 MCP 服务。
272 29
云大使 X 函数计算 FC 专属活动上线!享返佣,一键打造 AI 应用
如今,AI 技术已经成为推动业务创新和增长的重要力量。但对于许多企业和开发者来说,如何高效、便捷地部署和管理 AI 应用仍然是一个挑战。阿里云函数计算 FC 以其免运维的特点,大大降低了 AI 应用部署的复杂性。用户无需担心底层资源的管理和运维问题,可以专注于应用的创新和开发,并且用户可以通过一键部署功能,迅速将 AI 大模型部署到云端,实现快速上线和迭代。函数计算目前推出了多种规格的云资源优惠套餐,用户可以根据实际需求灵活选择。
Serverless MCP 运行时业界首发,函数计算让 AI 应用最后一公里提速
Serverless MCP 运行时业界首发,函数计算支持阿里云百炼 MCP 服务!阿里云百炼发布业界首个全生命周期 MCP 服务,无需用户管理资源、开发部署、工程运维等工作,5 分钟即可快速搭建一个连接 MCP 服务的 Agent(智能体)。作为云上托管 MCP 服务的最佳运行时,函数计算 FC 为阿里云百炼 MCP 提供弹性调用能力。
207 0
 Serverless MCP 运行时业界首发,函数计算让 AI 应用最后一公里提速
Serverless + AI 让应用开发更简单,加速应用智能化
Serverless + AI 让应用开发更简单,加速应用智能化
119 5

相关产品

  • 函数计算
  • 下一篇
    云函数