展望云计算新时代数据库计算力的进化

本文涉及的产品
云原生数据库 PolarDB MySQL 版,Serverless 5000PCU 100GB
云数据库 RDS MySQL,集群版 2核4GB 100GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
简介: 10月12日的云栖大会·阿里云自研数据库POLARDB专场,阿里云研究员余锋带来了《展望云计算新时代数据库计算力的进化》主题分享,探讨了阿里云数据库团队自研数据库POLARDB的设计理念,并一起展望了新一代云数据库的未来。

1970年关系数据库理论被提出,到2006云计算概念的诞生,半个世纪以来IT行业的科技革新不断引领着时代潮流。作为IT技术的核心领域之一,数据库如何在云计算的大时代背景下持续进化,开拓创新

1012日的云栖大会·阿里云自研数据库POLARDB专场,阿里云研究员余锋带来了《展望云计算新时代数据库计算力的进化》主题分享,探讨了阿里云数据库团队自研数据库POLARDB的设计理念,并一起展望了新一代云数据库的未来。

云数据库的进化

数据库是计算,是存储,也涉及网络和内存,但它们都是非常密集的基础软件。事实上,过去大家所接触的诸如中间件、转化器之类的都在做流量,而数据库是真正的知识密集型事务。一个数据库的好坏,取决于它是否是一个能把计算能力、存储能力、网络能力还有内存能力发挥到极致的综合软件。因此,POLARDB所有的进化和发展都是围绕的这三方面。

9287105a82e35f66a6a29308ecfc7b4de7a48e10 

全世界范围内的流行数据库有几百种,但它们都是计算、存储、网络这三个基础东西的综合体,每当计算的硬件、存储或是网络发生变化时都是数据库变革的契机,每一个变化也都蕴含着各种各样的机会。

现在,在阿里云或者在其它云厂家都可以很方便地拿到一台内存T级别的固定机,这也体现了内存方面极为恐怖的增长速度。网络也是如此,RDMA网络就已经发生了非常大的变化,虽然对于个人来说因为成本考量一般是不会购买使用的,但是IT公司就会去拥抱这些东西,这是硬件上的变化。然后从计算的角度,多核CPU128核已经十分普及。现在还有很多基于GPU的数据库,阿里云POLARDB在这一块也有研究和探索。存储同样也是,比如SSD和英特尔研发的Ethernet。内存也不例外,今天一台机器就会有几T的内存,太为普遍。网络上的InfiniBand虽然还是很高端,但相信未来大家一定能够很方便地获取使用。

硬件的变化必然会伴随着软件的变化。不同于数据库服务,数据库更像是汽车上的引擎,而数据库服务就需要提供一辆整车,还要提供4S和整个生态服务。整个DB引擎在云数据库环境里其实是很小的一部分,需要像Docker隔离,所以如果隔离技术应用不够,随之带来的使用体验就会非常差。比如“双11”,过去一个包从客户机器到达DB后端可能需要百八十微秒,现在则只需要三十微秒左右,能够使得整个云服务更有竞争力、使用更便捷,在各个环节追求极致。围绕计算、存储和网络,POLARDB也在致力于成就极致的体验。

新一代云数据库POLARDB

对比MySQLPOLARDB拥有了6倍的性能提升——这是它最核心的一点,目前也已经开放测试。那么6倍的性能提升是如何实现的呢?有几样东西是共见的:第一,最新的硬件;第二,从头构建的存储、引擎。POLARDB百分百兼容MySQL,这也就是意味着原来怎么做,现在同样遵守,区别只是更大更好更便宜,关键在于它使用了高CPU、网络网卡、RDMA和规格,能够解决最重要的痛点。过去的MySQL单机23TB,实际上的POLARDB却有高达100TB的盘。

139c4b8734dfc1383621d72e15f0face2f5df26d 

当发生灾难时数据通常无法快速转移,所以就会带来一个疑惑:为什么需要去做POLARDB?事实上POLARDB的研究已经历经了两三年,客户产品使用中所遇到的很多问题和困难在现有的方案和架构上并不能很好地解决,但是POLARDB却能够完美地满足客户最大诉求。         

虽然看起来,似乎只要有好的硬件均可以满足这一要求,然而其实并没有那么简单。最早的MySQL标准都是一主一从结构,所以SQL写入时的数据流基本是单向流进,会有八个数据流流动。数据流动一多,也就意味着IO消耗会过大,延迟变大。除去这个原生模式外,RDSAWS采取的做法都是将官方版本放于云上,提供存储以及更好的弹性。POLARDB则是为云而生,其所有的弹性、隔离、IO存储均是针对云的特点所设计的。

0fbe2c895f4b154bb0796dbcd819622174968d14 

在系统的演进中,团队对整体业务有了很深的了解,今天的数据流已经是极大简化后的版本。如上图所示,左边是单向的,右边则是双向数据流,比如准备发生同步时数据会主动推给中间节点,所以这对于技术要求会很高。此外,过去是集中式存储,数据同步中的Copy成本很高,并且会造成很多不可见的问题。在MySQL的使用上,过去因为一些数据不可用所以很少有人会把它用于关键场合,而POLARDB的设计具有金融级别的可靠性,能在硬件基础上把很多事情简化做好,让它更可靠、更简单。

如果有一个好的数据库却不知道如何使用,或者说配套不完整,这些都是空谈。POLARDB所提供的数据库服务则具有完整的生命周期,从上云端到扩容、缩容全覆盖。淘宝“双11”让团队明确了互联网高可用的使用,因此对于容灾、扩容、弹性、存版都了解得非常清楚,所以在设计POLARDB时即针对这些场景,后续又逐渐叠加了金融、政企等场景。

e178a2d9dbf7d1b204007ecf93d5a6c4f5a89424 

在设计之初,POLARDB的计算和存储就是分离的,如上所示的图中可以看到非常明显的三层:首先是用户应用层,然后是计算层,最后是存储层。过去的计算存储不分离,就会导致在节点恢复时需要数据秒搬,但一般很少有系统可以做到这一点,比如几个T的数据需要搬一至两天,不可能突破物理极限。在计算、存储完全分离后系统还设置了一个中间件,读写分离的情况它的写能力是非常强的,中间件也会帮助做读写能力和自动识别读写能力,同时成本也很低。

系统设计需要非常可靠数据,这是数据库最核心的东西也是底线。通过计算以后,存储分离的情况下数据都在后端,就形成了一个标准的分布式数据库,可以在生命周期里扩容、缩容、读写分离以及容灾。但是下面还需要考虑服务迁移的问题,可以用商业数据库或MySQL解决:诸如DTSBS的商业数据库能够用逻辑复制拉取过来;MySQL则可以用物理设置。POLARDB能够实现节点同步,即逻辑复制就是一条复制一次,物理复制就是一批拿过去,效果会更高。

数据如果通过物理复制以及OSS的方式中转上来,速度会非常之快。根据银行要求,未来的运营数据需要保留较长时间,所以可以把数据导入到OSS上等需要的时候再导出。RDS是一个完整的体系,能够百分之百兼容所有生态,也希望POLARDB能和生态一起演化。

国际化、智能化、持续创新

PPOLARDB最重要一点是它的数据库可以和国际接轨。有一些国内外的合规要求不太一样,比如之前新加坡邮政所做的项目对合规要求就非常高,但这些东西属于输出的核心功能,RDS里就有的,所以系统能够很容易地继承过来并做得更好。未来,相信POLARDB会朝着信息化、互联网化、国际化、智能化、创新化的方向不断进化。

105d1a6897a7128f861a281e9363db6ade15b4cd 

总之,POLARDB是团队从2010年就开始做的云服务,当时只有MySQL5.1SQLserver2012年开始接入电商云,到2014年时“双11”基本订单都在其中处理。虽然没有一个强大的场景,但是一个场景就能够满足大家多数的需求。等到POLARDB足够强大就可以把很多产品功能替代掉,更好地延续。未来,整个产品体系会更多地往自研体系走,用户的使用习惯和操作都可以保留,能够获取更易用、更稳定的服务。

连续五年,项目每年都会有1千多项功能优化——这是实践的积累,也是团队成员的不懈努力。行业发展最怕数据库连接断掉,过去RDS只覆盖中国,现在也开始覆盖了这么多节点。全球化的数据库是团队一直努力的方向,也希望未来能够很好地实现这一需求。

0a5611f71cae31660183b22ecbb3b204e8a2a7eb 

今天的POLARDB实际上应该称为POLARDB or MySQL,因为很快就将发布用于其它的产品的POLARDB  for PG,充分发挥整个产品体系及生态的优势,请拭目以待吧。

相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
2月前
|
存储 安全 网络安全
云计算与网络安全:新时代的技术挑战与应对策略
随着云计算技术的快速发展,网络安全问题变得愈发突出。本文探讨了云服务、网络安全以及信息安全在当今技术领域面临的挑战,并提出了相应的解决方案。通过分析现状和未来趋势,可以更好地了解云计算与网络安全的关系,为构建安全可靠的云服务提供参考。
|
2月前
|
人工智能 安全 网络安全
云端防御战线:云计算与网络安全的协同进化
【5月更文挑战第27天】 在数字化浪潮中,云计算已成为企业架构的核心,而网络安全则是其不可或缺的护卫。本文将深入探讨云计算服务模型(IaaS, PaaS, SaaS)与网络安全策略之间的相互作用,分析信息安全的最佳实践及其面临的挑战。通过案例研究,揭示如何在动态的云环境中维护数据完整性、保密性和可用性,同时预测未来发展趋势,为企业和IT专家提供战略性建议。
|
2月前
|
存储 分布式计算 分布式数据库
【专栏】云计算与分布式系统架构在数字化时代的关键作用。云计算,凭借弹性、可扩展性和高可用性,提供便捷的计算环境
【4月更文挑战第27天】本文探讨了云计算与分布式系统架构在数字化时代的关键作用。云计算,凭借弹性、可扩展性和高可用性,提供便捷的计算环境;分布式系统架构则通过多计算机协同工作,实现任务并行和容错。两者相互依存,共同推动企业数字化转型、科技创新、公共服务升级及数字经济发展。虚拟化、分布式存储和计算、网络技术是其核心技术。未来,深化研究与应用这些技术将促进数字化时代的持续进步。
|
6天前
|
SQL NoSQL 关系型数据库
现代数据库技术:从关系型到NoSQL的进化与应用
本文探讨了现代数据库技术的发展历程,从传统的关系型数据库到新兴的NoSQL数据库的演进过程。通过比较不同类型数据库的特点和应用场景,分析它们在各自领域中的优缺点及适用性,旨在帮助读者理解并选择合适的数据库技术来支持他们的应用需求。
|
23天前
|
存储 关系型数据库 分布式数据库
PolarDB,阿里云的云原生分布式数据库,以其存储计算分离架构为核心,解决传统数据库的扩展性问题
【7月更文挑战第3天】PolarDB,阿里云的云原生分布式数据库,以其存储计算分离架构为核心,解决传统数据库的扩展性问题。此架构让存储层专注数据可靠性,计算层专注处理SQL,提升性能并降低运维复杂度。通过RDMA加速通信,多副本确保高可用性。资源可独立扩展,便于成本控制。动态添加计算节点以应对流量高峰,展示了其灵活性。PolarDB的开源促进了数据库技术的持续创新和发展。
239 2
|
1月前
|
存储 Cloud Native 安全
|
1月前
|
存储 安全 网络安全
云端之盾:云计算与网络安全的协同进化
【6月更文挑战第14天】在数字化浪潮中,云计算如同一股不可阻挡的潮流,深刻地改变着企业和个人的工作方式。然而,随之而来的网络安全问题也日益凸显,成为制约云服务发展的关键因素。本文将探讨云计算环境下网络安全的重要性,分析当前面临的主要安全挑战,并提出相应的解决策略和技术手段,旨在为云计算的健康发展提供安全保障。
25 3
|
1月前
|
存储 安全 网络安全
云端防御:云计算与网络安全的共生进化
【6月更文挑战第11天】随着云计算技术的蓬勃发展,企业和个人越来越依赖云服务进行数据存储、处理和分析。然而,这种便利性也带来了前所未有的网络安全挑战。本文将探讨云计算与网络安全之间的复杂关系,分析云服务中的安全风险,并讨论信息安全技术领域的最新进展,以及它们如何帮助构建一个更加安全的网络环境。
|
2月前
|
人工智能 安全 网络安全
云端防御战线:云计算与网络安全的协同进化
【5月更文挑战第29天】 随着企业数字化转型的深入,云计算已成为支撑现代业务架构的关键平台。然而,云服务的广泛应用同时放大了网络安全威胁的复杂性和攻击面。本文将探讨云计算环境下的网络安全挑战,分析云服务模式中的安全责任共担原则,并重点讨论如何通过技术创新和策略升级来加强信息安全防线。我们还将展望人工智能、区块链等前沿技术在提升云环境安全性方面的应用前景。
|
1月前
|
存储 弹性计算 数据挖掘
云计算在科研计算中的高效应用
云计算在科研计算中的高效应用
33 0