阿里云发布了一个超牛的数据库, 我们跟产品负责人聊了聊

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,高可用系列 2核4GB
简介: 阿里云表示,POLARDB实现了AWS Aurora性能的1.2倍。 三年前,AWS宣布推出关系型数据库亚马逊极光(Amazon Aurora)。 “那时候,我们Amazon Aurora觉得简直是世界巅峰。

阿里云表示,POLARDB实现了AWS Aurora性能的1.2倍。

三年前,AWS宣布推出关系型数据库亚马逊极光(Amazon Aurora)。

“那时候,我们Amazon Aurora觉得简直是世界巅峰。”阿里云数据库总负责人余峰在接受36氪专访的时候感叹。不过在昨天的发布会上,他们发布的新产品毫不客气地在跑分上超过了Amazon Aurora。

9月21日的发布会上,阿里云正式梳理了他们整套云数据库家族,包括主流的关系型、NoSQL非关系型数据库(适用于内容缓存和Web应用等场景,包括键值型、文档型等)、面向大数据和AI的混合分析数据库、对面搜索和物联网等场景的搜索和时序数据库。为了方便用户将数据库上云,阿里云还有配套的迁移管理服务和工具。

image

不过,发布会现场的重点,还是上面提到的跑分超过了Amazon Aurora的新产品——阿里云自研的商用关系型数据库POLARDB。据阿里云方面介绍,该数据库采用第三代分布式共享存储架构,实现计算节点和存储节点分离,使计算引擎和存储引擎均拥有快速扩展能力,一个数据库即可满足多类数据库的混合使用效果。目前,该产品已经开始公测。


image
POLARDB第三代分布式共享存储架构

数据库的无处不在和软硬一体

“每一个公司都需要一个数据库。”在信息技术的世界里,数据库几乎无处不在,小到一台计算器、蓝牙音箱,大到一台电脑,只要涉及到通讯或者数据的存储与计算,都离不开数据库。我们可以拿平时用的电脑来理解,每一次命令,都需要用到数据库。

那么,如何衡量数据库的好坏?性能、数据的可靠性和安全性,是三个最基本的维度。

余峰解释,数据库最重要的就是存东西,并且在需要的时候把它取出来,因此存的效率怎么样,取的时候又怎么样(性能)非常重要。比如,淘宝系统,有着数以亿计的账户名和密码,同时有三十万人登录很正常,如何同时读取三十万个,完全不会变慢,高并发读写是数据库非常重要的能力之一。

他又打了一个比方,“你的钱在银行系统里,可能就是一行代码,一旦这个信息丢了,就不得了。”这就像数据的可靠性。至于,数据谁能改、谁不能改,这就是安全性。

影响数据库表现的因素又有什么?

“数据库是一个软硬一体化的东西,涉及到方方面面。”

一方面是硬件。数据需要存储,涉及磁盘等存储介质;但又不能全都放在硬盘里,否则很慢,因此内存必不可少;取出来之后需要计算,所以对CPU的要求也很高;算完之后怎么给到用户,涉及到网络。

另一方面是算法。算法牵涉的东西更为复杂,余峰并无细讲,同样是举了几个例子。

首先,数据库很重要的是要支持高并发,一旦用的人多了,就很容易相互受影响,如果做好隔离,保证效率。

再者是事务能够正常运行和回滚的能力。比如,转账作为一个事务,其实涉及到三个动作:先查一下A的钱够不够、然后从A那儿扣钱、最后加到B那儿去,如果任何一步无法继续,这个事务就不能完成,数据要保证一旦出错,能够回滚到事务的初始状态,不能有中间状态。

另外,异地灾备的情况下如何保证事务的一致性,假设同步三节点中,如果有一条线路传输出现问题,要如何处理。

上述这些,都涉及都算法。

阿里云的PolarBD跑分超过AWS Aurora?

就算你不知道什么是数据库,但说起数据库,你肯定想到这个领域的巨头Oracle(甲骨文)。这家公司甚至已经成为了数据库的代名词。

正如余峰所言,数据库需要软硬件一体化。Oracle的缺点是,不仅软件极贵,如果要把的数据库的性能发挥到极致,需要维持“Oracle数据库+IBM小型机+EMC存储”这个组合,后续开支庞大,对管理员的能力极高。

后来,彼时互联网巨头雅虎开始使用开源的MySQL数据库,MySQL本身拥有灵活和性价比高等优势,加上雅虎的示范,MySQL数据库成为了不少互联网公司的选择。随着云计算的发展,云数据库开始出现,后者使用门槛低、便于快速扩展。2015年的AWS re:Invent大会上,亚马逊宣布了Amazon Aurora。Aurora是一个关系型数据库,可以跨3个可用区域复制6份数据,其设计目标是提供高性能和高可用性(99.99%)。

阿里云昨天推出的POLARDB,明显对标的就是Amazon Aurora,它跟后者采用了相同的设计理念,底层同样基于MySQL作出大量改进。

在昨天的发布会上,阿里云又来了一次现场跑分,表示在标准场景下,POLARDB性能是MySQL的6倍,单实例实现100T级存储容量;而在云数据库厂商中,阿里云POLARDB则实现了AWS Aurora性能的1.2倍。余峰解释,这算是阿里云的后发优势,POLARDB用了最新的RDMA网卡,同时对数据库的细节做了优化。


image

据余峰介绍,整套PolarBD的解决方案大体可以分成三部分:兼容MySQL的数据库软件、新一代的计算机节点、阿里云的第三代分布式共享存储方案。


image

新一代的计算节点的CPU和网卡,以及存储的SSD磁盘与FPGA卡,都是单独为数据库定制的。这些可以说都是数据库服务中硬件部分的体现。


image

在算法部分,阿里云这次重点介绍的,是POLARDB的第三代分布式共享存储方案。


image

余峰介绍,整个国内外云厂商的数据库服务,在存储部分经过了三代的发展。

第一代传统数据库跑在单机上,计算(CPU)和存储绑定,用的是本地盘,意味着每一个计算节点,都要挂一个盘,它的问题是每一个节点的存储空间是有限的。
第二代的集中式存储,计算与储存分离,把存储集中起来管理,解决了存储扩展的问题。因为每份计算都有一份数据,在这个体系下有很多的数据副本,导致成本非常高。此外,不同的节点之间数据可能出现不同步,数据一致性很难解决。“EMC做储存很厉害,但是为什么做数据库没有火,就是因为延迟特别大。Amazon和阿里的优势就在于延迟非常小。”


image

第三代数据库与第二代的不同,是计算节点之间的通讯效率非常高。这相当于所有的计算节点是一个集群,节点可以无限增加,储存都在一个盘阵里。阿里云介绍,产品架构上,POLARDB采用了节点间共享存储架构,让数据库实现极速扩展,通过重新设计的文件系统PolarStore,实现相同数据更新操作减少了50%的磁盘写入量,并缩短了写数据的路径,使写性能显著提高,对读事务实现了优化。

上面介绍的数据库系统,昨天刚启动公测,究竟用起来效果怎么样,还需要拭目以待。不过,余峰表示,一般的企业忽然换数据库的动力不太,除非是原来的数据库服务太贵、对数据可靠性和对性能的要求有更大的要求,或者是新业务在新数据库服务上跑得不错,会考虑更换。

为了方便客户数据库上云,阿里还推出“IaaS的价格,PaaS的服务”的基础办云服务器,意味着你买一个包含了云服务器的数据库服务,跟只买云服务器价格一样。同时为了怂恿客户用POLARDB,阿里云表示,原来在用阿里云的MySOL数据库服务的客户,直接迁移到POLARDB上,收费甚至比较前者更便宜。


image

这不就是传说中的补贴吗?很好,这模式很滴滴……

点此免费试用云数据库POLARDB

原文链接

相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
22天前
|
存储 人工智能 数据管理
|
8天前
|
关系型数据库 分布式数据库 数据库
1月17日|阿里云云谷园区,PolarDB V2.0技术沙龙,畅聊国产数据库
为了助力国产化项目顺利推进,阿里云邀请企业开发者和数据库负责人到云谷园区,与PolarDB V2.0技术专家面对面交流。扫描海报二维码报名,我们将根据信息为您申请入园。欢迎参与,共同探讨PolarDB的最新技术和应用!
|
11天前
|
运维 关系型数据库 MySQL
体验领礼啦!体验自建数据库迁移到阿里云数据库RDS,领取桌面置物架!
「技术解决方案【Cloud Up 挑战赛】」上线!本方案介绍如何将自建数据库平滑迁移至云数据库RDS,解决业务增长带来的运维难题。通过使用RDS MySQL,您可获得稳定、可靠和安全的企业级数据库服务,专注于核心业务发展。完成任务即可领取桌面置物架,每个工作日限量50个,先到先得。
|
15天前
|
存储 人工智能 数据管理
媒体声音|专访阿里云数据库周文超博士:AI就绪的智能数据平台设计思路
在生成式AI的浪潮中,数据的重要性日益凸显。大模型在实际业务场景的落地过程中,必须有海量数据的支撑:经过训练、推理和分析等一系列复杂的数据处理过程,才能最终产生业务价值。事实上,大模型本身就是数据处理后的产物,以数据驱动的决策与创新需要通过更智能的平台解决数据多模处理、实时分析等问题,这正是以阿里云为代表的企业推动 “Data+AI”融合战略的核心动因。
|
23天前
|
人工智能 Cloud Native 关系型数据库
双位数增长,阿里云连续五年领跑关系型数据库
阿里云蝉联中国关系型数据库整体市场份额第一,在公有云业务双位数增长的驱动下,阿里云同时在公有云关系型数据库市场取得了38%的市场份额,连续五年位居首位。
|
25天前
|
存储 Oracle 关系型数据库
数据库传奇:MySQL创世之父的两千金My、Maria
《数据库传奇:MySQL创世之父的两千金My、Maria》介绍了MySQL的发展历程及其分支MariaDB。MySQL由Michael Widenius等人于1994年创建,现归Oracle所有,广泛应用于阿里巴巴、腾讯等企业。2009年,Widenius因担心Oracle收购影响MySQL的开源性,创建了MariaDB,提供额外功能和改进。维基百科、Google等已逐步替换为MariaDB,以确保更好的性能和社区支持。掌握MariaDB作为备用方案,对未来发展至关重要。
55 3
|
25天前
|
安全 关系型数据库 MySQL
MySQL崩溃保险箱:探秘Redo/Undo日志确保数据库安全无忧!
《MySQL崩溃保险箱:探秘Redo/Undo日志确保数据库安全无忧!》介绍了MySQL中的三种关键日志:二进制日志(Binary Log)、重做日志(Redo Log)和撤销日志(Undo Log)。这些日志确保了数据库的ACID特性,即原子性、一致性、隔离性和持久性。Redo Log记录数据页的物理修改,保证事务持久性;Undo Log记录事务的逆操作,支持回滚和多版本并发控制(MVCC)。文章还详细对比了InnoDB和MyISAM存储引擎在事务支持、锁定机制、并发性等方面的差异,强调了InnoDB在高并发和事务处理中的优势。通过这些机制,MySQL能够在事务执行、崩溃和恢复过程中保持
61 3
|
25天前
|
SQL 关系型数据库 MySQL
数据库灾难应对:MySQL误删除数据的救赎之道,技巧get起来!之binlog
《数据库灾难应对:MySQL误删除数据的救赎之道,技巧get起来!之binlog》介绍了如何利用MySQL的二进制日志(Binlog)恢复误删除的数据。主要内容包括: 1. **启用二进制日志**:在`my.cnf`中配置`log-bin`并重启MySQL服务。 2. **查看二进制日志文件**:使用`SHOW VARIABLES LIKE 'log_%';`和`SHOW MASTER STATUS;`命令获取当前日志文件及位置。 3. **创建数据备份**:确保在恢复前已有备份,以防意外。 4. **导出二进制日志为SQL语句**:使用`mysqlbinlog`
82 2