开发者社区> 场景研读> 正文

最流行的高性能关系型数据库是如何在云端打造的

简介: 2017云栖大会POLARDB专场,阿里云资深技术专家林晓斌带来最流行的高性能关系型数据库是如何在云端打造的演讲。本文主要从数据库云服务目标开始说起,又介绍了经典模式痛点,接着提出了下一代数据库需要解决的问题和方案,最后做了简要总结。
+关注继续查看

2017云栖大会POLARDB专场,阿里云资深技术专家林晓斌带来最流行的高性能关系型数据库是如何在云端打造的演讲。本文主要从数据库云服务目标开始说起,又介绍了经典模式痛点,接着提出了下一代数据库需要解决的问题和方案,最后做了简要总结。

以下是精彩内容整理:

 

数据库云服务的目标

做云数据库的目标,让DBA创造更大的价值,不仅阿里巴巴自己的DBA,还有客户的DBA,以及没有DBA的公司,担负DBA责任的开发人员,让这些人能够更加省心,这是我们做云数据库的目标。

6630a9343adeefd3a74d33b6fe6b70a32816cf82

基于这个目标有五个指标,包括可用性、可靠性、安全性、可扩展性和可诊断性。

按重要性来说,要从安全性说起。安全包含了两点,一是数据本身的安全,一是对于数据泄露的安全。在安全上我们做了很多工作,比如现在允许用户通过配置,让数据落地后是加密的,也就是说你不用担心数据被拷走的问题。我们还有这样的设置,现在阿里云的业务人员无法访问数据库,让用户在前台授权才可以做到,通过这种方式提升它的安全性。

在可靠性上常做备份恢复到任意时间点的功能。用户出现误删数据库,或者把表改错了,我们会提供恢复到任意时间点的功能。

常见扩展性其实很好理解,就是通过图表。当我们自己在内部维护,刚开始近千个实例,后来发现实例数和DBA的数目呈比例了,阿里云有10万多个实例,但没有1万多个DBA,只有四五个。中间有一段镇痛,怎么让实例数增长的情况下,运维人员不要线性的增加,可诊断性也是体现云服务是不是成熟的标志。

 

经典模式

5545c24f5ac13c2c951a09bb8a4d69f26ffab055

公有云上大量的实例都是双节点结构。从2015年开始,我们就默认改为semisync,甚至很多公司,包括一些友商默认还是用异步模式。如果把它设成最安全的模式就会比较吃亏,用户要找两个云厂商做测试。在阿里云,数据的准确性、可靠性是第一位的,所以在2015年后,我们把默认改为双节点,保证数据不丢。

都有哪些痛点呢?比如分钟级扩容,包括电商也会碰到这样的问题,很多小的电商在云上做,用户不用告诉我们的。去年“双11”的时候,我们运维团队的要求是“双11”那天要做到零干预,前几年已经做到零故障了。有一个公有云的用户,也是一个电商网站,他没有告诉我们,等到他们说准备半年的挂了,他们买了两个很小的实例,“双11”之前也没有压测,那一天压力一上来马上打爆,临时加机器已经来不及了,数据量又大,我们从2个节点扩到8个节点,花了20个小时的时间把扩容做起来,最终帮助他们把东西卖出去。分钟级扩容,后面慢慢是一个刚需。

超大容量,迁移数据第一步就是备份。一旦发起备份,看上去备份在内库备,意味着这时候是隐含的单点系统,主库不敢挂。我们的需求是备份肯定要做,但是要让备份最快的做,而且最好做的不影响其它。成本来说也是用户的痛点。

 

下一代数据库需要解决的问题

从研发的角度以及数据库本身发展角度来说,还需要解决哪些问题?比如:

  • 硬件红利,其实数据库这几年来,尤其是MySQL在过去20几年来的发展,它还是没有真正把硬件红利榨干。好像一些新的数据库,NewSQL数据库,把小量企业变成大批量企业,读也是这样。很多硬件已经不再是RDS瓶颈了,这时候数据库应该考虑反过来,尽量多的把随机写变成数据写,还有备份要吃带宽,备份是整个拷走。整个设计理念就是按照机械硬盘在做,虽然慢慢在改进,但改进量还不够多。

我们数据库怎么用好现在的硬件红利?最近推出的POLARDB,数据系统是从网络取过来的,数据从网络取过来不从本地拷反而慢,怎么做到性能翻倍呢?POLARDB底层存储已经做到网络上读取的性能,目前已经达到和本地一样快,而且还有空间,以后就会超过。它是一个网络集群,它的LBS和带宽不再受限了,信息越多越细节,对终端用户的体验就越好。有更多的信息可以参考,用户的体验就更好,我们怎么通过硬件红利体现数据库的能力更加扩大,再让用户利用数据体现到他们的产品,让终端用户提升用户体验,这是我们需要解决的问题。

  • HTAP,现在我们说的MySQL一般是做事务,甚至比较长的一段时间,MySQL做什么最好是当天利用,越简单应用,越不容易出BUG。越简单,意味着需要别的能力时,就需要拿别的系统补充。把MySQL当KV用当然可以,我现在要一个复杂的交易,需要找另外一个系统过来做,这个系统专门做交易,接下来要做数据分析,又拉一个系统过来做,结果发现一份数据要从好多地方开始大量的数据同步,以前做数据同步还可以,现在都是分钟级别了,这是一个矛盾,越来越大。数据越来越大,一个要分析的快,一个是数据量变大,拷起来快。最好能把系统放在一起,哪里写就在哪里读,这样就很好了。
  • 智能服务,阿里很多基础运维DBA越来越少了,以前DBA要搬机器,现在已经没有这个需求了,后来要经验丰富,意味着不容易在云上扩展。其实很难要求一个创业公司里有一个经验丰富的数据库专家,我们怎么让用户拥有数据库专家,如果只有一个客户,支撑起来比较容易,当我们有10万个客户时,需要考虑怎么让一个智能系统帮助我们服务。

 

解决方案

POLARDB

af847e929c4aeaf0b7f3e831a63a2a49a13fba1d

怎么解决痛点呢?POLARDB基本的想法是这样的,数据和存储分离,计算和存储分离。图上一个节点,主库、读库、远程访问数据,解决分钟级扩容。以前我们怕别人拷数据,现在不用怕了,找一个机器把进程开起来就可以了。本地磁盘大小和备份时间的限制容量,以前一个数据有三份拷贝,备份都是分片备的,不会对系统造成很大的冲击。

HybridDB

 

4dc3e2be3411d157fe08bca5158f4c3be81628f6

现在数据量的问题解决了,就是拷贝,如果只有POLARDB一个单点,分析这个问题还是没有解决,它还是偏向事务的系统。我们有HybirdDB,数据可以直接在这里读取,算完给用户。列后引擎可以认为用户独立入口,当用户来使用时只看到这个点,语句可能不一样。分析类语句有定制语法,兼容hadoop的语句。

CloudDBA

4bcf84082ac8abd1448802ce5063d8470d69c6aa

由于磁盘老化,做DBA用户和你说语句慢了,我们看看语句是不是错了,表结构对不对,需要查很久才能怀疑到硬件坏了。另外就是网络,网络有很多层,我们会花好多时间在这个事情上。链路上做了全链路监控,从客户端到服务端,每个节点都采集,先写后读,他认为这个事情是并行的,是两个语句写下去的,用户根本查不出来的。现场ID不一样,说明是从不同现场发下来的。以审计日志为基础,我们现在做的POLARDB,已经开始做公测,后面用户可以自己在入口上升系统。我们把问题暴露出来,并不是所有问题用户都需要关注,有了完整系统之后,希望把系统的能力覆盖给客户。

 

总结

我们想让所有公司DBA卸掉繁重机械的工作,以前是搬机器装实例,大家已经过了这个时代了。下一步要做什么事情?扩容、缩容,大促容灾等体系设计,这些不是体现DBA的价值的,真正体现DBA价值的能力是他们对公司业务的了解,DBA风头最盛的是Oracle时代,因为Oracle很稳定,他们做业务的架构师。希望阿里云数据库让我们自己做到Oracle那样的能力,让DBA业务人员可以摆脱低端的工作,了解公司业务,成为业务架构师,创造更大的价值。

 

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
教你如何在阿里云服务器上安装Mysql数据库(mysql5.7.23+centos)
对于一个建站新手来讲,最重要的莫过于2件事  1.时间效率 2.性价比 换句话讲,对于非专业选手,在整个建站过程,如何省时省力,用相对简单的方式,花更少的钱建好网站是关键。 基于上述,给大家带来一版适合新手的建站指南,供大家参考。
3704 0
阿里云服务器端口号设置
阿里云服务器初级使用者可能面临的问题之一. 使用tomcat或者其他服务器软件设置端口号后,比如 一些不是默认的, mysql的 3306, mssql的1433,有时候打不开网页, 原因是没有在ecs安全组去设置这个端口号. 解决: 点击ecs下网络和安全下的安全组 在弹出的安全组中,如果没有就新建安全组,然后点击配置规则 最后如上图点击添加...或快速创建.   have fun!  将编程看作是一门艺术,而不单单是个技术。
18821 0
阿里云服务器怎么设置密码?怎么停机?怎么重启服务器?
如果在创建实例时没有设置密码,或者密码丢失,您可以在控制台上重新设置实例的登录密码。本文仅描述如何在 ECS 管理控制台上修改实例登录密码。
20549 0
万字长文剖析AliSQL X-Cluster|基于X-Paxos的高性能强一致MySQL数据库
MySQL数据库从诞生以来就以其简单、易用、开源为其主打特点,成为不少开发者首选的数据库系统。阿里在2008年开始提出"去IOE"的口号,其中,使用大量的MySQL,配合业务的改造替代原有的商业版Oracle系统。
6393 0
云原生数据仓库AnalyticDB MySQL 助力蜂创提升营销SAAS平台和CDP产品性能
阿里云AnalyticDB满足了蜂创营销SAAS平台海量数据实时分析秒级返回的诉求,弹性模式的冷热存储分离能力帮助他们节约了很大的数据存储成本。
190 0
小微企业阿里云最佳实践系列(五):零成本使用 DMS 数据库实验室学习研究
本博文主要为大家重点介绍 DMS 数据管理的数据库实验室功能,通过实验室我们可以快速生成想要的数据进行学习研究(例如:SQL 优化、复杂查询等),同时目前数据库实验室完全免费使用,所有阿里云用户均可免费体验。
1411 0
上云新姿势,阿里云数据库专属集群 MyBase 企业客户交流深圳站圆满结束
阿里云数据库专属集群MyBase于2019年11月正式商业化,历经阿里集团十多年数据库技术经验沉淀,为客户打造稳定可靠的云上专有数据中心。
569 0
+关注
场景研读
技术学习永无止境
476
文章
8
问答
文章排行榜
最热
最新
相关电子书
更多
JS零基础入门教程(上册)
立即下载
性能优化方法论
立即下载
手把手学习日志服务SLS,云启实验室实战指南
立即下载