阿里云Apsara数据库 高级产品专家 贺军
根据全球权威的IT咨询公司Gartner的最新研究报告(Gartner官方报告下载),在2018年度数据库系统的魔力象限中,阿里云数据库被列入“远见者”象限,这是国产数据库首次进入Gartner魔力象限。Gartner的魔力四象限,描述了数据库厂商的产品能力和市场规模。四个象限依次分别为领导者、挑战者、远见者和特定领域者。目前数据库魔力象限领导者,以老牌的IT厂商Oracle,Microsoft,IBM为主。阿里云通过持续的技术研发创新,进入远见者象限,代表着公司具备良好的产品技术创新性和前瞻性,在市场上进一步突破之后将有希望成为该领域的绝对领导者。
“阿里云拥有所有云厂商中最为丰富的数据库种类覆盖度,几乎为所有客户的业务场景提供了多种解决方案” 分析师在报告中写道,“除了公共云外,阿里云数据库还提供了完整的私有化部署形态Apsara Stack和混合云数据共享解决方案,这是AWS、Google所欠缺的重要优势”。根据Gartner的市场分析报告,阿里云数据库在中国所有云计算厂商中排名第一。Gartner指出阿里巴巴开源的AliSQL拥有坚实的用户基础,特别是管理和安全方面的改进得到了广泛认可;另外云原生数据库POLARDB在高性能、高容量使用场景的应用值得期待。
在阿里云作为唯一国产数据库厂商首次入选“全球数据库魔力象限“之际,我们通过深入分析云数据库的演化方式,来进一步解读这一次的里程碑事件。
趋势:云数据库的演化
作为IT科技的核心技术之一,数据库起源于上世纪70年代,在技术发展浪潮中历久弥新,支撑着现代社会的经济活动和商业文明。纵观IT、互联网、云计算、大数据等的技术发展趋势,从《连线》(Wired)杂志创始主编Kevin Kelly的《失控》、《科技想要什么》、《必然》这几篇恢弘大作,到最近风靡全球的尤瓦尔·赫拉利的简史三部曲《人类简史》,《未来简史》和《今日简史》,都被大众广泛关注。这些科技大作充分体现出当今社会对于未来科技趋势和人类社会的充分展望和遐想。无论是社会个体,还是经济企业,都尝试通过对未来趋势的感知和想象来获得洞见,而核心关键词是“演化”。同样,云数据库对比传统数据库的差别,从传统数据库向云技术融合的演化过程中,可以充分体现出来。
云计算的高速发展是和互联网密不可分的。云计算服务最早孵化的契机是互联网电商巨头为了能够充分利用大量被闲置的IT服务器这样的一个背景产生的。一开始为互联网开发者和创业型公司服务,提供易用、迅捷的、高性价比的IT资源服务。把数据库放在云上,首先需要解决多租户共享使用资源的问题,如图1-1所示。通过把物理服务器的CPU、内存、本地存储、网络资源通过虚拟机或容器进行资源和性能的切分和隔离,就能运行多个数据库实例,为多个云用户提供服务。当然,为了减少多个数据库之间I/O性能的串扰,高速的SSD存储也成为了标配。这是最早期云数据库形态,特点是成本最优,至今还在为一些首要关注成本的开发者和小客户所使用。
图1-1 第一个阶段:基于虚拟化和本地SSD的云数据库
随着这些小客户的业务发展,一些小的创业公司逐渐成为独角兽,一些Mission-Critical的关键业务应用,需要提供满足7X24小时不间断的服务,于是新的形态在演化,在第一个阶段的基础上,如图1-2,通过增加一个备库的方式,在主库和备库之间同步另一份数据,然后只有主库提供服务,备库随时在当主库发生故障的时候替换主库进行服务。通过这种Active-Standby的架构,能实现99.95%级别的高可用服务。这是被很多生产环境所证实的简单实用的高可用机制。但是代价是增加了成本,因为增加了一个隐藏的备机,同时数据也增加了1倍。
图1-2 第二个阶段:高可用的云数据库
在高可用的问题解决之后,随着用户业务和数据的增长,系统负载不断增加,一种非常实用的“读写分离”架构被引入,如图1-3所示。读写分离架构针对大部分数据库应用场景下,读和写请求的比例为3比1以上,很多场景读写比例甚至达到10比1或更高。这种情形下,通过引入多个只读节点(只读库),在只读节点上各同步一份主节点的数据,来分担读的负载,系统的整体吞吐能力得到数倍的提升,能够非常有效的解决绝大多数的大数据量并发处理的场景。当然,由于引入只读节点,多个只读节点的高可用也需要一个隐藏的备库来支撑,也需要有一个自适应负载均衡的读写分离的代理接口做数据的连接和自动分发。于是,系统整体处理能力提升了,可是成本却会快速增长。比如有N个只读节点,那么整体系统的数据就有N+1+2份复制(1个主节点,2个备库)。另外,物理机本地存储的限制,最大支持的数据量最多也只能在2TB到3TB左右。所以说,上诉架构在并发性能、数据容量、成本、弹性等各个维度需要进一步演化。
图1-3引入读写分离架构的高可用云数据库
而图1-4 是云数据库演化的质的飞跃,基于共享存储的高可用读写分离架构,这种架构利用分布式共享存储,采用数据三副本存储,提高了数据的可靠性。使用数据共享架构,只读节点各自无需进行数据的复制,极大的提升了系统性能,而且支持多达15个只读节点,还能保证更低的只读节点的数据延迟。当只有一个只读节点时,只读节点在获得读写分离能力的同时,还能额外提供一倍的读性能,这种Active-Active的高可用机制,相对于之前的Active-Standby的高可用机制,是一个技术演化的进步。总之,基于共享分布式存储会带来本质上的技术架构优势,阿里云的云原生数据库POLARDB,就是基于这样一种最新的技术架构演化发展而来,按照28法则并结合实际运维经验来看,能够满足80%以上用户的关系型数据的处理场景。
图1-4基于分布式共享存储的高可用读写分离的云原生数据库
从上诉云数据库的演化过程来看,云数据库拓展了企业级整体方案的服务能力(高可靠、高可用、负载均衡、读写分离等等),并且在云平台的能力基础上,通过技术架构的演化形成云原生数据库,提供了传统数据库能力的超集,形成了如图1-5 的从资源、平台到生态的整体云服务体系,对比传统数据库具有以下特点:
1. 云数据库通过计算、网络、存储的虚拟化和分布式技术,进一步拓展了传统数据库计算能力的边界。并提供了根据用户业务应需而变、快速弹性的服务能力。
2. 云数据库提供了省时、省心、省力的基于绿色计算、安全和高速网络的IDC硬件部署、监控管理和软硬件的升级和维护服务。
3. 云数据库通过基于的Web服务自助管理方式,极大的简化了用户的购买、操作、管理过程,极大的降低了时间成本和应用成本。
4. 云数据库,直接提供了传统on-premise企业级关键应用需要依赖高可用、负载均衡、防火墙、网络拓扑、跨机房容灾等外部的其他软硬件工具、模块,来搭建安全可靠的满足企业级方案的数据库服务能力。
图1-5 阿里云Apsara云数据库服务体系
云原生关系型数据库:企业级信息的价值来源
对于现代化企业来讲,需要在企业云计算数据中快速发掘新的价值和机会,云服务提供的IT资源能力,已经是整体数字化方案的最佳实践。未来企业生产力的竞争,不再仅仅比拼横向生产的规模,运营的效率,和获取资源的能力。更需要在纵向上,在应对用户需求的市场快速变化上,提供更加精益的生产力和精准的营销能力。数字化时代企业需要具有快速应变的创新能力,通过数据进行关联和分析,快速、直接、精准的感知需求和洞悉市场的变化,能够打造个性化、精细化、新颖化的产品和服务,给企业带来新的生命力。企业云计算数字化IT架构逐渐成为标配,云服务已经不是最早期的满足中小互联网用户的形态和能力,云原生关系型数据库能够围绕企业级云应用关注的业务连续性、高性能处理能力、安全可靠性、可扩展性、弹性能力等提供整体方案和服务能力。如下图1-6所示,企业级云应用围绕数据管理的多个维度以及业务、信息和数据管理的流程,对于数据处理,交易过程,分析萃取,工作流等最后沉淀下来的是最为宝贵的,能够直接表述用户信息、需求信息、业务性能和商业价值的多个模块,都和关系型云数据库紧密关联。
图1-6 企业级云数据和信息架构
POLARDB:100%兼容MySQL的关系型原生数据库
而相比较于早期的云数据库服务,云原生数据库POLARDB能够为企业提供更好的安全可靠的特性,更好的业务连续性,更快的业务需求应变能力,更好的扩展性,当然还有更高的性价比。POLARDB采用最新的软硬件一体化的创新融合设计,在多个技术指标上做到世界领先。
1. 极速性能
POLARDB对计算和存储引擎进行优化,通过标准Sysbench OLTP性能基准测试,读性能最高达到100万QPS,写性能最高超过25万QPS,轻松应对企业级大规模数据的处理。最大支持16个处理节点,系统并发聚合读性能最高达到1000万QPS。另外,POLARDB针对数据的复杂查询能力,提供加速模块,能够获得高达4-20倍左右的查询加速能力。
2. 超大容量与弹性伸缩
POLARDB采用分布式共享存储架构,计算与存储分离,采用最先进的3D Xpoints存储介质,存储空间根据用户实际使用数据自动扩展,存储按照用户的实际使用量收费,。无论多大数据量,5分钟之内即可完成节点规格的升级和进行只读节点的扩展,应需而变,随需所用,极速适配。
3. 100%兼容MySQL
100%兼容MySQL OLTP(在线事务处理)的能力,向下兼容MySQL5.6,极大的降低用户业务的适配成本,使企业上云的适配成本和改造风险降到最低。
4. 高可靠、高可用
POLARDB使用分布式海量存储系统,通过多个副本带来数据的高可靠性。底层的存储数据支持Snapshot进行秒级别的极速备份。并且支持数据强一致的同城灾备能力,为企业级最核心的价值数据提供最可靠的技术支撑。
5. 数据安全
POLARDB采用白名单、VPC网络、SSL加密、SQL审计、数据多副本存储、备份恢复等全方位手段,对数据库数据访问、存储、管理等各个环节提供安全保障。让企业级数据在云上获得全方位的安全保障。
我们相信,企业在未来行业的融合,跨界的尝试,微创新的应用中,会不断洞见和发掘数据的价值。而阿里云数据库,通过持续创新的技术优势,将为企业精益生产力的快速进化提供最直接的助力。