开发者学堂课程【阿里云数据库产品家族及特性:阿里云数据库产品家族及特性】学习笔记,与课程紧密联系,让用户快速学习知识
课程地址:https://developer.aliyun.com/learning/course/66/detail/1157
阿里云数据库产品家族及特性
1、阿里云新一代云原生数据库体系
在云数据库工作新一代云原生数据库体系,这里面有很多产品都已经熟悉,如上图这些都是阿里云的资源数据库产品,其实也都是面向云计算设计云原生产品,上面是很多工具类产品,可能很多人用过阿里云的数据库非常了解,数据迁移的 dts ,数据库可视化管理的工具以及数据库专业的备份工具 dbs,这些都是面向于原生工具的设计,基本上也是与传统的工具是不一样的。这些工具都是云想开箱即用的,像 dms 像是一个服务,不需要安装也不需要传统的客户端工具一样去做一些客户端的安装,也会跟云数据库打通使得更加安全更加高效。
在中间这五个大的板块,这些都是云原生数据库产品,包括云原生数据库 PolarDB ,云原生分布式数据库 PolarDBX,这两个是面向欧阳 TT 场景,然后再欧阳AP 场景有云原生数据仓库 AnalyticDB,简称为 ADB,然后云原生的数据湖 DLA和 OSS 的解决方案。在面向 IoT 物联网领域在研发一个云原生多谋数据库叫做灵动。
最底下的是面向自动运维产品叫做 DAS 数据库自治服务,主要是跟自动驾驶理念,如果说数据库放在阿里云上,能够帮助自动的诊断优化,自动的弹性扩展,也是目前云数据库在往下一个阶段走的一个重要的标志,做到自动运维的管理,这张图展示了新一代云原生数据库体系。
2、云原生数据库领导者PolarDB(特点:弹性、大容量、快)
阿里云增长最快的数据库
首先是云原生的数据库 PolarDB,PolarDB 是云原生的领导者,今天已经有很多国内的厂商在看 PolarDB 是怎么做的?去学习参考它, PolarDB 可以是阿里云增长最快的数据库,图表中可以看到 PolarDB 增长趋势真的是非常非常快,在去年大概比前一年增长了十倍,这样一个规模,PolarDB 左边是一个架构示意图,最上层是一个智能代理,就是选过来的应用请求都是通过智能代理去处理,智能代理可以根据读写请求自动分发到不同数据库节点,数据库节点有 PolarDB 支持扩展自读节点的,自读节点扩展非常灵活,最高可以扩展到15个自读节点,这个扩展只需要花五分钟就可以直接扩展上。
这种比传统的快非常多。最主要的原因是它是一个存储器上分离的架构,最底下就是 PolarDB 存储 PolarStore,PolarStore 是一个删副本高可用的架构,对数据的保障非常好,并且中间是通过 rdma 的网络跟上层计算机连接,这也是通过 rdma 第一眼时网络可以保证数据库的效率非常高。
polarDB 有几个主要的特性,也是在跟用户在调研的时候,用户给直接反馈,第一个是兼容性非常好,就是 PolarDB 跟 PolarStore 版本5.6和8.0兼容的,基本上比原来使用的不用修改,可以直接迁移上来,第二个是快,polarDB 在性能上单个主机可以做到100万的 qps,并且 PolarDB 里面增加了查询的能力,查询能力最高也是会比社区的版本普通的查询高,内部测试高了27倍,PolarDB 存储器上分离的价格在存储空间上做的非常大,单个实例可以做到100 db,这个基本上大部分的场景单个 PolarDB 来满足需求。然后 Polar DB 在弹性方面分离是非常好的,它可以很快直接生产出实例,甚至在两级弹出来,另外一个是存储是共享的,所以,在主备之间包括总节点自读实例之间没有主备延时的。这个在传统的储备是很难做到的,特别是比如很大批量的操作,很可能延时会到几十分钟或者几个小时有可能发生,这时候会导致自读实例很难在业务上使用。PolarDB 它是基本上没有主备延时。最后一个是自动读写分离,这也是 PolarDB 分享非常有竞争力的地方,自动的读写分离也可以让自读实例在应用里面是不用去特殊的配置,它会根据查询的这个负载到底是读还是写自动路由到不同的节点,这样的话应用写起来方便,并且在扩展的时候要增加一个自读节点,这个负载会自动的路由过来。这个是 PolarDB里面六个非常主要的特性。
在这次新冠疫情期间,PolarDB 用的非常多,也得到了客户的认可,特别是教育行业和游戏行业,这两个行业 PolarDB 应用的非常广,有很多典型的客户,像好未来,猿辅导,还有游戏里面像心动网络等等,这些都 PolarDB 应用的非常多。
3、Oracle迁移标准解决方案
PolarDB-O+ADAM+DTS
PolarDB 还有一个版本是 Oracle 兼容版,也是现在业界客户比较多的是 Oracle 迁移标准解决方案,是 PolarDB OracleADAMDTS,它的这个兼容器非常高,可以说是业界中最高的产品,在很多场景评测下来有95%以上 Oracle 兼容性,整个 Oracle 迁移也是一个标准化的流程,一般系统一个月可以完成迁移,这里面会使 ADAM 先做迁移评估,再使用 DTS 做在线迁移,迁移评估主要就是肯定连到 Oracle 数据库,把 Oracle 对象做一个分析,然后看一下哪些是兼容的,哪些不是兼容的,如果是不兼容的,是通过什么样的修改变成兼容?这次在 Oracle 产品会做非常完善的迁移评估,然后也会给出迁移建议,特别如果是不兼容它会给建议到底怎么去改?是在数据库里面改,还是在应用里面改?都能做的非常非常细致,DTS 在线迁移可以保证不需要停机,就直接把 Oracle 迁移到 PolarDB ,这是一个标准化的解决方案。
另外从最近做的很多开始来看,客户从 Oracle 迁移到 PolarDB 整个成本至少下降50%以上,甚至有些会下降到百分之六七十,主要原因是 PolarDB 软件费用非常低的,一般只有商业库的1/6,像其他费用的迁移都是免费的。
第三个是 PolarDB 性能也是非常棒的,当然现在离 Oracle 整个性能还是有些差距,目前大概是 PolarDB 70%的性能。这个是做标准 TPC-C 测试的一个结果。今年也投入了大量的会在进一步提升 PolarDB -Oracle 性能,预计经营的 Oracle 性能差不多,基本上统一。
第四个是 PolarDB 云原生的体系架构,首先是快速弹性的能力,刚才介绍的东西全部在里面,分离架构,读写分离,支持100Tb的存储空间,这个存储空间也是按量使用多少计算多少,不会有浪费的问题。第五个是 PolarDB -O 通过这个国产化的论证,也支持了 AMR 的 CPU,都支持国产的操作系统,这个是 Oracle 迁移标准解决方案。
4、提供业界最佳的Oracle兼容性
上图是刚才介绍的 PolarDB-O 兼容性的介绍,这里面信息非常多,包括像客户端兼容、SQL 兼容以及提供重大特性兼容。
5、PolarDB数据库Oracle兼容开发手册(目录截取)
上图是手册里面的内容,对各种语法的兼容项,有详细的介绍。
6、云原生分布式数据库PolarDB-X
一体化分布式数据库
另外 PolarDB 还有一个版本是分布式的版本叫做PolarDB-X,这个产品如果比较熟悉阿里历史也会有一些了解,之前产品有老的版本 DRDX 让升级到 PolarDB-X 也是一个全新的升级。 PolarDB-X 不是一个中间的架构,是一体化的分布式架构。这个架构图上可以看到增加了很多分布式数据库的专用主键进去,并且能够做到自动的分布式的扩展。
那分布式的 PolarDB-X 几个比较重要的特性。首先它可以处理高并发的这个负载,这个在阿里巴巴集团包括双十一都是全面应用的,这种几十万,上百万及上千万的这种并发,它都能够处理。第二个是全局的二级索引,也是分布式数据库里非常非常重要的特性,目前也是 PolarDB-X里面已经上线了,有了全局二级索引,还有一个是复杂查询,分布式事务,这几个也是分布式数据库里面非常非常重要的特性。有了这三个特性,基本上可以使用单机数据库去使用分布式数据库,然后 PolarDB-X 还有 HTAP 这样一个能力可以去添加分析实例,另外,在线的弹性扩展,如果说原来购买了四个节点的分布式数据库,因为业务的发展,需要有更高的容量支撑,可以直接扩展到八个节点或者16个节点,这是弹性扩展的能力。那么 PolarDB-X 包括互联网,包括政企金融都有非常广泛的应用。特别是像特别大的那种,中国邮政等等,其实都在使用 PolarDB-X 产品,这个是主要用在比较大的业务场景,如果以前像使用分布式的中间键,对 PolarDB-X 是非常好的从原来自建迁移到原数据的解决方案。
7、ADB:云原生数据仓库(极致弹性、极致性能、实时、兼容性)
另外就是云原生数据仓库 ADB ,DAB 是数据仓库里面一个非常专业的解决方案,它首先在弹性扩展方面从一个节点扩展到五千个节点,另外在处理数据量上,在几十个gb,在Tb甚至可以做到100个tb,这个在存储空间上非常灵活的弹性扩展, QPS 上也可以从几个或者数百万个来支持 QPS,对外的一个理念,如果说会使用数据库就会使用大数据,大数据相对来说还是比较复杂的,ADB 是一个数据仓库的理念,是非常简单的可以上手,而且兼容Pg两种协议都可以选择一种,这种弹性扩展能力计算分离来做到非常高,非常快的弹性扩展,
另外 ADB 是融合了像传统的数据仓库以及云计算,大数据技术全部融合在一起,所以它可以认为是新一代的云原生数据仓库,那在5月份最新做的 TPCDS 国际标准测试上拿到了全球最高这个成绩,比第二名整个指标都高非常多,因为 ADB 是这个 VLDB 应该说是中国第一篇大规模商用据库系统介绍论文发表,这个也是非常非常有影响力的一篇论文。
然后 ADB 在以及发展很多年,很多客户里面都有广泛的应用,包括像在通用行业,公共有的,专业有的像国家电网,中国邮政非常多,金融领域也有非常多的应用,像天虹基金,像一些银行都有非常广泛的应用,数字政府就非常多了。
8、DLA云原生数据湖(Serverless,统一元数据+开放存储与分析计算)
另外在云上有云原生数据湖解决方案 DLA ,数据湖主要是解决数据会分散在很多地方,包括在关系型数据库,在数据仓库,在大数据里面,或者在文件存储,那数据湖的价值以分散在不同地方的数据库都能联合起来,可以通过一条 ,把关系型数据库和数据库做联合分析。那 DLA 它是一个 Serverless 架构, 不需要去预购一个资源,完全是按量计费的,另外元数据方面可以采集,如果在 OS 上有文件,它能够自动识别出来,只要把大体的告诉它,文件格式,内容能够自动识别出来。这是数据样非常多。
另外 DLA 数据湖方案在上层跟很多系统完全对接,像跟 table ou,跟帆软以及阿里云 works ,informatica 等等这些产品都有比较好的对接,现在这个数据和解决方案有非常多的客户在使用,像智明星通,yeahmobi 等等从 was 使用数据库产品。然后在有盟里面也有很多客户使用。
9、数据传输云服务DTS(数据迁移、同步、订阅)
数据高数公路
另外就是从传统数据库到云数据库非常重要的一个产品就是数据迁移,最重要的是 DTS 这个产品,它能够提供数据数据迁移,数据同步以及数据订阅,内部把它称为数据高速公路。从这张图里面可以看到在源端数据库 oracle, MySQL ,这些数据库可以通过 DTS,通过全量迁移和增量迁移直接迁移到阿里云。
这个迁移目标像RDS,PolarDB,PolarDB-X 以及 ADB 都能支持,不仅迁移,同步也是可以支持的。如果说有些可以个性化去处理,想把它增量的变更数据更新一些调用消息对列去做一些处理,那一天也可以提供实时订阅的能力,包括 kafka,或者说要更新反存等等都是可以通过 DTS 产品去完成。 DTS 在阿里上用的也是非常广泛,至少有几十万的数据库通过 DTS 迁移到阿里云来。
10、云数据库服务链路大图
最后做一个总结,上图整个是阿里云的云数据库产品大图,可以看一下从云外数据库,包括到本地自建的其他的云上数据库,传统数据库都可以通过 DTS 迁移到阿里云,在阿里云上有很多选择,可以包括像 rds ,Polar DB 等等根据业务的情况,去选择数据库。另外还有一些像海量数据可以选择 HBase 和 Cassabdra 等等,这种在线数据 DTS 同步到数据仓库像ADB 或者说 ClickHouse。
最上面的是面对开发 DMS ,在上面可以用可视化工具,基本上可以不用客户端这种数据库开发工具,直接用 DMS直接跟数据库完全打通,而且使用非常方便,DMS 还有企业版,如果是这种大型的企业经营户会涉及到一些数据库研发规范,包括发布流程,权限管控,这个也是可以使用 DMA ,这个在阿里巴巴集团也是广泛应用的。
最下面的就是数据库自治服务 DAD ,这里面可以帮助做数据库的监控告警优化,弹性调动等等都是在自制服务DAS 里面提供。
11、从传统自建数据库到云数据库的推荐方案
从传统自建数据库到云数据库做了一个推荐方案。里面的云数据库非常丰富,可以根据这张图来选择上云的方案,在这个关系型数据库领域,基本上比如是 WySQL,可以选择 rds WySQL,如果数据量比较大,弹性扩展要求比较高,可以选择 PolarDB-M 这个版本,这两个都可以,根据情况去选择,
第二个是使用了像 WyCAT这样分布式的数据库或者中间件,那么可以选择云原生分布式数据库 PolarDB-X,这个也是比较平滑的迁移过来。这个 SQL Server 可以直接迁移到 RDS SQLServer ,然后PostgreSQL 或者PolarDB-P 这个版本,PolarDB-P 是兼容 PostgreSQL 这个版本,如果是 ORACLE 数据库,造成方案五可以选择 PolarDB-O 数据库这个兼容性非常高,基本上可以是95%以上的兼容度,
那在数据仓库这一块,如果说使用了TiDB 分析这种场景,可以直接使用云原生数据仓库 ADB MySQL 版,MySQL 也是完全兼容的,如果引用了Greenplum,teradata 以及 ORACLE 这种的偏商业 MPP数据数库,并且可以迁移到云原生数据仓库 ADB pg 这个版本,兼容性非常好的成功案例,
如果用了 Clickhouse 可以迁移到云数据库 ClickHouse ,从在线数据库到数据仓库的选择,可以看一下中间几条线,WySQL 体系用的就是 rds MySQL,或者像 MySQL 中间见,分布式数据库,数据仓库选择云原生数据仓库 ADB MySQL ,这两个体系是完全一致的,而且中间通过 ETS ,或者 MySQL 分析实例可以一键打通,非常方便。
然后如果说是用了 SQL,PG,ORACLE,建议选择 ADBPostgre 版本,这个也是对商业兼容度非常高,那在 NoSQL 领域基本上可以完全平滑,原来是 Redis 可以迁移到云数据库 Redis,MongoDB,Cassabdra,InfluxDB,HBase 都对应云数据库版本,那么云数据库总体来讲它的这个稳定性,安全性以及性能方面都会你现在的开源都会更高的这个收获,也会提供很多的服务保障,一些专家服务都在里面。这是一个整体的推荐方案。
12、阿里云数据库-中国云数据库领导者
最后总结一下阿里云数据库的一些成果。首先在云数据库这个市场是亚太的第一,后在全球排第三,那在去年的全球分析报告里面像 Gartner 全球数据库挑战者,也是中国唯一一家企业进入这个榜单的数据库厂商,然后 Formester 去年进入全球数据库强劲表现者,也是中国排名第一的厂商。
第二个是产品非常丰富,在云上有26款云服务,在 OLTP,OLAP,NoSQL 还有工具这些领域都是全面覆盖,还有公共云,专有云,混合云以及一体机都有产品对外输出。还有两大资源产品 PolarDB,云原生数据库,有兼容MySQL,Oracle,PostgreSQL 三个版本,性能上非常好并且成本非常低,支持100 tb的存储空间。可以快速扩展到15个只读节点,然后 ADB 上有两个版本,一个是兼容MySQL,一个是兼容 PostgreSQL ,它可以支持非常复杂的 SQL 分析,相比于传统的数据性能提升十倍以上,ADB 在去年的 tpc-ds 都拿到了第一,
另外一个在达摩院叫做阿里巴巴达摩院,是一个非常深度的合作,包括前沿探索,现在做的安全数据库,自动驾驶数据库以及软硬件一体化设计等等都是跟达摩院一起合作,那整个阿里云数据库上面有10万加企业用户,有40万加数据库实例,业务增长也非常非常快,同时也支撑了阿里巴巴历年的双十一,去年的双十一最高支持了54.4万笔每秒峰值,这也是业界最高的数据库这种峰值。