开发者学习笔记【阿里云云数据库助理工程师(ACA)认证:数据库的类型(TP、AP、NoSQL、工具)(二)】
课程地址:https://edu.aliyun.com/course/3112080/lesson/19075
数据库的类型(TP、AP、NoSQL、工具)(二)
三、关系型数据库@阿里云
关系型数据库:
第一类是关系型数据库,它是创建在关系模型基础上的数据库,借助于集合代数等数学概念和方法,用来来处理数据库中的数据。它最大的特点是有标准的数据查询 SQL 语言,并且整个数据的组织是一个关系,所谓的关系可以理解成一个表来组织的,我们通过 SQL 语言对表中的数据进行检索和操作。最常见的关系型数据库有 Oracle、SQL Server 、以及开源的 Postcgre 等等。另外随着云数据库的兴起,也有许多新奇的关系型数据库,包括 AWS Aurora 以及阿里云的 Polar DB等。
关系数据库(英语: Relational database ),是创建在关系模型基础上的数据库,借助于集合代数等数学概念和方法来处理数据库中的数据。……标准数据查询语言 SQL 就是一种基于关系数据库的语言,这种语言执行对关系数据库中数据的检索和操作。
常见的关系型数据库:
Oracle、SQL Server、PostcgreSQL
很多新兴的云数据库也是关系型数据库,例如, AWS Aurora、PoIarDB 等。
关系型数据库@阿里云数据库:
阿里云的关系数据库最具典型代表的是最近在2017年发布的,并于2018年正式商用的云原生关系型数据库 PoIarDB ,是阿里巴巴自主研发的下一代云原生关系型数据库,百分之百的兼容 MySQL、Postcgre 、并且可以高度兼容 Oracle ,让用户既享受到开源数据库的灵活与生态兼容性,同时又享受到企业级数据库的稳定以及高可用能力,同时它的价格还与开源数据库相同。另外一个是它的分布式版 polar DB-X 是由阿里巴巴自主研发的云原生分布式数据库,它融合了分布式的 SQL 引擎 DRDS ,以及阿里巴巴自主研发的自研存储X-DB ,专注于解决在关系型数据库领域的海量数据存储,以及高并发高吞吐的这种业务场景。除此之外,阿里云数据库在关系型数据库内部下还有几个非常经典、传统的关键因素,包括 RDS MySQL ,是全球最受欢迎的开源数据库,并且是开源组合 LAMP 中重要环节,目前可以看到它在互联网各种业务场景下已经使用的非常广泛。第二个是 RDS SQL Server ,是一个面向于中小企业在 windows 环境下使用的非常广泛的一类数据库在零售、医疗、房地产行业应用的非常广泛。第三个是 RDS PostcgreSQL ,在业界被誉为最先进的开源数据库,它最早期的开发是始于20世纪的70年代,发展历史非常悠久,还有非常复杂的面向企业级的 SQL 能力,也可以支持一些 NoSQL的数据类型,另外阿里云在 RDS PostcgreSQL 上还新增了 Ganos多维多模的时空信息存储引擎,可以非常好的处理时空信息数据。另外 RDS 还支持 MariaDB。
PolarDB 云原生关系型数据库 |
是阿里巴巴自主研发的下一代云原生关系型数据库,100%兼容开源 MySQL、PostgreSQL 、高度兼容 Oracle 。让用户既享受到开源的灵活性与价格的优惠,又享受到商业数据库的高性能和安全性。 |
PolarDB-X 云原生分布式数据库 |
是由阿里巴巴自主研发的云原生分布式数据库,融合分布式 SQL 引擎 DRDS 与分布式自研存储 X-DB ,专注解决海量数据存储、超高并发吞吐、大表瓶颈以及复杂计算效率等数据库瓶颈难题。 |
RDS MySQL |
MySQL 是全球最受欢迎的开源数据库之一,作为开源软件组合 LAMP( Linux+Apache+MySQL+Perl/PHP/Python ) 中的重要一环,广泛应用于各类应用场景。 |
RDS SQL Server |
云数据库 RDS SQL Server 版是一种稳定可靠、可弹性伸缩的在线数据库,拥有微软 SQL Server 正版授权许可,支持复杂 SQL 查询,广泛应用于新零售、医疗、房地产等行业。 |
RDS PostgreSQL |
PostgreSQL 被业界誉为最先进的“开源数据库“,面向企业复杂 SQL 的 OLTP 业务场景,支持NoSQL 数据类型( JSON/XML/hstore )、提供阿里云自研 Ganos 多维多模时空信息引擎,及PostGIS 地理信息引擎。 |
RDS MariaDB |
基于 MariaDB 企业版全球独家合作认证,提供Oracle 兼容性及众多企业级数据库特性,支持包括MySQL InnoDB 等多种存储引擎,为不同需求的用户提供灵活的选择。 |
四、 NoSQL 数据库@阿里云
NoSQL 数据库:
NoSQL 数据库是一个比较比较泛化的分类,一般 NoSQL 代表的意思是 Not Only SQL 即不一定对 SQL 有很好的支持,它与传统的数据库和关系数据库是不一样的,虽然它的 SQL 能力不强,但却有非常好的水平扩展特点,它产生的背景是在20世纪初期互联网快速兴起,信息化以及互联网化让数据的发展呈指数形式的增长,原来的关系数据库的扩展性不能满足业务的要求,而且在很多数据存储的情况下,一致性却又可以做一些妥协,同时产生非结构化和半结构化的数据存储。在这种业务场景下,传统数据库有非常多的缺点和问题,第一个成本非常高,第二是扩展能力比较强,第三个是为了实现强制执行带来的其他方面的牺牲非常大。此时, NoSQL 数据库应运而生,比较常见的有以下几个分类,包括文档数据库,以 MongoDB 为代表; Key-Value(K-V) 数据库, 以 Redis 为代表;图数据库,以 Neo4j 为代表;还有宽列数据库 HBase 等等。
这是一个比较泛化的分类。一般的, NOSQL(Not Only SQL) 是对不同于传统关系数据库的数据库管理系统的统称。一般有非常好水平可扩展的特征。
NoSQL 数据库产生的背景:
信息化、互联网化让数据呈指数式增长
超大数据量下的扩展性诉求
很多场景下,一致性可以妥协
大量非/半结构化数据存储
传统关系型数据库
Scale-up 的成本非常高
不具备 scale-out 的能力
为了强一致性,单点失败总会带来不可用
常见的 NoSQL 数据库分类-
文档数据库
MongoDB
CouchDB
Key-Value(K-V) 数据库
Redis
Riak
memcached
图数据库
Neo4j
JanusGraph
TigerGraph
宽列数据库
HBase
Cassandra
NoSQL 数据库@阿里云数据库
阿里云 NoSQL 数据库有以下几个。第一个是阿里云云原生多模数据库 Lindorm ,是阿里自研的,可以适用于任何规模多种模型的数据存储,支持海量数据的低成本存储。它可以兼容包括 HBase、Cassandra、Open TSDB、Solr、SQL 等等。第二个是 GDB 图数据库,是一种支持属性图模型,可以非常好的处理高度连接数据的数据库。第三个是云数据库 Redis 版,它是典型的 KV 数据库,在云数据库Redis版中用户可以使用和Redis完全兼容的数据库。另外还有云数据库 MongoDB ,支持 ReplicaSet 和 Sharding 两种部署模式,它具备非常好的企业级特性,在企业应用中,可以非常好的使用云数据库 MongoDB 。另外还有云数据库 HBase 、云数据库、 Cassandra版本。
Lindorm 云原生多模数据库 |
适用于任何规模、多种模型的云原生数据库服务,支持海量数据的低成本存储处理和弹性按需付费,兼容 HBase/Cassandra、OpenTSDB、Solr、SQL、HDFS等多种开源标准接口。 |
GDB 图数据库 |
是一种支持属性图模型,用于处理高度连接数据查询与存储的实时可靠的在线数据库,支持TinkerPop Gremlin 查询语言,可以帮助用户快速构建基于高度连接的数据集的应用程序。 |
云数据库 Redis 版 |
云数据库 Redis 版支持高可靠双机热备架构和性能灵活扩展的集群架构,可满足高读写性能场景、容量按需弹性变配的业务需求,适用于互联网高并发、低延迟的在线热点业务。 |
云数据库 MongoDB 版 |
云数据库 MongoDB 版支持ReplicaSet 和 Sharding 两种部署架构,具备安全审计,时间点备份等多项企业能力。在互联网、物联网、游戏、金融等领域被广泛应用。 |
云数据库 HBase 版 |
面向大数据领域的一站式NoSQL 服务,100%兼容开源HBase 并深度扩展,支持海量数据下的实时存储、高并发吞吐、轻SQL 分析、全文检索、时序时空查询等能力。 |
云数据库 Cassandra 版 |
Cassandra 是连续9年DB-Engines 排名第一的宽表数据库,支持类 SQL 语法 CQL ,才有分布式、无中心架构,可扩展PB 级存储及干万 OPS 读写能力。 |
OLAP 数据库:
另外阿里云有一个大的数据库是 OLAP 数据库。随着互联网、物联网的快速发展,数据是快速增长的,半结构化数据和非结构化数据不仅要有非常好的需求,还有数据分析需求。通过数据分析系统对数据进行分析,可以很好的挖掘数据底层的价值,使前端的业务更加高效。传统的 OLAP 数据库有以下特点,比如在线查询像 MySQL、Oracle、PostcgreSQL 、SQL Server 等等。有的可以支持复杂查询,并且可以用于查询加速;有的都专注于做离线计算,需要有比较好 ETL 支持。在云时代,新的 OLAP 数据库的特点第一个通常要具备实时 CURD即写入、更新、删除等操作,支持在线查询,支持 ETL 计算,支持多维的实时分析查询等。
随着互联网、物联网等在线数据的快速增长,以及半结构化、非结构化数据处理需求增加,在分析型数据库等大数据处理系统逐渐增加,可以实现对海量数据进行快速的多维复杂分析。
五、数据仓库@阿里云
数据仓库@阿里云数据库
阿里云的数据仓库类的产品大致分为四类。第一个是云原生数据仓库Analytic DB ,是一种支持高并发、低延迟的新一代云原生数据库,它可以非常好的兼容 MySQL 。还有兼容 PostgreSQL 版,即云原生数据仓库 AnalyticDB PostgreSQL ,它很好的支持了 PostgreSQL以及 Greenplun 这两个源的这个产品,如果系统原来是使用PostgreSQL 和 Greenplun ,那就可以迁移到云原生数据仓库Postgre 里。另外分析类的产品还有云数据库 ClickHouse 以及云原生数据库分析等等。
Analytic DB MySQL 云原生数据仓库 |
是一种支持高并发低延时查询的新一代云原生数据仓库,高度兼容 MYSQL协议以及SQL-2003语法标准,可以对海量数据进行即时的多维分析透视和业务探索,快速构建企业云上数据仓库。 |
AnalyticDB PostgreSQL 云原生数据仓库 |
支持标准 SQL2003,兼容PostgreSQL/Greenplum ,高度兼容 Oracle 语法生态,既支持任意维度在线分析探索,也支持高性能离线数据处理;是面向互联网、金融、证券、保险、银行,数字政务、新零售等行业有竞争力的数据仓库方案。 |
云数据库 ClickHouse |
分布式实时分析型列式数据库服务。高性能,开箱即用,企业特性支持。应用于流量分析,广告营销分析,行为分析,人群划分,客户画像,敏捷 BI ,数据集市,网络监控,分布式服务和链路监控等业务场景。 |
云原生数据库分析 |
是完全弹性的架构,提供一站式的数据分析与计算服务,支持ETL、机器学习、流、交互式分析;可以分析与集成对象存储 (OSS )、数据库( PostgreSQL/MySQL 等)、NoSQL(Lindorm、TableStore、MongoDB 等)数据源的数据;功能包括:数据入湖.元数据管理与自动发现,支持双引擎: SQL (兼容 Presto)、Spark。 |
六、数据库生态工具@阿里云
要想使用好数据库,除了引擎产品之外,还需要有完整的数据库生态工具。阿里云则提供了以下非常完整的数据生态工具体系,可以帮助我们更好的使用数据库,包括混合云数据库备份统一管理的产品 DBS,第二个是企业级数据安全管理产品 DMS 以及非常重要的数据传输DTS , 数据传输可以做数据集成、迁移,数据的订阅、分发等等。还有一个非常重要的产品——数据库自治服务 DAS ,它可以让一部分的数据库管理操作完全托管,由 DAS 管理,它具备全链路自安全、自恢复、自优化等能力。
数据库已经是数据存储的核心基础设施,完整的数据库生态工具可以帮助更好的使用数据库,包括在线数据管理、数据集成、数据备份、数据迁移、应用迁移评估等。
数据库生态工具在阿里云上具体有下面这些产品,包括数据库自治服务 DAS ,数据传输 DTS ,数据管理 DMS ,数据库备份 DBS ,数据库应用迁移 ADAM 以及数据库网关等。
DAS 数据库自治服务 |
是一种基于机器学习和专家经验实现数据库自感知、自修复、自优化、自运维及自安全的云服务,帮助用户消除数据库管理的复杂性及人工操作引发的服务故障,有效保障数据库服务的稳定、安全及高效 |
DTS 数据传输 |
支持关系型数据库、 NOSQL 、大数据( OLAP ) 等数据源间的数据传输。它是一种集数据迁移、数据订阅及数据实时同步于一体的数据传输服务。 |
DMS 数据管理 |
提供免安装、免运维、即开即用、多种数据库类型与多种环境统一的 web 数据库管理终端;可以为企业用户快速复制搭建与阿里集团同等安全、高效、规范的数据库 DevOps 研发流程解决方案。 |
DBS 数据库备份 |
数据库备份( Database Backup ,简称 DBS )是为数据库提供连续数据保护、低成本的备份服务。它可以为多种环境的数据提供强有力的保护,包括企业数据中心、其他云厂商、混合云及公共云 |
ADAM 数据库应用迁移 |
是一款把数据库和应用迁移到阿里云的产品,大大降低了上云的技术难度和成本,尤其是 Oracle数据库应用。 ADAM 全面评估上云可行性、成本和云存储选型,内置实施协助,数据、应用迁移等工具,确保可靠、快速上云。 |
DG 数据库网关 |
是一种支持私网数据库远程访问的数据库连接服务。通过数据库网关,用户可以使用应程序或云服务访问并管理本地 IDC 或其他云厂商的数据库。 |
另外还有一类独特的数据库产品类型是数据库专属集群,英文名MyBase ,它向用户提供了包括 RDS MySQL、PostgreSQL、SQL Server 和 Redis 等托管的产品。一方面它具备托管产品的无需进行运维管理的一个优势,还具备了传统线下数据库的把控能力,把资源超配、混合部署、资源调度、弹性策略等等,以及数据库的更多的权限,甚至包括数据库上 OS 的权限都交给用户,让用户可以更加的灵活的管理数据库。它可以满足大众型企业对于云上数据库自主管理的诉求。
云数据库专属集群,提供给客户以主机形式购买云数据库服务,目前包括 RDS MySQL、PostgreSQL、SQL Server 和 Redis 服务,在赋予 PaaS 数据库同样能力之外,还具备资源超配、混合部署、资源调度、弹性策略、更开放的权限、自主运维能力,以满足大中型企业客户对云上数据库自主管理的核心需求。
回顾:以下是阿里云企业级云原生数据库整个的产品体系,包括云原生数据库、关系数据库大的分类、分型数据库即 OLAP 数据库、 NoSQL 数据库、生态工具、数据库专属集以及之下的云原生数据库管控平台和数据库自治服务等。