1.MPPDB简介
MPP,它是一款 Shared Nothing 架构的分布式并行数据库集群,具备高性能、高可用、高扩展特性,可以为超大规模数据管理提供高性价比的通用计算平台,并广泛地用于支撑各类数据仓库系统、BI 系统和决策支持系统。
2.MPPDB技术特点
- MPP 具备以下技术特征:
-
1) 低硬件成本:完全使用 x86 架构的 PC Server,不需要昂贵的 Unix 服务器和磁盘阵列;
2) 集群架构与部署:完全并行的 MPP + Shared Nothing 的分布式架构,采用 Non-Master 部署,节点对等的扁平结构;
3) 海量数据分布压缩存储:可处理 PB 级别以上的结构化数据,采用 hash分布、random 存储策略进行数据存储;同时采用先进的压缩算法,减少存储数据所需的空间,可以将所用空间减少 1~20 倍,并相应地提高 I/O 性能;
4) 数据加载高效性:基于策略的数据加载模式,集群整体加载速度可达2TB/h;
5) 高扩展、高可靠:支持集群节点的扩容和缩容,支持全量、增量的备份/恢复;
6) 高可用、易维护:数据通过副本提供冗余保护,自动故障探测和管理,自动同步元数据和业务数据。提供图形化工具,以简化管理员对数据库的管理工作;
7) 高并发:读写不互斥,支持数据的边加载边查询,单个节点并发能力大于 300 用户;
8) 行列混合存储:提供行列混合存储方案,从而提高了列存数据库特殊查询场景的查询响应耗时;
9) 标准化:支持 SQL92 标准,支持 C API、ODBC、JDBC、ADO.NET 等接口规范。
3.MPPDB功能
功 能 | 描 述 |
---|---|
结构化查询语言 | 符合 SQL 92 标准,支持 CREATE、ALTER、DROP 等 DDL 语法,支持 SELECT、INSERT、UPDATEDELETE、MERGE 等 DML 语法,支持单表,多表联合查询 |
数据类型 | INT、TINYINT、SMALLINT、BIGINT、DECIMAL、FLOAT、DOUBLE |
数值数据类型 | CHAR、VARCHAR、TEXT 字符数据类型 DATE、TIME、DATETIME、TIMESTAMP 日期类型 BLOB 二进制数据类型 |
数据库对象 | 提供了数据库,表,索引,视图,存储过程,自定义函数等常用数据库对象的创建,修改和删除操作,支持数据库用户的创建,删除操作,以及用户权限的分配与回收 |
行列混合存储 | 基于创建的物理表,可以实现行存列的创建,修改和删除 |
图形化工具 | 提供了企业管理工具和集群监控工具。 |
接口 | 符合并支持 C API、ODBC、JDBC、ADO.NET 等接口规范 |
外围工具 | 提供数据加载、集群备份/恢复、数据重分布等外围工具 |
4.MPPDB架构
MPP 采用完全并行的 MPP + Shared Nothing 的分布式扁平架构,这种架构中的每一个节点(node)都是独立的、自给的、节点之间对等,而且整个系统中不存在单点瓶颈,具有非常强的扩展性。