国产数据库-技术特性-CloudberryDB

简介: Cloudberrydb基于gpdb,支持PG14内核,有很多GP目前不支持的优秀特性

GreenPlum(GPDB)是一款基于PostgreSQL(PgSQL)的开源分布式数据库。目前GPDB7已发布beta4,PgSQL内核支持到了12.12,但PgSQL优秀内核特性比如并行查询仍旧不支持。经查询PgSQL中并行代码已存在于GPDB中,但执行计划生成这块却不支持。这就比较可惜了。现在有款国产分布式数据库CloudberryDB基于GPDB,继承了GPDB优秀特性,并兼容PgSQL14.4的内核,支持了很多GPDB不具备的特性。

1、CloudberryDB vs. GPDB7

1.1通用特性

特性名

说明

Cloudberrydb

GPDB7 beta3

Explain (WAL) support

在执行计划中显示SQL语句生成的WAL大小,PgSQL13中增加的特性

支持

不支持

Multiranges

PgSQL14引入支持

支持

不支持

B-tree bottom-up index deletion

PgSQL14引入支持

支持

不支持

Covering indexes for GiST (INCLUDE)

PgSQL12引入支持

支持

即将支持

The range_agg range type aggregation function

PgSQL14引入支持

支持

不支持

CREATE ACCESS METHOD

PgSQL12引入支持

支持

即将支持

LZ4 compression for TOAST tables

PgSQL14引入支持

支持

不支持

JSONB subscripting

PgSQL14引入支持

支持

不支持

Configure the maximum WAL retention for replication slots

PgSQL13引入支持

支持

不支持

Verify backup integrity (pg_verifybackup)

PgSQL13引入支持

支持

不支持

Client can require SCRAM channel binding

PgSQL13引入支持

支持

不支持

Vacuum "emergency mode"

PgSQL14引入支持

支持

不支持

Certificate authentication with postgres_fdw

PgSQL13引入支持

支持

不支持

UPSERT

--

支持

即将支持

COPY FROM Where

PgSQL12引入支持

支持

不支持

VACUUM / ANALYZE Skip Lock Table

PgSQL12引入支持

支持

不支持

HASH partitioned table

PgSQL11引入支持

支持

不支持

CTE(SEARCH and CYCLE)

PgSQL14引入支持

支持

不支持

Procedure OUT parameters

PgSQL14引入支持

支持

不支持

CHECK constraints for foreign tables

--

支持

不支持

Timeout parameter for pg_terminate_backend

PgSQL14引入支持

支持

不支持

Auto failover for Master

应该是自己开发的

支持

不支持

Kubernetes deployment support

应该是自己开发的

支持

不支持

1.2性能相关特性

特性名

说明

Cloudberrydb

GPDB7 beta3

REINDEX CONCURRENTLY

--

支持

不支持

Aggregation pushdown

--

支持

不支持

CREATE STATISTICS - OR and IN/ANY statistics

--

支持

不支持

Incremental sort

--

支持

不支持

Incremental sort for window functions

--

支持

不支持

Query pipelining

--

支持

不支持

BRIN Index(multi-minmax, bloom)

--

支持

不支持

Query parallelism

--

支持

不支持

Abbrevated keys for sorting

--

支持

不支持

Hash Index WAL support

--

支持

不支持

postgres_fdw aggregation pushdown

--

支持

不支持

No need to rewrite the whole table when adding a column

--

支持

不支持

Runtime Filter for Join

--

支持

不支持

Index Scan for the AppendOnly table

--

支持

即将支持

1.3安全相关特性

特性名

说明

Cloudberrydb

GPDB7 beta3

Transparent Data Encryption (TDE)

--

支持

不支持

Trusted extensions

--

支持

不支持

SCRAM-SHA-256

--

支持

不支持

Encrypted TCP/IP connection when GSSAPI

--

支持

不支持

Row-level security policy

--

支持

不支持

2、CloudberryDB向量化

2020年PostgreSQL中国技术大会上,Cloudberry提到进行了向量化技术探索。采用Apache Arrow作为其列存,基于此进行向量化引擎改造。

采用Arrow实现向量化执行的优势:零拷贝的列式计算引擎;适合向量执行的数据内存格式,便于SIMD指令使用;尽可能降低了列式数据做JIT的拆分和组合开销,优化器决定是否选择JIT。

当然它也是将向量化执行器做成了一个插件,尽量减少对内核的入侵。对各个算子进行了重写包括:Scan、Agg、Sort、Motion、Project。

不过这块HashData并没有开源。

3、参考

https://github.com/cloudberrydb/cloudberrydb

https://www.modb.pro/doc/100993

目录
相关文章
|
1天前
|
存储 运维 OLAP
【Meetup回顾 第1期】竟是这样的国产数据库,YashanDB技术内幕曝光
YashanDB是一款基于统一内核,支持单机/主备、共享集群、分布式等多种部署方式,覆盖OLTP/HTAP/OLAP交易和分析混合负载场景的新型数据库系统;YashanDB同时提供开发平台、运维平台和迁移平台3大工具平台以满足数据全生命周期管理。
15 2
【Meetup回顾 第1期】竟是这样的国产数据库,YashanDB技术内幕曝光
|
8天前
|
关系型数据库 分布式数据库 数据库
1月17日|阿里云云谷园区,PolarDB V2.0技术沙龙,畅聊国产数据库
为了助力国产化项目顺利推进,阿里云邀请企业开发者和数据库负责人到云谷园区,与PolarDB V2.0技术专家面对面交流。扫描海报二维码报名,我们将根据信息为您申请入园。欢迎参与,共同探讨PolarDB的最新技术和应用!
|
17天前
|
人工智能 物联网 大数据
解密时序数据库的未来:TDengine Open Day技术沙龙精彩回顾
在数字化时代,开源已成为推动技术创新和知识共享的核心力量,尤其在数据领域,开源技术的涌现不仅促进了行业的快速发展,也让更多的开发者和技术爱好者得以参与其中。随着物联网、工业互联网等技术的广泛应用,时序数据库的需求愈发强烈,开源的兴起更是为这一技术的创新与普及提供了强有力的支持。
26 3
|
28天前
|
存储 JSON NoSQL
学习 MongoDB:打开强大的数据库技术大门
MongoDB 是一个基于分布式文件存储的文档数据库,由 C++ 编写,旨在为 Web 应用提供可扩展的高性能数据存储解决方案。它与 MySQL 类似,但使用文档结构而非表结构。核心概念包括:数据库(Database)、集合(Collection)、文档(Document)和字段(Field)。MongoDB 使用 BSON 格式存储数据,支持多种数据类型,如字符串、整数、数组等,并通过二进制编码实现高效存储和传输。BSON 文档结构类似 JSON,但更紧凑,适合网络传输。
68 15
|
2月前
|
负载均衡 网络协议 数据库
选择适合自己的数据库多实例负载均衡技术
【10月更文挑战第23天】选择适合自己的数据库多实例负载均衡技术需要全面考虑多种因素。通过深入的分析和评估,结合自身的实际情况,能够做出明智的决策,为数据库系统的高效运行提供有力保障。
127 61
|
2月前
|
SQL 关系型数据库 数据库
国产数据实战之docker部署MyWebSQL数据库管理工具
【10月更文挑战第23天】国产数据实战之docker部署MyWebSQL数据库管理工具
215 4
国产数据实战之docker部署MyWebSQL数据库管理工具
|
2月前
|
SQL Java 数据库连接
在Java应用中,数据库访问常成为性能瓶颈。连接池技术通过预建立并复用数据库连接,有效减少连接开销,提升访问效率
在Java应用中,数据库访问常成为性能瓶颈。连接池技术通过预建立并复用数据库连接,有效减少连接开销,提升访问效率。本文介绍了连接池的工作原理、优势及实现方法,并提供了HikariCP的示例代码。
68 3
|
2月前
|
Java 数据库连接 数据库
深入探讨Java连接池技术如何通过复用数据库连接、减少连接建立和断开的开销,从而显著提升系统性能
在Java应用开发中,数据库操作常成为性能瓶颈。本文通过问题解答形式,深入探讨Java连接池技术如何通过复用数据库连接、减少连接建立和断开的开销,从而显著提升系统性能。文章介绍了连接池的优势、选择和使用方法,以及优化配置的技巧。
54 1
|
25天前
|
存储 Oracle 关系型数据库
数据库传奇:MySQL创世之父的两千金My、Maria
《数据库传奇:MySQL创世之父的两千金My、Maria》介绍了MySQL的发展历程及其分支MariaDB。MySQL由Michael Widenius等人于1994年创建,现归Oracle所有,广泛应用于阿里巴巴、腾讯等企业。2009年,Widenius因担心Oracle收购影响MySQL的开源性,创建了MariaDB,提供额外功能和改进。维基百科、Google等已逐步替换为MariaDB,以确保更好的性能和社区支持。掌握MariaDB作为备用方案,对未来发展至关重要。
55 3
|
25天前
|
安全 关系型数据库 MySQL
MySQL崩溃保险箱:探秘Redo/Undo日志确保数据库安全无忧!
《MySQL崩溃保险箱:探秘Redo/Undo日志确保数据库安全无忧!》介绍了MySQL中的三种关键日志:二进制日志(Binary Log)、重做日志(Redo Log)和撤销日志(Undo Log)。这些日志确保了数据库的ACID特性,即原子性、一致性、隔离性和持久性。Redo Log记录数据页的物理修改,保证事务持久性;Undo Log记录事务的逆操作,支持回滚和多版本并发控制(MVCC)。文章还详细对比了InnoDB和MyISAM存储引擎在事务支持、锁定机制、并发性等方面的差异,强调了InnoDB在高并发和事务处理中的优势。通过这些机制,MySQL能够在事务执行、崩溃和恢复过程中保持
61 3