国产数据库-技术特性-CloudberryDB

简介: Cloudberrydb基于gpdb,支持PG14内核,有很多GP目前不支持的优秀特性

GreenPlum(GPDB)是一款基于PostgreSQL(PgSQL)的开源分布式数据库。目前GPDB7已发布beta4,PgSQL内核支持到了12.12,但PgSQL优秀内核特性比如并行查询仍旧不支持。经查询PgSQL中并行代码已存在于GPDB中,但执行计划生成这块却不支持。这就比较可惜了。现在有款国产分布式数据库CloudberryDB基于GPDB,继承了GPDB优秀特性,并兼容PgSQL14.4的内核,支持了很多GPDB不具备的特性。

1、CloudberryDB vs. GPDB7

1.1通用特性

特性名

说明

Cloudberrydb

GPDB7 beta3

Explain (WAL) support

在执行计划中显示SQL语句生成的WAL大小,PgSQL13中增加的特性

支持

不支持

Multiranges

PgSQL14引入支持

支持

不支持

B-tree bottom-up index deletion

PgSQL14引入支持

支持

不支持

Covering indexes for GiST (INCLUDE)

PgSQL12引入支持

支持

即将支持

The range_agg range type aggregation function

PgSQL14引入支持

支持

不支持

CREATE ACCESS METHOD

PgSQL12引入支持

支持

即将支持

LZ4 compression for TOAST tables

PgSQL14引入支持

支持

不支持

JSONB subscripting

PgSQL14引入支持

支持

不支持

Configure the maximum WAL retention for replication slots

PgSQL13引入支持

支持

不支持

Verify backup integrity (pg_verifybackup)

PgSQL13引入支持

支持

不支持

Client can require SCRAM channel binding

PgSQL13引入支持

支持

不支持

Vacuum "emergency mode"

PgSQL14引入支持

支持

不支持

Certificate authentication with postgres_fdw

PgSQL13引入支持

支持

不支持

UPSERT

--

支持

即将支持

COPY FROM Where

PgSQL12引入支持

支持

不支持

VACUUM / ANALYZE Skip Lock Table

PgSQL12引入支持

支持

不支持

HASH partitioned table

PgSQL11引入支持

支持

不支持

CTE(SEARCH and CYCLE)

PgSQL14引入支持

支持

不支持

Procedure OUT parameters

PgSQL14引入支持

支持

不支持

CHECK constraints for foreign tables

--

支持

不支持

Timeout parameter for pg_terminate_backend

PgSQL14引入支持

支持

不支持

Auto failover for Master

应该是自己开发的

支持

不支持

Kubernetes deployment support

应该是自己开发的

支持

不支持

1.2性能相关特性

特性名

说明

Cloudberrydb

GPDB7 beta3

REINDEX CONCURRENTLY

--

支持

不支持

Aggregation pushdown

--

支持

不支持

CREATE STATISTICS - OR and IN/ANY statistics

--

支持

不支持

Incremental sort

--

支持

不支持

Incremental sort for window functions

--

支持

不支持

Query pipelining

--

支持

不支持

BRIN Index(multi-minmax, bloom)

--

支持

不支持

Query parallelism

--

支持

不支持

Abbrevated keys for sorting

--

支持

不支持

Hash Index WAL support

--

支持

不支持

postgres_fdw aggregation pushdown

--

支持

不支持

No need to rewrite the whole table when adding a column

--

支持

不支持

Runtime Filter for Join

--

支持

不支持

Index Scan for the AppendOnly table

--

支持

即将支持

1.3安全相关特性

特性名

说明

Cloudberrydb

GPDB7 beta3

Transparent Data Encryption (TDE)

--

支持

不支持

Trusted extensions

--

支持

不支持

SCRAM-SHA-256

--

支持

不支持

Encrypted TCP/IP connection when GSSAPI

--

支持

不支持

Row-level security policy

--

支持

不支持

2、CloudberryDB向量化

2020年PostgreSQL中国技术大会上,Cloudberry提到进行了向量化技术探索。采用Apache Arrow作为其列存,基于此进行向量化引擎改造。

采用Arrow实现向量化执行的优势:零拷贝的列式计算引擎;适合向量执行的数据内存格式,便于SIMD指令使用;尽可能降低了列式数据做JIT的拆分和组合开销,优化器决定是否选择JIT。

当然它也是将向量化执行器做成了一个插件,尽量减少对内核的入侵。对各个算子进行了重写包括:Scan、Agg、Sort、Motion、Project。

不过这块HashData并没有开源。

3、参考

https://github.com/cloudberrydb/cloudberrydb

https://www.modb.pro/doc/100993

目录
相关文章
|
1天前
|
机器学习/深度学习 存储 人工智能
新一代数据库技术:融合人工智能与分布式系统的未来前景
传统数据库技术在应对大规模数据处理和智能化需求方面逐渐显露出瓶颈。本文探讨了新一代数据库技术的发展趋势,重点关注了人工智能与分布式系统的融合,以及其在未来数据管理和分析中的潜在优势。通过深度学习和自动化技术,新型数据库系统能够实现更高效的数据处理和智能化决策,为企业带来更灵活、可靠的数据解决方案。
|
1天前
|
存储 人工智能 NoSQL
现代数据库技术演进与应用前景分析
本文探讨了现代数据库技术的演进历程及其在各领域的应用前景。首先介绍了传统数据库的局限性,随后分析了NoSQL、NewSQL以及分布式数据库等新兴技术的特点和优势。接着探讨了人工智能、物联网、大数据等领域对数据库技术提出的新要求,并展望了未来数据库技术的发展趋势与应用前景。
|
1天前
|
Cloud Native OLAP OLTP
云原生一体化数据库技术是一个具有潜力的领域
【5月更文挑战第13天】在业务处理分析一体化趋势下,开发者需权衡OLTP和OLAP数据库的选型。一体化数据库如阿里云瑶池通过Zero-ETL实现数据自动搬迁,简化流程,支持高并发事务和复杂分析。但也带来定制化开发、性能优化及管理维护的挑战。随着集中式与分布式数据库边界模糊,开发者需更深入理解各种架构特点,灵活选择以适应业务需求。云原生一体化数据库在处理大规模数据和高并发场景中展现优势,但选择时需综合考虑技术成熟度、成本和维护因素。总的来说,一体化数据库技术是未来发展的重要方向,但也需要谨慎评估和决策。
22 3
|
1天前
|
存储 机器学习/深度学习 人工智能
新一代数据库技术:融合AI的智能数据管理系统
传统数据库管理系统在数据存储和查询方面已经取得了巨大的成就,但随着数据量的不断增长和应用场景的多样化,传统数据库已经难以满足日益增长的需求。本文将介绍一种新一代数据库技术,即融合了人工智能技术的智能数据管理系统。通过结合AI的强大能力,这种系统能够实现更高效的数据管理、更智能的数据分析和更精准的数据预测,为用户带来全新的数据管理体验。
|
1天前
|
SQL 关系型数据库 MySQL
国产达梦数据库使用记录
国产达梦数据库使用记录
|
1天前
|
存储 NoSQL 搜索推荐
探索新一代数据库技术:基于图数据库的应用与优势
传统关系型数据库在处理复杂的关系数据时存在着诸多限制,而基于图数据库的新一代数据库技术则提供了更为灵活和高效的解决方案。本文将深入探讨图数据库的核心概念、应用场景以及与传统数据库相比的优势,带领读者一窥未来数据库技术的发展趋势。
|
1天前
|
存储 缓存 算法
ICDE2024 |VDTuner:向量数据库自动调优技术
在CodeFuse接入实际业务的过程中,大模型的推理成本以及生成内容的准确性是产品规模落地的两个核心考量因素。为了降低推理成本,我们研发了CodeFuse-ModelCache语义缓存加速功能,通过引入Cache机制,缓存已经计算的结果,当接收到类似请求后直接提取缓存结果返回给用户。另一方面,为了提升代码生成的准确度,我们引入了few shot机制,在输入大模型之前拼接一些类似的代码片段,帮助大模型更好的理解希望生成的目标代码。上述两个核心功能的实现都依赖于向量数据库(Vector Data Management Systems, VDMS)存储并检索相似的请求或者代码片段。
17 0
|
1天前
|
存储 关系型数据库 分布式数据库
数据库索引回表困难?揭秘PolarDB存储引擎优化技术
PolarDB分布式版存储引擎采用CSM方案均衡资源开销与可用性。
数据库索引回表困难?揭秘PolarDB存储引擎优化技术
|
1天前
|
存储 机器学习/深度学习 人工智能
RAG:AI大模型联合向量数据库和 Llama-index,助力检索增强生成技术
RAG:AI大模型联合向量数据库和 Llama-index,助力检索增强生成技术
RAG:AI大模型联合向量数据库和 Llama-index,助力检索增强生成技术
|
1天前
|
Cloud Native NoSQL 数据管理
现代化数据管理:面向未来的数据库技术发展
传统数据库技术已经不能满足当今大数据时代的需求,现代化数据库技术的发展成为了当务之急。本文将探讨面向未来的数据库技术发展方向,包括云原生数据库、图数据库、区块链技术在数据库领域的应用以及数据库安全性等方面。