Databend 的安装配置和使用

简介: Databend 的安装配置和使用

介绍

Databend 是一个内置在 Rust 中的开源、弹性和工作负载感知的云数据仓库,为 Snowflake 提供了具有成本效益的替代方案,专门对最大的数据集进行复杂分析而设计。

性能

  • 在存储对象上,能快速进行数据分析。
  • 没有索引和分区,但也能快速查询。
  • 利用数据级并行和指令级并行技术实现最佳性能。

数据操作

  • 支持原子操作,如SELECTINSERTDELETEUPDATEREPLACECOPYMERGE
  • 提供高级功能,如时间旅行和多目录(Apache Hive / Apache Iceberg)。
  • 支持以 CSV、JSON 和 Parquet 等各种格式。
  • 支持半结构化数据类型,如 ARRAY、MAP 和 JSON 。
  • 支持类似 Git 的 MVCC 存储,以便于查询、克隆和恢复历史数据。

对象存储

  • Amazon S3
  • Azure Blob Storage
  • Google Cloud Storage
  • MinIO
  • Ceph
  • Wasabi
  • SeaweedFS
  • Cloudflare R2
  • Tencent COS
  • Alibaba OSS
  • QingCloud QingStor

Databend 的高级架构由meta-service layerquery layerstorage layer组成。

meta-service layer(元服务层)有效地支持多个租户,该层在系统中发挥着至关重要的作用:

  • 元数据管理:处理数据库、表、集群、事务等的元数据。
  • 安全性:管理安全环境的用户身份验证和授权。

query layer(查询层)处理查询计算,由多个集群组成,每个集群包含多个节点。每个节点是查询层中的核心单元,由以下部分组成:

  • 规划师:使用来自的元素为SQL语句制定执行计划关系代数,结合了投影、滤波器和限位等运算符。
  • 优化器:基于规则的优化器应用预定义规则,如“谓词下推”和“未使用列的修剪”,以优化查询执行。
  • 处理器:遵循 Pull & Push 方法,根据规划师指令构建查询执行管道。处理器相互连接,形成一个可以分布在节点之间的管道,以提高性能。

storage layer采用开源柱状格式 Parquet ,并引入了自己的表格格式,以提高查询性能。主要功能包括:

  • 二级索引:加快各种分析维度的数据位置和访问速度。
  • 复杂数据类型索引:旨在加快半结构化数据等复杂类型的数据处理和分析。
  • :Databend 有效地将数据组织成段,提高数据管理和检索效率。
  • 集群:在段内使用用户定义的集群密钥来简化数据扫描。

安装和配置

Databend 官网:https://databend.rs/doc/integrations/access-tool/mysql

Databend 下载:https://databend.rs/download

本地部署,使用 JDBC 驱动程序连接 Databend 步骤如下:

  1. 根据官网下载地址,选择与自己电脑版本对应的,下载解压后可以看到以下系列文件。

  2. 将文件 databend-query.toml 中的以下部分注释取消。

  3. 在文件夹脚本中运行脚本**start.sh,打开进入该文件目录中终端执行 ./scripts/start.sh
  1. 在DBeaver中,选择数据库>驱动程序管理器以打开驱动程序管理器,然后单击新建以创建新驱动程序。

根据上图片,添加设置相关信息如下图:

  1. 在“”选项卡上,单击“添加工件”,然后将以下内容复制并粘贴到“**依赖项声明”**文本框中,点击确定即可。
<dependency>
    <groupId>com.databend</groupId>
    <artifactId>databend-jdbc</artifactId>
    <version>0.0.8</version>
</dependency>

  1. 使用前面添加的驱动,连接本地的 Databend 。

相关扩展

Databend支持的工具、平台和编程语言如下:

可以查看对应的工具和编程语言,了解更多用法。

参考资料

目录
打赏
0
1
1
0
38
分享
相关文章
DataX入门指南:快速部署和安装指南
DataX入门指南:快速部署和安装指南
2068 2
DataX入门指南:快速部署和安装指南
OCRmypdf安装部署深入详解
1、OCRmypdf简介 OCRmyPDF使用最好的可用开源OCR引擎Tesseract执行OCR。 OCRmyPDF是一个Python 3包,将OCR图层处理结果添加到PDF。 OCRmyPDF是功能最丰富且经过彻底测试的OCR PDF转换工具。 2、OCRmypdf支持的系统 1) macOS 2) Ubuntu 16.04 LTS 3)ArchLinux 4)Windows 此外,OCRmypdf提供了docker镜像,可以直接下载镜像、使用。
1066 0
Linux阿里云/腾讯云/百度云服务器安装部署ElasticSearch
Linux阿里云/腾讯云/百度云服务器安装部署ElasticSearch
314 0
pgAgent安装部署
pgAgent是PostgreSQL的一个job引擎,可以执行数据库job任务。本文简述其安装步骤 一 安装cmake #检查是否安装 [root@bogon ~]# cmake --version cmake version 2.
2641 0
阿里云学生服务器初体验与基本网站搭建
一.自我介绍 二.PHP环境搭建 1.进入ECS控制台,连接服务器 2.下载安装PHP 3.下载安装扩展包 4.启动PHP 5.设置开机自启 6.重启PHP 三.apache的安装 1.下载安装apache 2.启动apache 3.检查apache状态 四.网页上传 1.使用xftp连接数据库 2.上传自己的网页 五.总结
阿里云学生服务器初体验与基本网站搭建
MySQL数据库免安装版配置教程及常见问题
MySQL 是一款安全、跨平台、高效的,并与 PHP、Java 等主流编程语言紧密结合的数据库系统。 以下教程以windows10 64位计算机为例(其他windows系统类似)
MySQL数据库免安装版配置教程及常见问题
超详细适合小白!SSL证书免安装免部署的方法
SSL证书有效期现在只有1年,每年到期都需要自己去重新申请新证书,更换旧证书。虽然有的网站上显示可以买2年/3年,实际试了一下,发现证书还需需要自己部署到服务器上,对于技术小白来说,还是挺难的。最近研究了一下,我发现了一个SSL证书免部署的方法,用自己账号试了一遍,完全可用,这样SSL证书不再需要每年重新申请和配置。
805 0