【开源推荐】专门用作分析的一款高性能数据库

简介: 【7月更文挑战4天】

19.8k star,开源、免费、轻量、小巧、足够用的一款软件

专门用作分析的一款高性能数据库,体积很小,功能强大,值得关注下

duckdb简介

DuckDB是一个开源的内嵌式SQL OLAP数据库管理系统,它以其高性能、易用性和丰富的功能而闻名。

DuckDB支持任意和嵌套的相关子查询,窗口函数,排序规则,复杂类型(数组,结构,映射),以及一些旨在使SQL更容易使用的扩展。

DuckDB作为一个独立的CLI应用程序提供,并具有Python,R,Java,Wasm等客户端,与pandas和dupiter等软件包进行深度集成。

DuckDB是设计用于分析工作负载的数据库,它可以作为单一二进制文件运行,或者完全嵌入到宿主应用程序中。DuckDB的目标是提供一个简单、可移植且功能丰富的数据管理系统,它可以在各种操作系统和硬件架构上运行,包括Linux、macOS、Windows以及ARM和x86。

duckdb特点

  • 简单性:DuckDB易于安装和部署,无需外部依赖,支持在其宿主应用程序中以进程方式运行。
  • 可移植性:DuckDB支持多种操作系统和硬件架构,甚至可以在Web浏览器和移动电话上运行。
  • 丰富的SQL方言:DuckDB提供了丰富的SQL方言,支持复杂查询、窗口函数、事务保证(ACID属性)以及多版本并发控制(MVCC),它可以从本地文件系统和远程端点(如S3 bucket)读取和写入文件格式(如CSV、Parquet和JSON)。。
  • 高性能:DuckDB的列式引擎支持并行执行,可以处理超出内存大小的工作负载。
  • 扩展性:DuckDB允许通过扩展机制定义新的数据类型、函数、文件格式和SQL语法。
  • 开源:DuckDB及其核心扩展是在宽松的MIT许可下开源的。

duckdb快速部署及使用

要开始使用DuckDB,用户可以访问DuckDB的官方文档网站并下载适用于其操作系统的二进制文件。例如,macOS用户可以使用Homebrew包管理器来安装DuckDB,以便在PATH中直接可用,从而简化升级和安装过程。

安装示例(macOS):

$ brew install duckdb

windows

winget install DuckDB.cli

linux

https://github.com/duckdb/duckdb/releases/download/v1.0.0/duckdb_cli-linux-amd64.zip

启动DuckDB:

$ duckdb

创建和查询表:

CREATE TABLE ducks AS SELECT 3 AS age, 'mandarin' AS breed;
SELECT * FROM ducks;

这些命令将创建一个名为“ducks”的表,并插入一条记录。DuckDB默认是一个内存中的过程,不会持久化任何数据。如果需要持久化数据,用户可以指定文件名来创建或打开数据库¹。

数据持久化示例:

$ duckdb my_database.duckdb

DuckDB是一个强大的工具,适用于需要高性能数据分析的开发者和数据科学家。

传送门:http://www.duckdb.org/

开源地址:https://github.com/duckdb/duckdb

相关文章
|
24天前
|
关系型数据库 MySQL 数据库
MyEMS开源系统安装之数据库
本文详细讲解MyEMS的安装步骤,重点介绍数据库架构与脚本部署。MyEMS支持MySQL 8.0、MariaDB 10.5及SingleStore 7.0等数据库服务器。通过命令行或客户端工具执行SQL脚本完成安装,包括多个数据库(如myems_billing_db、myems_energy_db等)。此外,提供解决常见问题的方法,如“用户拒绝访问”、“COLLATE设置”和“MAX_ALLOWED_PACKET错误”。注意,不建议在生产环境中将数据库安装于Docker容器内。
45 1
|
2月前
|
人工智能 运维 关系型数据库
|
2月前
|
SQL 人工智能 数据可视化
16.1k star! 只需要DDL就能一键生成数据库关系图!开源神器ChartDB让你的数据结构"看得见"
ChartDB是一款开源的数据库可视化神器,通过一句智能查询就能自动生成专业的数据库关系图。无需安装客户端、不用暴露数据库密码,打开网页就能完成从数据建模到迁移的全流程操作,堪称开发者的"数据库透视镜"。
361 67
|
16天前
|
存储 关系型数据库 数据库
高性能云盘:一文解析RDS数据库存储架构升级
性能、成本、弹性,是客户实际使用数据库过程中关注的三个重要方面。RDS业界率先推出的高性能云盘(原通用云盘),是PaaS层和IaaS层的深度融合的技术最佳实践,通过使用不同的存储介质,为客户提供同时满足低成本、低延迟、高持久性的体验。
|
29天前
|
存储 Cloud Native 关系型数据库
PolarDB开源:云原生数据库的架构革命
本文围绕开源核心价值、社区运营实践和技术演进路线展开。首先解读存算分离架构的三大突破,包括基于RDMA的分布式存储、计算节点扩展及存储池扩容机制,并强调与MySQL的高兼容性。其次分享阿里巴巴开源治理模式,涵盖技术决策、版本发布和贡献者成长体系,同时展示企业应用案例。最后展望技术路线图,如3.0版本的多写多读架构、智能调优引擎等特性,以及开发者生态建设举措,推荐使用PolarDB-Operator实现高效部署。
135 1
|
1月前
|
SQL 关系型数据库 分布式数据库
PolarDB开源数据库入门教程
PolarDB是阿里云推出的云原生数据库,基于PostgreSQL、MySQL和Oracle引擎构建,具备高性能、高扩展性和高可用性。其开源版采用计算与存储分离架构,支持快速弹性扩展和100%兼容PostgreSQL/MySQL。本文介绍了PolarDB的安装方法(Docker部署或源码编译)、基本使用(连接数据库、创建表等)及高级特性(计算节点扩展、存储自动扩容、并行查询等)。同时提供了性能优化建议和监控维护方法,帮助用户在生产环境中高效使用PolarDB。
453 18
|
1月前
|
Cloud Native 关系型数据库 分布式数据库
PolarDB开源:云原生数据库的新篇章
阿里云自研的云原生数据库PolarDB于2023年5月正式开源,采用“存储计算分离”架构,具备高性能、高可用及全面兼容性。其开源版本提供企业级数据库解决方案,支持MySQL、PostgreSQL和Oracle语法,适用于高并发OLTP、核心业务系统等场景。PolarDB通过开放治理与开发者工具构建完整生态,并展望更丰富的插件功能与AI集成,为中国云原生数据库技术发展贡献重要力量。
253 18
|
3月前
|
Rust 物联网 数据处理
Rust +时序数据库 TDengine:打造高性能时序数据处理利器
TDengine 是一款专为物联网、车联网、工业互联网等时序数据场景优化设计的开源时序数据库,支持高并发写入、高效查询及流式计算,通过“一个数据采集点一张表”与“超级表”的概念显著提升性能。 Rust 作为一门系统级编程语言,近年来在数据库、嵌入式系统、分布式服务等领域迅速崛起,以其内存安全、高性能著称,与 TDengine 的高效特性天然契合,适合构建高可靠、高性能的数据处理系统。
133 2
|
4月前
|
关系型数据库 分布式数据库 数据库
喜报|PolarDB开源社区荣获“2024数据库国内活跃开源项目”奖
喜报|PolarDB开源社区荣获“2024数据库国内活跃开源项目”奖
|
3月前
|
存储 监控 数据挖掘
消防行业如何借助时序数据库 TDengine 打造高效的数据监控与分析系统
本篇文章来自“2024,我想和 TDengine 谈谈”征文活动的优秀投稿,深入探讨了如何在消防行业中运用 TDengine 进行业务建模。文章重点介绍了如何通过 TDengine 的超级表、标签设计和高效查询功能,有效管理消防监控系统中的时序数据。作者详细阐述了实时监控、报警系统以及历史数据分析在消防行业中的应用,展示了 TDengine 在数据压缩、保留策略和分布式架构下的强大优势。
87 0

热门文章

最新文章