现代化实时数仓 SelectDB 再次登顶 ClickBench 全球数据库分析性能排行榜!

简介: 现代化实时数仓 SelectDB 在时隔两年后再次完成登顶,在全部近百款数据库和数十种机型中,性能位居总榜第一!

2023 年 3 月,在阿里云瑶池数据库峰会上,阿里云与飞轮科技正式达成战略合作协议,双方旨在共同研发名为“阿里云数据库 SelectDB 版”的新一代实时数据仓库,为用户提供在阿里云上的全托管服务。
SelectDB 是飞轮科技基于 Apache Doris 内核打造的聚焦于企业大数据实时分析需求的企业级产品。因此阿里云数据库 SelectDB 版也延续了 Apache Doris 性能优异、架构精简、稳定可靠、生态丰富等核心特性,同时还融入了云服务随需而用的特性,通过云原生存算分离的创新架构,为企业带来分钟级弹性伸缩、高性价比、简单易用、安全稳定的一键式云上实时分析体验。

近日,在 ClickHouse 发起的分析型数据库性能测试排行榜 ClickBench 中,现代化实时数仓 SelectDB 在时隔两年后再次完成登顶,在全部近百款数据库和数十种机型中,性能位居总榜第一!

分析型数据库性能测试排行榜 ClickBench .PNG

ClickBench 是业界最为权威的数据库分析性能评测之一,有关 ClickBench 的介绍参考过往文章:

在 ClickBench 性能排行榜中,测试数据均取自真实生产环境、涵盖数据类型多样、覆盖了即席查询和统计报表等典型场景,能真实反映各大数据库在生产环境中的性能,因此吸引了 Snowflake、Redshift、Athena、Greenplum、Druid 等国际知名数据库的参与。所评测的指标为特定机型下导入相同数据集的时间、所占用的存储空间大小以及执行 SQL 的耗时长短,分别用以衡量 数据导入性能、数据压缩比以及查询性能。所有测试结果中表现最优的一条会成为基线,相同测试项的指标会与基线数据进行对比并得出比值,通过这一比值来体现与行业最优的差距。当有新的测试结果超越原有的基线后,将自动成为新的基线。

就查询性能而言,会分别对每条 SQL 执行 Hot Run 和 Cold Run 来统计时长,即重复执行 3 次 SQL 并取其中耗时最短的一次以及启动并清理内存后直接执行,最终对所有 SQL 的执行耗时与基线的比值进行几何平均,即为最终测试结果。因此 ClickBench 更关注的是数据库在所有测试场景下都有着优异的表现,而非某一个或某几个场景,这使得数据库需要全方位的能力提升。

——《全球第一!新一代云数据仓库 SelectDB 登顶 ClickBench》

早在 2022 年 10 月,SelectDB 就曾以极其优异的性能表现登顶榜单,在 c6a.4xlarge, 500gb gp2 同机型的所有产品中查询性能位列第一。

而本次提交的最新测试结果中,在汇集了 ClickHouse、Snowflake、Redshift、DuckDB、Greenplum 等全部近百款数据库和数十种规格机型的总榜中,SelectDB 在未进行任何调优的情况下,以极为出色的性能表现登上 Hot Run 总榜第一!

从查询耗时的角度来看,在全部 43 条 SQL 中 SelectDB 的执行耗时均在 1s 以内,呈现出极其稳定的性能表现。无论是简单的 Count(*) 去重计数、基于 ID 的点查询、关键词检索匹配或是分组聚合排序,各类查询场景下 SelectDB 的 SQL 执行效率均位居榜单前列,已大幅超越 ClickHouse、Snowflake、BigQuery 等国际知名数据库项目。

SelectDB 的 SQL 执行效率.PNG

值得关注的是,Apache Doris 同样也登上本次榜单的前列,在未经任何调优的情况下即取得了 Cold Run 总榜第三、Hot Run 总榜第六的成绩。在排除 ClickHouse 在内存和 SQL 语句调优带来的性能影响后,Apache Doris 仍取得了 Hot Run 第四、Cold Run 第二的优异成绩。

ApacheDoris 榜单前列-1.PNG

ApacheDoris 榜单前列-2.PNG

尽管性能不是数据库的全部,但是性能测试结果仍然是用户在选择数据库时重要的量化参考依据。

当我们谈到 OLAP 领域的性能测试基准时,ClickBench 无疑是单表分析场景公认的权威评测之一。然而,对于更广泛的业务场景,特别是针对 Ad-Hoc 即席查询和批量 ETL 处理场景,TPC-H 和 TPC-DS 测试基准则更具代表性。为了更准确地模拟真实业务环境中的分析负载,我们后续将进一步针对 Apache Doris 以及 SelectDB 发布多个涵盖不同分析场景的测试报告,以确保测试结果能够更全面地反映数据库系统在各种业务场景下的性能表现,为用户提供更具参考价值的测试数据。

更重要的是,为了确保测试结果的公正性和客观性,我们将保持以盲测的方式进行测试,确保任何用户都可以在不依赖专家经验调优的情况下,都能体验到极致的查询性能。

相关实践学习
基于Hologres轻量实时的高性能OLAP分析
本教程基于GitHub Archive公开数据集,通过DataWorks将GitHub中的项⽬、行为等20多种事件类型数据实时采集至Hologres进行分析,同时使用DataV内置模板,快速搭建实时可视化数据大屏,从开发者、项⽬、编程语⾔等多个维度了解GitHub实时数据变化情况。
目录
相关文章
|
6月前
|
缓存 关系型数据库 BI
使用MYSQL Report分析数据库性能(下)
使用MYSQL Report分析数据库性能
473 158
|
6月前
|
缓存 监控 关系型数据库
使用MYSQL Report分析数据库性能(中)
使用MYSQL Report分析数据库性能
476 156
|
6月前
|
缓存 监控 关系型数据库
使用MYSQL Report分析数据库性能(上)
最终建议:当前系统是完美的读密集型负载模型,优化重点应放在减少行读取量和提高数据定位效率。通过索引优化、分区策略和内存缓存,预期可降低30%的CPU负载,同时保持100%的缓冲池命中率。建议每百万次查询后刷新统计信息以持续优化
574 161
|
11月前
|
Cloud Native 关系型数据库 分布式数据库
|
11月前
|
存储 关系型数据库 分布式数据库
|
11月前
|
存储 关系型数据库 分布式数据库
|
8月前
|
SQL 存储 机器学习/深度学习
基于 Dify + Hologres + QWen3 进行企业级大数据的处理和分析
在数字化时代,企业如何高效处理和分析海量数据成为提升竞争力的关键。本文介绍了基于 Dify 平台与 Hologres 数据仓库构建的企业级大数据处理与分析解决方案。Dify 作为开源大语言模型平台,助力快速开发生成式 AI 应用;Hologres 提供高性能实时数仓能力。两者结合,不仅提升了数据处理效率,还实现了智能化分析与灵活扩展,为企业提供精准决策支持,助力数字化转型。
1081 2
基于 Dify + Hologres + QWen3 进行企业级大数据的处理和分析
|
8月前
|
SQL DataWorks 关系型数据库
DataWorks+Hologres:打造企业级实时数仓与高效OLAP分析平台
本方案基于阿里云DataWorks与实时数仓Hologres,实现数据库RDS数据实时同步至Hologres,并通过Hologres高性能OLAP分析能力,完成一站式实时数据分析。DataWorks提供全链路数据集成与治理,Hologres支持实时写入与极速查询,二者深度融合构建离在线一体化数仓,助力企业加速数字化升级。
|
11月前
|
Cloud Native 关系型数据库 分布式数据库
登顶TPC-C|云原生数据库PolarDB技术揭秘:Limitless集群和分布式扩展篇
云原生数据库PolarDB技术揭秘:Limitless集群和分布式扩展篇

热门文章

最新文章

相关产品

  • 云原生数据仓库AnalyticDB MySQL版