2023 年 3 月,在阿里云瑶池数据库峰会上,阿里云与飞轮科技正式达成战略合作协议,双方旨在共同研发名为“阿里云数据库 SelectDB 版”的新一代实时数据仓库,为用户提供在阿里云上的全托管服务。
SelectDB 是飞轮科技基于 Apache Doris 内核打造的聚焦于企业大数据实时分析需求的企业级产品。因此阿里云数据库 SelectDB 版也延续了 Apache Doris 性能优异、架构精简、稳定可靠、生态丰富等核心特性,同时还融入了云服务随需而用的特性,通过云原生存算分离的创新架构,为企业带来分钟级弹性伸缩、高性价比、简单易用、安全稳定的一键式云上实时分析体验。
近日,在 ClickHouse 发起的分析型数据库性能测试排行榜 ClickBench 中,现代化实时数仓 SelectDB 在时隔两年后再次完成登顶,在全部近百款数据库和数十种机型中,性能位居总榜第一!
ClickBench 是业界最为权威的数据库分析性能评测之一,有关 ClickBench 的介绍参考过往文章:
在 ClickBench 性能排行榜中,测试数据均取自真实生产环境、涵盖数据类型多样、覆盖了即席查询和统计报表等典型场景,能真实反映各大数据库在生产环境中的性能,因此吸引了 Snowflake、Redshift、Athena、Greenplum、Druid 等国际知名数据库的参与。所评测的指标为特定机型下导入相同数据集的时间、所占用的存储空间大小以及执行 SQL 的耗时长短,分别用以衡量 数据导入性能、数据压缩比以及查询性能。所有测试结果中表现最优的一条会成为基线,相同测试项的指标会与基线数据进行对比并得出比值,通过这一比值来体现与行业最优的差距。当有新的测试结果超越原有的基线后,将自动成为新的基线。
就查询性能而言,会分别对每条 SQL 执行 Hot Run 和 Cold Run 来统计时长,即重复执行 3 次 SQL 并取其中耗时最短的一次以及启动并清理内存后直接执行,最终对所有 SQL 的执行耗时与基线的比值进行几何平均,即为最终测试结果。因此 ClickBench 更关注的是数据库在所有测试场景下都有着优异的表现,而非某一个或某几个场景,这使得数据库需要全方位的能力提升。
早在 2022 年 10 月,SelectDB 就曾以极其优异的性能表现登顶榜单,在 c6a.4xlarge, 500gb gp2 同机型的所有产品中查询性能位列第一。
而本次提交的最新测试结果中,在汇集了 ClickHouse、Snowflake、Redshift、DuckDB、Greenplum 等全部近百款数据库和数十种规格机型的总榜中,SelectDB 在未进行任何调优的情况下,以极为出色的性能表现登上 Hot Run 总榜第一!
从查询耗时的角度来看,在全部 43 条 SQL 中 SelectDB 的执行耗时均在 1s 以内,呈现出极其稳定的性能表现。无论是简单的 Count(*) 去重计数、基于 ID 的点查询、关键词检索匹配或是分组聚合排序,各类查询场景下 SelectDB 的 SQL 执行效率均位居榜单前列,已大幅超越 ClickHouse、Snowflake、BigQuery 等国际知名数据库项目。
值得关注的是,Apache Doris 同样也登上本次榜单的前列,在未经任何调优的情况下即取得了 Cold Run 总榜第三、Hot Run 总榜第六的成绩。在排除 ClickHouse 在内存和 SQL 语句调优带来的性能影响后,Apache Doris 仍取得了 Hot Run 第四、Cold Run 第二的优异成绩。
尽管性能不是数据库的全部,但是性能测试结果仍然是用户在选择数据库时重要的量化参考依据。
当我们谈到 OLAP 领域的性能测试基准时,ClickBench 无疑是单表分析场景公认的权威评测之一。然而,对于更广泛的业务场景,特别是针对 Ad-Hoc 即席查询和批量 ETL 处理场景,TPC-H 和 TPC-DS 测试基准则更具代表性。为了更准确地模拟真实业务环境中的分析负载,我们后续将进一步针对 Apache Doris 以及 SelectDB 发布多个涵盖不同分析场景的测试报告,以确保测试结果能够更全面地反映数据库系统在各种业务场景下的性能表现,为用户提供更具参考价值的测试数据。
更重要的是,为了确保测试结果的公正性和客观性,我们将保持以盲测的方式进行测试,确保任何用户都可以在不依赖专家经验调优的情况下,都能体验到极致的查询性能。