Apache Doris 登顶 RTABench —— 实时分析领域的性能王者

本文涉及的产品
PolarSearch,搜索节点 4核8GB
RDS Agent(兼容OpenClaw),2核4GB
RDS AI 助手,专业版
简介: Apache Doris 在最新 RTABench 实时分析榜单中登顶,性能达 ClickHouse 的6倍、PostgreSQL 的30倍、MongoDB 的100倍。依托 MPP 架构、列式存储、Pipeline 引擎与智能优化器,Doris 在多表关联、实时查询等场景表现卓越,成为实时分析新标杆。

近日,实时分析领域知名 Benchmark —— RTABench(Real-Time Analytics Benchmark) 最新榜单公布,Apache Doris 以绝对领先的成绩登顶,结果表明,Apache Doris 在实时分析场景下性能是 ClickHouse 的 6 倍,PostgresSQL 的 30 倍,MongoDB 的 100 倍

Real-Time Analytics Benchmark.png

什么是 RTABench?

RTABench 是一套专为实时分析(Real-Time Analytics)场景设计的开源数据库性能基准测试工具(Benchmark)。它基于 Clickbench 框架开发,通过引入更贴合真实业务的数据模型与查询集,有效弥补了传统基准测试工具在 “实时性测试” 维度的不足,为实时分析类数据库的性能评估提供了更具参考价值的标准。

01 归一化多表数据库模型

不同于传统基准工具的 “单表设计”,RTABench 模拟电子商务场景中的订单追踪系统,构建了更贴近实际应用的多表关联结构,具体包含 5 张核心表:

  • customers(用户表)
  • products(商品表)
  • orders(订单主表)
  • order_items(订单明细表)
  • order_events(订单状态事件表)

这种结构能更真实地复现业务系统中 “跨表关联查询” 的高频场景,避免单表设计对实时数据库性能评估的偏差。

02 规模适中的真实数据集

RTABench 提供的数据集兼顾 “真实性” 与 “可执行性”,具体规模如下:

  • 订单状态事件记录:约 1.71 亿条(核心高频数据)
  • 用户数:1102 位
  • 商品数:9255 件
  • 订单数:约 1001 万个

该规模既能支撑对数据库 “实时处理能力” 的有效测试,又不会因数据量过大导致测试成本过高或扩展困难。

03 查询类型与场景模拟

RTABench 提供 31 条代表性查询,全面覆盖实时分析场景中的典型查询模式,具体可分为四类:

查询类型与场景模拟.png

通过这些查询,能够清晰对比出不同数据库在“灵活性”(如原始查询适配度)与 “性能”(如预聚合响应速度)上的表现,更精准地匹配实时业务需求。

04 数据库系统分类

RTABench 针对不同类型的数据库进行分类测试,覆盖实时分析场景的主流技术选型,具体包括三大类:

  • 通用型数据库(General-Purpose):如 PostgreSQL、MySQL(用于对比实时场景下的通用数据库表现);
  • 实时分析型数据库(Real-Time Analytics):如 TimescaleDB、ClickHouse、Apache Doris(核心测试对象,聚焦实时性能评估);
  • 批处理分析型数据库(Batch Analytics):如 DuckDB(仅作为对照组,非实时场景的核心关注对象)。

Apache Doris 领跑全场,性能优势明显

01 性能对比

在最新榜单中,Apache Doris 表现惊艳:

Doris(c6a.4xlarge,500GB gp2)查询性能得分仅为 ×1.28,在此项指标上位列第一,其性能接近排名第二的 TimescaleDB 的 4 倍,ClickHouse 的 6 倍,PostgresSQL 的 30 倍,MongoDB 的 100 倍。

02 固定机型下的竞争

固定机型下的竞争.png

在 c6a.4xlarge 的同机型条件下,与部分传统数据库相比,Apache Doris 展现出数十倍的性能优势。即使与近年来在实时分析数据库领域大热的 ClickHouse 相比,Doris 同样拥有数倍的性能领先。

固定机型下的竞争-2.png

性能领先背后的秘密

Apache Doris 能够在 RTABench 中脱颖而出,并非偶然,而是源于其在执行引擎与优化器方面的持续创新与深度优化:

  1. MPP 架构与列式存储 Doris 采用大规模并行处理(MPP)架构,结合列式存储和高效压缩算法,从而确保计算任务充分分布且并行执行。在查询过程中,仅需读取相关列,极大降低了 I/O 开销,为大规模数据的实时分析提供了坚实基础。
  2. Pipeline 引擎 Doris 使用 Pipeline 将查询分解为多个子任务并行执行,充分利用多核 CPU 的能力。
    1. 通过限制查询线程数,有效解决了传统执行模式下线程膨胀的问题;
    2. 减少数据拷贝与共享,降低了系统开销;
    3. 针对排序、聚合等核心操作进行深度优化,大幅提升查询效率和整体吞吐量。
  3. 向量化执行 Doris 支持批量处理数据(向量化执行),充分利用现代 CPU 指令集,减少函数调用开销。与 Pipeline 执行引擎配合,进一步提升了复杂分析查询的响应速度。
  4. 智能优化器(CBO + RBO) Doris 的优化器融合了 RBO(基于规则)、CBO(基于代价)的多重策略,多层次优化策略确保 Doris 在各种复杂查询场景下,都能生成性能最优的执行计划。

正是凭借这些组合,Apache Doris 在 RTABench 的实时分析测试中,取得了远超 TimescaleDB、ClickHouse、MongoDB、PostgreSQL 等数据库的成绩,登顶榜首。

实时分析的新王者

在 RTABench 的测试场景下,Apache Doris 证明了自己是实时分析领域最值得信赖的数据库之一

  • 兼顾多表关联与单表点查;
  • 保持卓越的查询性能;
  • 面向大规模实时数据的处理游刃有余。

无论是初创团队还是大型企业,Apache Doris 都能帮助业务在 毫秒级洞察 中抢占先机。

推荐阅读

目录
相关文章
|
4月前
|
存储 SQL 缓存
快手:从分散存储到统一分析,Apache Doris 在万亿规模广告场景的应用
面对日增 3 亿行、万亿规模存量广告数据,快手广告数据平台如何突破性能瓶颈、实现架构统一与体验跃升? 快手引入 Apache Doris 替换 ClickHouse、Elasticsearch,从分散存储到统一分析,实现查询性能提升 20~90%,单表写入吞吐 300 万行/秒,存储效率提升 60%!
608 1
快手:从分散存储到统一分析,Apache Doris 在万亿规模广告场景的应用
|
存储 分布式计算 监控
Doris适合哪些场景
【6月更文挑战第8天】Doris适合哪些场景
1333 9
|
存储 关系型数据库 MySQL
PostgreSQL + Apache Doris:构建用于实时分析的 HTAP 架构
本文介绍如何通过 PostgreSQL + Apache Doris 构建 HTAP 架构:PostgreSQL 专注高并发事务,Doris 承担实时分析。借助 CDC 实时同步、MOW 引擎秒级更新、向量化查询与分层存储,实现事务/分析物理隔离、查询提速数倍、成本显著降低。
171 1
|
数据采集 分布式计算 监控
DataX教程(03)- 源码解读(超详细版)
DataX教程(03)- 源码解读(超详细版)
4463 0
DataX教程(03)- 源码解读(超详细版)
|
7月前
|
关系型数据库 MySQL BI
为什么实时更新场景下 Doris 查询性能是 ClickHouse 的 34 倍
企业数据分析能力从TP系统起步,随业务发展历经扩展优化,最终走向AP系统独立建设。Apache Doris凭借高并发、低延迟、实时更新与强查询性能,成为实时分析架构升级的理想选择,助力网易云音乐、快手、拉卡拉等企业实现性能倍增与成本优化。
572 12
为什么实时更新场景下 Doris 查询性能是 ClickHouse 的 34 倍
|
5月前
|
存储 人工智能 Cloud Native
上市大模型企业数据基础设施的选择:MiniMax 基于阿里云 SelectDB 版,打造全球统一AI可观测中台
MiniMax 作为上市大模型企业,基于阿里云 SelectDB 打造 AI 可观测中台,实现“一个平台,全球覆盖”。这一成功实践足以表明:SelectDB 能够很好满足 AI 时代海量数据实时处理与分析的需求,为同样需求的 AI 大模型企业提供了一个高性能、低成本的可靠技术解决方案。
492 5
上市大模型企业数据基础设施的选择:MiniMax 基于阿里云 SelectDB 版,打造全球统一AI可观测中台
|
5月前
|
存储 人工智能 固态存储
构建 AI 数据基座:思必驰基于 Apache Doris 的海量多模态数据集管理实践
面对海量多模态数据管理困境,思必驰通过构建以 Apache Doris 为核心的数据集平台,实现了数据从“散、乱、滞”到“统、明、畅”的转变。在关键场景中,存储占用下降 80%、查询 QPS 提升至 3w,不仅实现可量化的效率提升和成本优化,更系统化地提升了 AI 研发效率与模型质量。
396 0
构建 AI 数据基座:思必驰基于 Apache Doris 的海量多模态数据集管理实践
|
1月前
|
存储 人工智能 JSON
Litefuse 正式发布:Agent 可观测与效果评估, 比 Langfuse 成本低 88%
Litefuse 是一个 Agent 可观测与评估平台,兼容 Langfuse SDK 和 100 多个 AI 生态,并支持 Hermes、OpenClaw、Claude Code 等通用 Agent。存储成本比 Langfuse 降低 88%、简化部署架构、Trace 文本检索效率提升 10 倍,帮助团队以更低成本构建可靠的观测平台。
891 9
Litefuse 正式发布:Agent 可观测与效果评估, 比 Langfuse 成本低 88%
|
2月前
|
存储 人工智能 JSON
AI 成为主流负载后,数据基础设施将如何演进?|Apache Doris 2026 Roadmap
Scale Intelligence, Accelerate Insight,不仅是年度主题,也定义了 Doris 在 AI 时代的演进方向。
313 0
|
5月前
|
SQL 存储 运维
从 Greenplum 到 Doris:集群缩减 2/3、年省数百万,度小满构建超大规模数据分析平台经验
面对日益增长的业务体量与复杂多变的分析需求,选用一个高效、可靠的数据库系统,已成为支撑业务稳健发展与快速创新的关键。Apache Doris 以其出色的性能表现与高度灵活的架构,成为众多场景下的优选方案,详情阅读原文。
322 1
从 Greenplum 到 Doris:集群缩减 2/3、年省数百万,度小满构建超大规模数据分析平台经验