文档备案控制台

开发者社区微服务文章正文

【Druid】（二）Apache Druid 原理与架构剖析2

2022-06-13 458

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【Druid】（二）Apache Druid 原理与架构剖析2

三、架构演进

设计总图

Apache Druid 初始版本架构图 ~ 0.6.0（2012~2013）

0.7.0 ~ 0.12.0（2013~2018）

Apache Druid 旧架构图——数据流转

查询路径：红色箭头:①客户端向Broker发起请求,Broker会将请求路由到②实时节点和③历史节点

Druid数据流转:黑色箭头：数据源包括实时流和批量数据. ④实时流经过索引直接写到实时节点，⑤批量数据通过IndexService存储到DeepStorage,⑥再由历史节点加载. ⑦实时节点也可以将数据转存到DeepStorage

Apache Druid 旧架构图——集群管理

0.13.0 ~ 当前版本（2018~now）

从架构图中可以看出来 Apache Druid 集群的通讯是基于 Apache ZooKeeper 的。

四、Lambda 流式架构

通常流式数据的链路为 Raw data → Kafka → Stream processor（optional, typically for ETL) → Kafka（optional）→ Druid → Application / user，而批处理的链路为 Raw data → Kafka（optional）→ HDFS → ETL process（optional）→ Druid → Application / user

文章标签：

消息中间件

索引

druid

Kafka

Apache

存储

关键词：

架构apache

Apache架构

架构原理

原理架构

druid架构

云祁

目录

相关文章

云技术达人

|

8月前

|

存储消息中间件 Kafka

Confluent 首席架构师万字剖析 Apache Fluss（一）：核心概念

Apache Fluss是由阿里巴巴与Ververica合作开发的Flink表存储引擎，旨在提供低延迟、高效率的实时数据存储与变更日志支持。其采用TabletServer与CoordinatorServer架构，结合RocksDB和列式存储，实现主键表与日志表的统一管理，并通过客户端抽象整合湖仓历史数据，弥补Paimon在实时场景下的性能短板。

云技术达人

1027 22 23

Confluent 首席架构师万字剖析 Apache Fluss（一）：核心概念

八进智

|

8月前

|

Dubbo Java 应用服务中间件

Apache ShenYu 架构学习指南

Apache ShenYu 是一款高性能、插件化的微服务API网关，基于Spring WebFlux + Reactor 构建，支持多协议、动态配置与实时数据同步。本指南以通俗类比和实战路径，带你深入理解其架构设计、核心流程与源码实现，助力快速掌握并参与贡献。

八进智

1228 12 12

灵杰开发者

|

存储 Cloud Native 数据处理

从嵌入式状态管理到云原生架构：Apache Flink 的演进与下一代增量计算范式

本文整理自阿里云资深技术专家、Apache Flink PMC 成员梅源在 Flink Forward Asia 新加坡 2025上的分享，深入解析 Flink 状态管理系统的发展历程，从核心设计到 Flink 2.0 存算分离架构，并展望未来基于流批一体的通用增量计算方向。

灵杰开发者

621 0 0

从嵌入式状态管理到云原生架构：Apache Flink 的演进与下一代增量计算范式

云技术达人

|

8月前

|

存储消息中间件 Kafka

Confluent 首席架构师万字剖析 Apache Fluss（三）：湖流一体

原文：https://jack-vanlightly.com/blog/2025/9/2/understanding-apache-fluss 作者：Jack Vanlightly 翻译：Wayne Wang@腾讯译注：Jack Vanlightly 是一位专注于数据系统底层架构的知名技术博主，他的文章以篇幅长、细节丰富而闻名。目前 Jack 就职于 Confluent，担任首席技术架构师，因此这篇 Fluss 深度分析文章，具备一定的客观参考意义。译文拆成了三篇文章，本文是第二篇。

云技术达人

854 25 26

Confluent 首席架构师万字剖析 Apache Fluss（三）：湖流一体

云技术达人

|

8月前

|

存储消息中间件 Kafka

Confluent 首席架构师万字剖析 Apache Fluss（二）：核心架构

原文：https://jack-vanlightly.com/blog/2025/9/2/understanding-apache-fluss 作者：Jack Vanlightly 翻译：Wayne Wang@腾讯译注：Jack Vanlightly 是一位专注于数据系统底层架构的知名技术博主，他的文章以篇幅长、细节丰富而闻名。目前 Jack 就职于 Confluent，担任首席技术架构师，因此这篇 Fluss 深度分析文章，具备一定的客观参考意义。译文拆成了三篇文章，本文是第二篇。

云技术达人

861 19 19

安全风信子

|

8月前

|

机器学习/深度学习自然语言处理监控

23_Transformer架构详解：从原理到PyTorch实现

Transformer架构自2017年Google发表的论文《Attention Is All You Need》中提出以来，彻底改变了深度学习特别是自然语言处理领域的格局。在短短几年内，Transformer已成为几乎所有现代大型语言模型（LLM）的基础架构，包括BERT、GPT系列、T5等革命性模型。与传统的RNN和LSTM相比，Transformer通过自注意力机制实现了并行化训练，极大提高了模型的训练效率和性能。

安全风信子

1771 0 0

维小帮

|

11月前

|

存储监控算法

园区导航系统技术架构实现与原理解构

本文聚焦园区导航场景中室内外定位精度不足、车辆调度路径规划低效、数据孤岛难以支撑决策等技术痛点，从架构设计到技术原理，对该系统从定位到数据中台进行技术拆解。

维小帮

529 0 0

园区导航系统技术架构实现与原理解构

东阳马生架构

|

12月前

|

存储消息中间件 canal

zk基础—2.架构原理和使用场景

ZooKeeper（ZK）是一个分布式协调服务，广泛应用于分布式系统中。它提供了分布式锁、元数据管理、Master选举及分布式协调等功能，适用于如Kafka、HDFS、Canal等开源分布式系统。ZK集群采用主从架构，具有顺序一致性、高性能、高可用和高并发等特点。其核心机制包括ZAB协议（保证数据一致性）、Watcher监听回调机制（实现通知功能）、以及基于临时顺序节点的分布式锁实现。ZK适合小规模集群部署，主要用于读多写少的场景。

东阳马生架构

1173 6 6

热门文章

最新文章

运维工程师面试题总结-MySQL企业级实战及集群架构07

小红书如何实现高效推荐？解密背后的大数据计算平台架构

高德服务单元化方案和架构实践

DNS的主从架构与数据同步

如何无缝迁移 SpringCloud/Dubbo 应用到 Serverless 架构

字节跳动基础架构编排调度团队论文入选云计算领域顶会 SoCC 2023

基于数据湖格式构建数据湖仓架构 ——毕岩阿里巴巴技术专家

如何带领团队“攻城略地”？优秀的架构师这样做 | 开发者必读（012期）

2009年下半年11月份系统架构设计师上午试题以及参考答案之五

最基础的图片服务或文件服务架构

基于阿里云数据库 SelectDB 内核 Apache Doris 的实时/离线一体化架构，赋能中国联通 5G 全连接工厂解决方案

活动预告｜6月13日Apache Flink Meetup·香港站

众安保险 CDP 平台：借助阿里云数据库 SelectDB 版内核 Apache Doris 打破数据孤岛，人群圈选提速4倍

云计算新宠：探索Apache Doris的云原生策略

HBase Shell-org.apache.hadoop.hbase.ipc.ServerNotRunningYetException: Server is not running yet 已解决

org.apache.hadoop.security.AccessControlException Permission denied: user=anonymous, access=WRITE...

org.apache.ibatis.binding.BindingException: Invalid bound statement (not found): com.example.forum.d

AutoMQ 生态集成 Apache Doris

Apache Flink CDC 3.1.0 发布公告

实时计算 Flink版操作报错之遇到错误org.apache.flink.table.api.ValidationException: Could not find any factory for identifier 'jdbc'，该如何解决

相关课程

更多

Apache Flink 入门到实战 - Flink开源社区出品

MySQL企业常见架构与调优经验分享

企业Web常用架构LAMP-LNMP实战

企业级互联网分布式系统应用架构学习

高校精品课-上海交通大学 -企业级应用体系架构

Apache Flink 入门

相关电子书

更多

Apache Flink技术进阶

Apache Spark: Cloud and On-Prem

Hybrid Cloud and Apache Spark

推荐镜像

更多

apache

下一篇

阿里云正式发布 Agentic 代码安全：AI驱动的双Agent协同引擎