Flink现在比较火的数仓的构建方法论有哪些啊？

展开

收起

真的很搞笑 2023-10-22 22:16:03 118 版权

3 条回答

写回答

取消提交回答

wljslmz

公众号：网络技术联盟站，InfoQ签约作者，阿里云社区签约作者，华为云云享专家，BOSS直聘创作王者，腾讯课堂创作领航员，博客+论坛：https://www.wljslmz.cn，工程师导航：https://www.wljslmz.com

目前，基于Flink的实时数仓构建方法论有几种主要的方法。一种是使用Flink SQL来构建实时数仓，这种方法在追求高吞吐低延迟的同时，也满足了对计算过程中间状态管理、灵活时间窗口支持以及exactly once语义保障的需求。另一种方法是结合Flink和StarRocks来构建实时数仓，这种方法在实际的客户案例中得到了应用，例如汽车之家在智能推荐的效果分析、物料点击、曝光、计算点击率、流量宽表等场景中，对实时分析的需求日益强烈。

此外，还有一种基于Streaming Warehouse理念的方法，实现数仓分层之间实时数据的高效流动，可以解决实时数仓分层问题。从方法论来讲，实时和离线是非常相似的，离线数仓早期的时候也是具体问题具体分析，当数据规模涨到一定量的时候才会考虑如何治理。分层是一种非常有效的数据治理方式，所以在实时数仓如何进行管理的问题上，首先考虑的也是分层的处理逻辑。

这些方法各有优势，选择哪种方法取决于具体的业务需求和数据情况。在实际的项目中，可能需要结合多种方法来构建实时数仓。

2023-10-23 15:26:34

赞同展开评论
小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
Flink现在比较火的数仓构建方法论包括：
1. 实时数仓：实时数仓是一种能够实时处理实时数据的数据仓库，它可以提供实时的数据分析和决策支持。实时数仓的构建通常包括数据采集、数据处理、数据存储和数据分析四个步骤。
2. 分布式数仓：分布式数仓是一种能够存储和处理大规模数据的数据仓库，它可以提供高效的数据分析和决策支持。分布式数仓的构建通常包括数据采集、数据处理、数据存储和数据分析四个步骤。
3. 流式数仓：流式数仓是一种能够处理流式数据的数据仓库，它可以提供实时的数据分析和决策支持。流式数仓的构建通常包括数据采集、数据处理、数据存储和数据分析四个步骤。
4. 增量数仓：增量数仓是一种能够处理增量数据的数据仓库，它可以提供高效的数据分析和决策支持。增量数仓的构建通常包括数据采集、数据处理、数据存储和数据分析四个步骤。
5. 聚合数仓：聚合数仓是一种能够处理聚合数据的数据仓库，它可以提供高效的数据分析和决策支持。聚合数仓的构建通常包括数据采集、数据处理、数据存储和数据分析四个步骤。
  。
2023-10-23 13:35:26

赞同展开评论
sunrr
Flink在构建实时数仓方面有以下几种比较火的方法论：
1. 基于Flink SQL构建实时数仓：这种方法利用了Flink SQL的能力，可以实现高吞吐低延迟的实时任务，同时支持exactly once语义保障。
2. 基于Flink+Hologres搭建实时数仓：这种方法利用了Flink和Hologres的能力，可以实现数仓分层之间实时数据的高效流动，解决实时数仓分层问题。
3. 基于Flink构建流批一体的实时数仓：这种方法利用了Flink的一系技术特性，可以实现流批一体的应用，越来越受到用户的欢迎。
4. 基于Flink构建全场景实时数仓：这种方法从方法论上讲，实时和离线是非常相似的，都可以通过分层的方式进行数据治理。
Flink在构建实时数仓方面有很多先进的方法论，可以满足不同的业务需求。
2023-10-23 11:00:14

赞同展开评论

Flink现在比较火的数仓的构建方法论有哪些啊？

实时计算 Flink

相关文章

热门讨论

热门文章