【实时数仓篇】(02)基于 Flink 的典型 ETL 场景实现2

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
简介: 【实时数仓篇】(02)基于 Flink 的典型 ETL 场景实现2


三、基于Flink实线典型场景


20200714141238198.png


3.1 维表join - 预加载维表

20200714141355140.png


image.png方案1改进:在open() 新建一个线程定时加载维表,实现维度数据的周期性更新


3.2 维表join - 预加载维表

20200714141723795.png


3.3 维表join - 热存储关联


image.png

image.png


3.4 维表join - 广播维表

image.pngimage.png



3.5 维表join - Temporal table function join


image.pngimage.pngimage.pngimage.pngimage.png 

3.6 双流join - 离线join vs. 实时join


image.png


将两个流的数据存入state中 + join 范围局部化


image.pngimage.pngimage.pngimage.png










相关实践学习
基于Hologres+PAI+计算巢,5分钟搭建企业级AI问答知识库
本场景采用阿里云人工智能平台PAI、Hologres向量计算和计算巢,搭建企业级AI问答知识库。通过本教程的操作,5分钟即可拉起大模型(PAI)、向量计算(Hologres)与WebUI资源,可直接进行对话问答。
目录
相关文章
|
1月前
|
SQL Kubernetes 调度
Flink 流批一体在模型特征场景的使用
本文整理自B站资深开发工程师张杨老师在 Flink Forward Asia 2023 中 AI 特征工程专场中的分享。
77142 4
Flink 流批一体在模型特征场景的使用
|
4月前
|
存储 消息中间件 监控
基于 Hologres+Flink 的曹操出行实时数仓建设
本文主要介绍曹操出行实时计算负责人林震,基于 Hologres+Flink 的曹操出行实时数仓建设的解决方案分享。
109423 1
基于 Hologres+Flink 的曹操出行实时数仓建设
|
4天前
|
SQL 运维 Cloud Native
基于OceanBase+Flink CDC,云粒智慧实时数仓演进之路
本文讲述了其数据中台在传统数仓技术框架下做的一系列努力后,跨进 FlinkCDC 结合 OceanBase 的实时数仓演进过程。
192 2
 基于OceanBase+Flink CDC,云粒智慧实时数仓演进之路
|
1月前
|
SQL 存储 JSON
Flink+Paimon+Hologres 构建实时湖仓数据分析
本文整理自阿里云高级专家喻良,在 Flink Forward Asia 2023 主会场的分享。
|
2月前
|
SQL 分布式计算 OLAP
医疗在线OLAP场景下基于Apache Hudi 模式演变的改造与应用
医疗在线OLAP场景下基于Apache Hudi 模式演变的改造与应用
42 2
|
3月前
|
SQL 消息中间件 Kafka
flink问题之做实时数仓sql保证分topic区有序如何解决
Apache Flink是由Apache软件基金会开发的开源流处理框架,其核心是用Java和Scala编写的分布式流数据流引擎。本合集提供有关Apache Flink相关技术、使用技巧和最佳实践的资源。
715 3
|
3月前
|
存储 运维 监控
飞书深诺基于Flink+Hudi+Hologres的实时数据湖建设实践
通过对各个业务线实时需求的调研了解到,当前实时数据处理场景是各个业务线基于Java服务独自处理的。各个业务线实时能力不能复用且存在计算资源的扩展性问题,而且实时处理的时效已不能满足业务需求。鉴于当前大数据团队数据架构主要解决离线场景,无法承接更多实时业务,因此我们需要重新设计整合,从架构合理性,复用性以及开发运维成本出发,建设一套通用的大数据实时数仓链路。本次实时数仓建设将以游戏运营业务为典型场景进行方案设计,综合业务时效性、资源成本和数仓开发运维成本等考虑,我们最终决定基于Flink + Hudi + Hologres来构建阿里云云原生实时湖仓,并在此文中探讨实时数据架构的具体落地实践。
飞书深诺基于Flink+Hudi+Hologres的实时数据湖建设实践
|
3月前
|
消息中间件 SQL NoSQL
Flink数据源问题之自定义如何解决
Flink数据源是指Apache Flink用于读取外部系统数据的接口或组件;本合集将探讨Flink数据源的类型、配置方法和最佳实践,以及在使用数据源时可能遇到的错误和解决方案。
31 3
|
4月前
|
数据采集 存储 数据管理
flink实时数仓保障体系
flink实时数仓保障体系
|
4月前
|
消息中间件 存储 NoSQL
Flink几道经典编程场景
Flink几道经典编程场景