备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

根据实时数据处理架构和数据仓库分层的设计，面向零售业务的实时数仓可以分为以下哪几个流程？

根据实时数据处理架构和数据仓库分层的设计，面向零售业务的实时数仓可以分为以下哪几个流程？

展开

收起

游客lmkkns5ck6auu 2022-08-31 11:14:24 813 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

游客c3gxxcx6cqeyo

首先是构建 ODS 层数据，实时采集客户信息表、业务流水表、渠道表等相关基础表的 CDC 日志。每个业务库的数据表对应接入到一个 Kafka 的 topic 中建立实时数仓的 ODS 层； • 其次是 DWD 层的数据建模，创建 Flink 任务消费 ODS 层的 Kafka 消息，进行数据清洗，过滤、脱敏、关联转换等处理。同时以客户账户粒度进行数据合流，借助离线维表进行扩围操作，以获得账户粒度的明细表，实现 DWD 层的建立； • 之后是 DWS 层的数据建模，基于 DWD 层的数据进行汇总，通过分析业务需求，将 DWD 层的数据按照主题进行划分，汇总出渠道服务主题宽表、业务部运营主题宽表、交易产品主题宽表等公共指标宽表，建立 DWS 层； • 最后根据实际业务需求，计算业务指标建立 ADS 层。对于一部分用户账户粒度的业务指标，可通过 DWD 层的明细直接计算得到，部分粗粒度的业务指标比如 APP 渠道服务客户人数、投顾产品阅读人数等，可以通过 DWS 层计算获得。最终计算结果接入到数据网关将数据统一提供给下游系统或通过 BI 系统展示。

以上内容摘自《Apache Flink 案例集（2022版）》电子书，点击https://developer.aliyun.com/ebook/download/7718 可下载完整版

2022-08-31 13:18:08

赞同展开评论

问答分类：

数据处理实时计算 Flink版实时数仓 Hologres

问答标签：

数据仓库云原生数据仓库AnalyticDB MySQL版数据仓库分层架构流程架构云原生数据仓库AnalyticDB MySQL版架构分层

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

云原生数据仓库AnalyticDB PostgreSQL版现在想做个冷热分层，不知道支持不？

132

2

0

在数仓架构中，我们通常将数据分为哪几个层次进行管理？

147

2

0

快手实时数仓保障体系架构的正向保障思路是什么？

95

1

0

小米APP近实时数仓的架构中，日志数据是如何处理的？

109

1

0

最早的数仓架构是基于什么设计的？它有哪些优点和局限性？

72

1

0

为什么业务通常需要维护两套数仓架构，甚至需要不同的技术团队？

64

1

0

Serverless 架构在离线数据处理方面相比传统方式有何优势？

61

1

0

在实时文件/数据处理方面，Serverless 架构如何满足高并发和实时性需求？

92

1

0

信令数据处理中遇到的性能问题和架构设计问题分别是什么？

63

1

0

实时数仓如何解决了Lambda架构的问题？

91

0

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199214

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

相关文章

Ray Forward 2025 定档 12 月 20 日北京！议题征集通道已开放

深度盘点：2025年能源管理平台厂商排行榜与深度价值评析

Python数据提取与复用神器：itemgetter从入门到实战

告别重复劳动：使用n8n核心触发器（Cron, Webhook, 手动）开启自动化之旅

摆脱重复劳动：利用n8n核心触发器（Cron、Webhook、手动）开启自动化新篇章

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

debezium 可以正常读取做到数据同步，但是无法持久化表结构元数据

Flink sql将数组炸开，实现hive的explode函数的效果，还有什么其他好的方式？

Flink-CDC 文档网站地址是什么？

在Flink中Job Manager CPU设置为1，Memory设置为8G，它是算1CU还是什么？

Flink1.17为什么需要JDK 11呢？JDK8我试了也能运行

FlinkCDC MySQL 中 scan.startup.mode 用的是什么模式啊？

Flink CDC里用jdbc往达梦dm8推数据，老是显示字符被截断是咋回事？有人碰到过嘛？

flink比如，半小时内状态一直停留在13，我的语法匹配规则是不是有什么问题？

在斗鱼，实时计算发展的历程如何？

展开全部

独家专访阿里集团副总裁贾扬清：我为什么选择加入阿里巴巴？

回顾 | Kafka x Flink Meetup 与世界人工智能大会大数据 AI 专场精彩回顾（附PPT下载）

Apache Flink 的迁移之路，2 年处理效果提升 5 倍

Flink Checkpoint 问题排查实用指南

Flink入坑指南第四章：SQL中的经典操作Group By+Agg

准实时异常检测系统

Apache Flink 零基础入门（一）：基础概念解析

仅1年GitHub Star数翻倍，Flink 做了什么？

Flink State 有可能代替数据库吗？

Flink入坑指南第五章 - 语法糖 view

展开全部

还有其他疑问?