文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

根据实时数据处理架构和数据仓库分层的设计，面向零售业务的实时数仓可以分为以下哪几个流程？

根据实时数据处理架构和数据仓库分层的设计，面向零售业务的实时数仓可以分为以下哪几个流程？

展开

收起

游客lmkkns5ck6auu 2022-08-31 11:14:24 949 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

游客c3gxxcx6cqeyo

首先是构建 ODS 层数据，实时采集客户信息表、业务流水表、渠道表等相关基础表的 CDC 日志。每个业务库的数据表对应接入到一个 Kafka 的 topic 中建立实时数仓的 ODS 层； • 其次是 DWD 层的数据建模，创建 Flink 任务消费 ODS 层的 Kafka 消息，进行数据清洗，过滤、脱敏、关联转换等处理。同时以客户账户粒度进行数据合流，借助离线维表进行扩围操作，以获得账户粒度的明细表，实现 DWD 层的建立； • 之后是 DWS 层的数据建模，基于 DWD 层的数据进行汇总，通过分析业务需求，将 DWD 层的数据按照主题进行划分，汇总出渠道服务主题宽表、业务部运营主题宽表、交易产品主题宽表等公共指标宽表，建立 DWS 层； • 最后根据实际业务需求，计算业务指标建立 ADS 层。对于一部分用户账户粒度的业务指标，可通过 DWD 层的明细直接计算得到，部分粗粒度的业务指标比如 APP 渠道服务客户人数、投顾产品阅读人数等，可以通过 DWS 层计算获得。最终计算结果接入到数据网关将数据统一提供给下游系统或通过 BI 系统展示。

以上内容摘自《Apache Flink 案例集（2022版）》电子书，点击https://developer.aliyun.com/ebook/download/7718 可下载完整版

2022-08-31 13:18:08

赞同展开评论

问答分类：

数据处理实时计算 Flink版实时数仓 Hologres

问答标签：

数据仓库云原生数据仓库AnalyticDB MySQL版数据仓库分层架构流程架构云原生数据仓库AnalyticDB MySQL版架构分层

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

阿里云 EMR 如何推进客户湖仓一体架构的建设？

317

2

0

在数仓架构中，我们通常将数据分为哪几个层次进行管理？

305

2

0

快手实时数仓保障体系架构的正向保障思路是什么？

198

1

0

小米APP近实时数仓的架构中，日志数据是如何处理的？

219

1

0

Delta Lake 如何保证湖仓架构的可靠性、安全性和高性能？

189

1

0

最早的数仓架构是基于什么设计的？它有哪些优点和局限性？

187

1

0

为什么业务通常需要维护两套数仓架构，甚至需要不同的技术团队？

152

1

0

数据仓库的典型架构使用哪些层次来容纳其关键功能？

180

1

0

湖仓一体架构的落地带来了哪些主要收益？

235

1

0

在湖仓一体架构中，你们遇到了哪些稳定性和数据正确性的问题，并如何解决？

193

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199215

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

相关文章

EMR + Flink 实战：从离线T+1到实时数仓的完整迁移路径

Hologres + Flink 实时OLAP分析实战：从T+1报表到秒级洞察的数据平台

基于 YOLO11 的下水管道六类缺陷检测：从数据标注到云上训练实践

GEO优化必要动作与伪必要动作辨析

基于YOLOv8的钢材表面缺陷检测系统

相关解决方案

更多

云上高可用架构

Flink 与 Hologres 搭建实时数仓

高效实现前后端分离架构升级

低成本、高性能的湖仓一体化架构

极简运维，Serverless 高可用架构

热门讨论

热门文章

Flink CDC刚刚写了几条数据，但是里面有点问题，其他字段都是正常的。这是咋回事呀？

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

Flink cdc sqlserver 希望不同步某些数据行

Flink CDC 能适配达梦不？

flinkcdc在IDEA运行正常，打包就报错

Segment Key主要应用在哪些场景？

Flink CDC中，有哪位大佬有flink 版本和cdc版本的适配统计啊？

Apache Flink未授权访问上传导致的RCE漏洞，这个漏洞目前方案解决吗？

大佬们，我目前的场景是flinkcdc 用sql将mongo数据同步到es，有人做过这样的场景吗？

展开全部

独家专访阿里集团副总裁贾扬清：我为什么选择加入阿里巴巴？

阿里云实时计算产品案例&解决方案汇总

流计算精品翻译: The Dataflow Model

广告场景下的实时计算

史上超强阵容！大数据及人工智能领域顶级盛会，Flink Forward Asia 2019 不容错过！

Flink SQL 功能解密系列 —— 流计算“撤回(Retraction)”案例分析

运维场景下的实时计算应用

日均百亿级日志处理：微博基于 Flink 的实时计算平台建设

Flink SQL 功能解密系列 —— 阿里云流计算/Blink支持的connectors

开篇 | 揭秘 Flink 1.9 新架构，Blink Planner 你会用了吗？

展开全部

还有其他疑问?