《全链路数据治理-智能数据建模 》——产品实操:零售电商数据建模操作实践(5)

简介: 《全链路数据治理-智能数据建模 》——产品实操:零售电商数据建模操作实践(5)

《全链路数据治理-智能数据建模 》——产品实操:零售电商数据建模操作实践(4) https://developer.aliyun.com/article/1230565?groupCode=tech_library




4. 维度建模工具实践过程


维度建模中部分标注了可选,表示不操作不影响后续实验。建议是都操作一下,以

便结合业务从整体角度了解一下维度建模。


1) 数仓规划

a) 业务分类

新建一个业务分类

业务名称:电商业务;英文缩写:ec


image.png



b) 数仓分层


系统内置了常规的数据分层,用户可以针对每个数据分层设置表名检查器。本实验

使用默认分层结构,并且为了规范模型的命名,将同一分层中表名称的命名格式统

一,我们为每个数仓分层配置对应的表名“检查器”,开启并设置默认检查器,在

进行模型设计时,表名会按照检查器设置自动填充,设计师仅需补充自定义内容即

可。


• 贴源层:数据引入层ODS

• 公共层:维度层DIM、明细数据层DWD、汇总数据层DWS

• 应用层:应用数据层ADS


image.png



表名检查器示例:


• 弱规则:新建对象时,根据规则定义内容,推荐填写规则名称

• 强规则:新建对象时,根据规则定义内容,推荐填写并强制校验规则名称


image.png





《全链路数据治理-智能数据建模 》——产品实操:零售电商数据建模操作实践(6) https://developer.aliyun.com/article/1230563?groupCode=tech_library

相关文章
|
XML JSON jenkins
Python代码覆盖率分析工具----Coverage
Python代码覆盖率分析工具----Coverage
608 0
|
存储 分布式计算 Apache
构建 Streaming Lakehouse:使用 Paimon 和 Hudi 的性能对比
Apache Paimon 和 Apache Hudi 作为数据湖存储格式,有着高吞吐的写入和低延迟的查询性能,是构建数据湖的常用组件。本文将在阿里云EMR 上,针对数据实时入湖场景,对 Paimon 和 Hudi 的性能进行比对,然后分别以 Paimon 和 Hudi 作为统一存储搭建准实时数仓。
60040 9
构建 Streaming Lakehouse:使用 Paimon 和 Hudi 的性能对比
|
数据采集 自然语言处理 数据挖掘
利用ChatGPT进行数据分析——如何提出一个好的prompt
利用ChatGPT进行数据分析——如何提出一个好的prompt
464 0
|
数据安全/隐私保护 Python
Python办公自动化:给pdf加水印
Python办公自动化:给pdf加水印
237 0
|
小程序 数据安全/隐私保护 Python
Python:快速去除PDF水印
Python:快速去除PDF水印
719 0
|
存储 BI 关系型数据库
数仓学习---数仓开发之DWS层
数仓学习---数仓开发之DWS层
1274 4
|
存储 机器学习/深度学习 分布式计算
Apache Hudi在Hopsworks机器学习的应用
Apache Hudi在Hopsworks机器学习的应用
230 0
|
数据挖掘 大数据 关系型数据库
Doris和Greenplum数据库简单对比
【5月更文挑战第3天】Doris和Greenplum数据库简单对比
2019 0
|
缓存 Linux
CentOS7系统配置国内yum源和epel源
1.首先进入/etc/yum.repos.d/目录下,新建一个repo_bak目录,用于保存系统中原来的repo文件 [root@bogon ~]# cd /etc/yum.repos.d/ [root@bogon yum.
11368 57
|
应用服务中间件 nginx 索引