《全链路数据治理-智能数据建模 》——产品实操:零售电商数据建模操作实践(3)

简介: 《全链路数据治理-智能数据建模 》——产品实操:零售电商数据建模操作实践(3)

《全链路数据治理-智能数据建模 》——产品实操:零售电商数据建模操作实践(2) https://developer.aliyun.com/article/1230569?groupCode=tech_library



二、 维度建模


维度建模储备知识介绍。


1. 基本概念

智能建模强依赖于Kimball 维度建模理论,在实操前务必阅读一下数仓分层和维度

建模中的基本概念。


维度建模:详情请参见维度建模。


业务分类:当企业业务比较复杂,不同类型业务彼此间需要共享数据域,但是又希

望能在模型设计和应用过程中快速定位本业务的数据,可结合真实业务情况,规划

不同的业务分类,在后续模型设计过程中,可将模型归属到对应的业务分类,提升

后续模型使用的便捷性。例如零售电子商务就是一个一级业务分类,如需进一步细

分,可分为门店零售,电子商务等。


数据域:是对企业业务过程进行抽象、提炼、组合的集合,是企业业务人员在使用

数据时第一个分组入口,可以帮助企业业务人员快速的从海量的数据中快速圈定到

自己的业务数据。例如在电商领域,可以划分会员域、商品域、交易域等。

业务过程:业务过程指企业的业务活动事件,如下单,支付。


数据集市:是基于业务分类,面向特定应用场景或者产品的数据组织。通常位于数

据应用层,依赖于公共层的整合数据。例如电商集市、生意参谋集市等。


主题域:用于将数据集市按照分析视角进行划分,通常是联系较为紧密的数据主题

的集合。例如在电商集市下,可以创建电商360、活动等主题域。


维度:维度是用于分析数据的一个角度,一方面对维度进行可控管理,另一方面指

导维度表的设计,如地理维度,时间维度。


维度属性:维度属性隶属于一个维度,用来描述维度的属性,如地理维度中的国家

名称,省份名称。


时间周期:时间周期是用来明确数据统计的时间范围或者时间点,如最近30 天,自

然周。


修饰词:修饰词是对指标统计业务范围的划定,指除了统计维度外指标的业务场景

的限定抽象,如PC 端,无线端。


原子指标:用于明确业务的统计口径和计算逻辑,是基于用户的业务活动(即业务

过程)创建的,用于统计业务活动中某一业务状况的数值。例如,存量会员数。


派生指标:由原子指标、时间周期、修饰词构成,用于反映企业某一业务活动在指

定时间周期及目标范围中的业务状况。例如,历史截至当日(时间周期)_异常会员

(修饰词)_存量会员数(原子指标)。



• 数仓分层:详情请参见数仓分层

• 数据引入层ODS(Operation Data Store)

• 数据公共层CDM(Common Data Model,又称通用数据模型层)

􎛏 公共维度层(DIM)

􎛏 公共汇总粒度事实层(DWS)

􎛏 明细粒度事实层(DWD)


• 数据应用层ADS(Application Data Service)




《全链路数据治理-智能数据建模 》——产品实操:零售电商数据建模操作实践(4) https://developer.aliyun.com/article/1230565?groupCode=tech_library

相关文章
|
前端开发 Java 数据库
基于SpringBoot的生鲜交易系统
基于SpringBoot的生鲜交易系统
|
7月前
|
小程序 Java 关系型数据库
weixin117新闻资讯系统设计+springboot(文档+源码)_kaic
本文介绍了一款基于微信小程序的新闻资讯系统,涵盖其开发全过程。该系统采用Java的SSM框架进行后台管理开发,使用MySQL作为本地数据库,并借助微信开发者工具确保稳定性。管理员可通过个人中心、用户管理等功能模块实现高效管理,而用户则能注册登录并查看新闻与视频内容。系统设计注重可行性分析(技术、经济、操作),强调安全性与数据完整性,界面简洁易用,功能全面,极大提升了信息管理效率及用户体验。关键词包括基于微信小程序的新闻资讯系统、SSM框架和MYSQL数据库。
|
分布式计算 Hadoop 数据库
Hadoop学习笔记(HDP)-Part.08 部署Ambari集群
本文为HDP集群部署系列教程第八部分,详细介绍如何通过Ambari搭建HDP集群。涵盖Ambari数据库配置、ambari-server与ambari-agent的安装部署、自动化设置及Web界面登录等步骤,助力用户高效完成集群管理平台搭建。
464 0
C++(十八)Smart Pointer 智能指针简介
智能指针是C++中用于管理动态分配内存的一种机制,通过自动释放不再使用的内存来防止内存泄漏。`auto_ptr`是早期的一种实现,但已被`shared_ptr`和`weak_ptr`取代。这些智能指针基于RAII(Resource Acquisition Is Initialization)原则,即资源获取即初始化。RAII确保对象在其生命周期结束时自动释放资源。通过重载`*`和`->`运算符,可以方便地访问和操作智能指针所指向的对象。
|
10月前
|
Java API 开发者
深入理解Java中的异常处理机制
本文探讨了Java编程语言中异常处理的核心概念,包括异常类型、异常捕获与抛出、以及最佳实践。通过分析常见的异常场景和处理策略,旨在帮助开发者更好地理解和运用异常处理机制,提高代码的健壮性和可维护性。文章不仅涵盖了基本的try-catch结构,还深入讨论了自定义异常的创建与使用,以及finally块的重要性和应用。此外,还将介绍一些高级技巧,如多异常捕获和嵌套异常处理,为读者提供全面的技术指导。
244 0
|
数据采集 运维 监控
ERP系统中的生产过程监控与质量管理
【7月更文挑战第25天】 ERP系统中的生产过程监控与质量管理
487 0
|
小程序 Java 关系型数据库
基于Java微信小程序智能招聘平台设计和实现(源码+LW+调试文档+讲解等)
基于Java微信小程序智能招聘平台设计和实现(源码+LW+调试文档+讲解等)
|
人工智能 自然语言处理 网络架构
单一作者论文,谷歌提出百万专家Mixture,超越密集前馈、稀疏MoE
【7月更文挑战第27天】谷歌提出了一种名为“百万专家Mixture”的神经网络架构,旨在解决Transformer模型处理大规模数据时面临的计算和内存效率问题。该架构通过利用“产品键”技术实现从大规模专家池中的高效检索,相较于传统密集前馈网络和稀疏MoE模型,在性能-计算权衡方面展现出明显优势。尽管如此,模型训练的复杂性和大规模模型的有效管理仍然是挑战。[链接](https://arxiv.org/abs/2407.04153)
221 2
|
JavaScript 前端开发
js数组排序的方法
js数组排序的方法
160 1
|
算法 C++
探索FFmpeg:实现自定义播放速度的全方位指南(三)
探索FFmpeg:实现自定义播放速度的全方位指南
400 0