电商项目之数仓概念分析|学习笔记

本文涉及的产品
云原生数据仓库AnalyticDB MySQL版,基础版 8ACU 100GB 1个月
简介: 快速学习电商项目之数仓概念分析

开发者学堂课程【新电商大数据平台2020最新课程电商项目之数仓概念分析】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/640/detail/10490


电商项目之数仓概念分析 

 

数仓分层概述

根据实际生产情况,建议将数据仓库分为三层,自下而上为:

数据引入层(ODS, Operation Data Store)这一层里面主要是原始层原始数据。

数据公共层(CDM,Common Data Model)比较杂些dws、临时表等

数据应用层(ADS,Application Data Service)也叫数据集市生成报表形成报表。

1、数据引入层(ODS, Operation Data Store) :

将原始数据几乎无处理的存放在数据仓库系统,结构上与源系统基本保持一致,是数据仓库的数据准备区。

就是它会将原始的数这个原始数据,就比如说你刚采集过来的数据,没有经过任何的处理。

还有我们的业务数据也没有经过任何的数据,比如过滤、清除、空字段等等,什么都没有处理,直接将他怎么样刷入下载到我们的数据仓库系统当中,然后他的结构和语言数据不变,原封不动的刷入到 ODS 中,这里面的数据叫天原词数据引入参数据。那这里的数据一般会和原始数据一致。

2、数据公共层(CDM, Common Data Model,又称通用数据模型层),包含 DIM 维度表、DWD 和 DWS, 由 ODS 层数据加工而成。主要完成数据加工与整合,建立-致性的维度,构建可复用的面向分析和统计的明细事实表,以及汇总公共粒度的指标。对上一层进行降维同一纬度。

(1)公共维度层(DIM) :基于维度建模理念思想,建立整个企业的一致性维度。降低数据计算口径和算法不统一风险。公共维度层的表通常也被称为逻辑维度表,维度和维度逻辑表通常一-对应。

(2)公共汇总粒度事实层(DWS) :以分析的主题对象作为建模驱动,基于上层的应用和产品的指标需求,构建公共粒度的汇总指标事实表,以宽表化手段物理化模型。

构建命名规范、口径一致的统计指标, 为上层提供公共指标,建立汇总宽表、明细事实表。公共汇总粒度事实层的表通常也被称为汇总逻辑表,用于存放派生指标数据。

(3)明细粒度事实层(DWD) :以业务过程作为建模驱动,基于每个具体的业务过程特点,构建最细粒度的明细层事实表。可以结合企业的数据使用特点,将明事实表的某些重要维度属性字段做适当冗余,也即宽表化处理。明细粒度事实层的表通常也被称为逻辑事实表。

公共汇总粒度事实层的表通常也被称为汇总逻辑表,用于存放派生指标数据。

(3)明细粒度事实层(DWD) :以业务过程作为建模驱动,基于每个具体的业务过程特点,构建最细粒度的明细层事实表。可以结合企业的数据使用特点,将明细事实表的某些重要维度属性字段做适当冗余,也即宽表化处理。明细粒度事实层的表通常也被称为逻辑事实表。

3、数据应用层(ADS, Application Data Service) :存放数据产品个性化的统计指标数据。根据 CDM 与 ODS 层加工生成。

从数据引入层到数据公共层再到数据应用层整个过程叫做数据仓库。这只是一个理论上的,那么实际在实践过程中肯定要比这个理论上相比较要复杂一些,但是所有的复杂操作,所有的逻辑操作都是依据于什么样理论的基础之上。

理论通了你的代码才会通,理论不通,代码就不通。最简单的一个例子就是你的想法错了,那你做的事情都是错的,你想法对了,那你做的做的事情都是对的。所以说我们首先第一点理论先确立再去数仓的搭建以及模型的建立。

以上整个过程就是我们所说的一个概念分析,当然它里面可能有一些使用的模型。比如说星型模型,雪花型模型等等一系列模型。

相关实践学习
AnalyticDB MySQL海量数据秒级分析体验
快速上手AnalyticDB MySQL,玩转SQL开发等功能!本教程介绍如何在AnalyticDB MySQL中,一键加载内置数据集,并基于自动生成的查询脚本,运行复杂查询语句,秒级生成查询结果。
阿里云云原生数据仓库AnalyticDB MySQL版 使用教程
云原生数据仓库AnalyticDB MySQL版是一种支持高并发低延时查询的新一代云原生数据仓库,高度兼容MySQL协议以及SQL:92、SQL:99、SQL:2003标准,可以对海量数据进行即时的多维分析透视和业务探索,快速构建企业云上数据仓库。 了解产品 https://www.aliyun.com/product/ApsaraDB/ads
相关文章
|
5月前
|
Cloud Native OLAP OLTP
在业务处理分析一体化的背景下,开发者如何平衡OLTP和OLAP数据库的技术需求与选型?
在业务处理分析一体化的背景下,开发者如何平衡OLTP和OLAP数据库的技术需求与选型?
187 4
|
8天前
|
存储 SQL 分布式计算
湖仓一体架构深度解析:构建企业级数据管理与分析的新基石
【10月更文挑战第7天】湖仓一体架构深度解析:构建企业级数据管理与分析的新基石
12 1
|
23天前
|
DataWorks 数据挖掘 关系型数据库
基于hologres搭建轻量OLAP分析平台解决方案评测
一文带你详细了解基于hologres搭建轻量OLAP分析平台解决方案的优与劣
86 8
|
1月前
|
数据可视化 数据挖掘 OLAP
基于 Hologres 搭建轻量 OLAP 分析平台评测报告
【9月更文第6天】开作为互联网手游公司的产品经理和项目经理,数据分析对于我们的业务至关重要。我们一直在寻找高效、可靠的数据分析解决方案,以更好地了解玩家行为、优化游戏体验和提升运营效率。近期,我们体验并部署了《基于 Hologres 搭建轻量 OLAP 分析平台》解决方案,以下是我们对该方案的评测报告。
78 12
基于 Hologres 搭建轻量 OLAP 分析平台评测报告
|
4月前
|
数据采集 大数据
大数据实战项目之电商数仓(二)
大数据实战项目之电商数仓(二)
106 0
|
2月前
|
OLAP
云端问道5期-基于Hologres轻量高性能OLAP分析陪跑班获奖名单公布啦!
云端问道5期-基于Hologres轻量高性能OLAP分析陪跑班获奖名单公布啦!
428 3
|
2月前
|
BI
数仓项目总结--持续更新中
数仓项目总结--持续更新中
43 2
|
2月前
|
消息中间件 存储 大数据
大数据-数据仓库-实时数仓架构分析
大数据-数据仓库-实时数仓架构分析
114 1
|
2月前
|
缓存 数据库
实时数仓 Hologres产品使用合集之如何查看并分析历史查询语句
实时数仓Hologres是阿里云推出的一款高性能、实时分析的数据库服务,专为大数据分析和复杂查询场景设计。使用Hologres,企业能够打破传统数据仓库的延迟瓶颈,实现数据到决策的无缝衔接,加速业务创新和响应速度。以下是Hologres产品的一些典型使用场景合集。
|
5月前
|
SQL 测试技术 OLAP
现代化实时数仓 SelectDB 再次登顶 ClickBench 全球数据库分析性能排行榜!
现代化实时数仓 SelectDB 在时隔两年后再次完成登顶,在全部近百款数据库和数十种机型中,性能位居总榜第一!
现代化实时数仓 SelectDB 再次登顶 ClickBench 全球数据库分析性能排行榜!

热门文章

最新文章