一分钟搞懂 数据仓库的全量表,增量表,拉链表

简介: 一分钟搞懂 数据仓库的全量表,增量表,拉链表9
  • 维度表:业务过程的业务实体,如商品,用户,订单
代理键(自增列,可以充当主键)

自然键(唯一区分,商品id,订单id)

维度属性(商品的大小,颜色等)

  • 事实表:业务内特定事件的数据(大量的行),如商品销售

全量表:全部都记录
增量表:没变化的数据不会记录
拉链表:记录一个事物从开始, 直到当前状态的所有变化的信息

初始化

id 余额 时间
a 100 2021年9月13日
b 100 2021年9月13日

然后b存了100

全量表

id 余额 时间
a 100 2021年9月13日
b 200 2021年9月14日

增量表

id 余额 时间
a 100 2021年9月13日
b 100 2021年9月13日
b 200 2021年9月14日

拉链表

id 余额 时间 end_time
a 100 2021年9月13日 2999-12-30
b 100 2021年9月13日 2021-09-14
b 200 2021年9月14日 2999-12-30

层级架构

ods->dwd,dws->ads

在这里插入图片描述

目录
相关文章
|
2月前
|
SQL 存储 大数据
数据仓库(10)数仓拉链表开发实例
拉链表是数据仓库中特别重要的一种方式,它可以保留数据历史变化的过程,这里分享一下拉链表具体的开发过程。 维护历史状态,以及最新状态数据的一种表,拉链表根据拉链粒度的不同,实际上相当于快照,只不过做了优化,去除了一部分不变的记录,通过拉链表可以很方便的还原出拉链时点的客户记录。
183 13
数据仓库(10)数仓拉链表开发实例
|
16天前
|
Cloud Native 关系型数据库 MySQL
云原生数据仓库产品使用合集之在ADB中,如何将源数据的多表(数据结构一致)汇总到一张表
阿里云AnalyticDB提供了全面的数据导入、查询分析、数据管理、运维监控等功能,并通过扩展功能支持与AI平台集成、跨地域复制与联邦查询等高级应用场景,为企业构建实时、高效、可扩展的数据仓库解决方案。以下是对AnalyticDB产品使用合集的概述,包括数据导入、查询分析、数据管理、运维监控、扩展功能等方面。
|
存储 SQL 大数据
一篇文章搞懂数据仓库:三种事实表(设计原则,设计方法、对比)
一篇文章搞懂数据仓库:三种事实表(设计原则,设计方法、对比)
一篇文章搞懂数据仓库:三种事实表(设计原则,设计方法、对比)
|
7月前
|
存储 数据挖掘 关系型数据库
数仓学习---6、数据仓库概述、 数据仓库建模概述、维度建模理论之事实表、维度建模理论之维度表
数仓学习---6、数据仓库概述、 数据仓库建模概述、维度建模理论之事实表、维度建模理论之维度表
|
4月前
|
数据挖掘 数据库
离线数仓6.0--- 数据仓库 ER模型-范式理论,维度模型、维度建模理论之事实表、维度建模理论之维度表
离线数仓6.0--- 数据仓库 ER模型-范式理论,维度模型、维度建模理论之事实表、维度建模理论之维度表
137 0
|
5月前
|
存储 大数据 数据管理
数据仓库(08)数仓事实表和维度表技术
所谓的事实表和维度表技术,指的就是如何和构造一张事实表和维度表,是的事实表和维度表,可以涵盖现在目前的需要和方便后续下游数据应用的开发
59 1
|
11月前
|
SQL 存储 HIVE
数据仓库系列--维度表技术
数据仓库系列--维度表技术
110 0
|
存储 大数据 BI
聊聊数据仓库中维度表设计的二三事
聊聊数据仓库中维度表设计的二三事
738 0
聊聊数据仓库中维度表设计的二三事
|
大数据 BI
一篇文章搞懂数据仓库:维度表(设计原则、设计方法)
一篇文章搞懂数据仓库:维度表(设计原则、设计方法)
一篇文章搞懂数据仓库:维度表(设计原则、设计方法)
|
SQL 存储 HIVE