维度表和事实表的区别

简介: 转载:转载:https://blog.csdn.net/qq_56870570/article/details/118938411

3.1 维度表
维度表:一般是对事实的描述信息。每一张维表对应现实世界中的一个对象或者概念。例如:用户、商品、日期、地区等。

在维度表中,每个表都包含独立于其他维度表的事实特性,例如,客户维度表包含有关客户的数据。维度表中的列字段可以将信息分为不同层次的结构级。

维表的特征:

维表的范围很宽(具有多个属性、列比较多)
跟事实表相比,行数相对较小:通常< 10万条
内容相对固定:编码表

3.2 事实表
事实表:每个数据仓库都包含一个或者多个事实数据表。事实数据表可能包含业务销售数据,如现金登记事务所产生的数据,事实数据表通常包含大量的行。事实数据表的主要特点是包含数字数据(事实),并且这些数字信息可以汇总,以提供有关单位作为历史的数据,每个事实数据表包含一个由多个部分组成的索引,该索引包含作为外键的相关性纬度表的主键,而维度表包含事实记录的特性。事实数据表不应该包含描述性的信息,也不应该包含除数字度量字段及使事实与纬度表中对应项的相关索引字段之外的任何数据。

包含在事实数据表中的“度量值”有两中:一种是可以累计的度量值,另一种是非累计的度量值。最有用的度量值是可累计的度量值,其累计起来的数字是非常有意义的。用户可以通过累计度量值获得汇总信息,例如。可以汇总具体时间段内一组商店的特定商品的销售情况。非累计的度量值也可以用于事实数据表,单汇总结果一般是没有意义的,例如,在一座大厦的不同位置测量温度时,如果将大厦中所有不同位置的温度累加是没有意义的,但是求平均值是有意义的。

一般来说,一个事实数据表都要和一个或多个纬度表相关联,用户在利用事实数据表创建多维数据集时,可以使用一个或多个维度表。

事实表中的每行数据代表一个业务事件(下单、支付、退款、评价等)。“事实”这个术语表示的是业务事件的度量值(可统计次数、个数、金额等),例如,2020年5月21日,宋老师在京东花了250块钱买了一双安踏鞋。维度表:时间、用户、商品、商家。事实表:250块钱、一双

每一个事实表的行包括:具有可加性的数值型的度量值、与维表相连接的外键,通常具有两个和两个以上的外键。

事实表的特征:

非常的大
内容相对的窄:列数较少(主要是外键id和度量值)
经常发生变化,每天会新增加很多。
1)事务型事实表

以每个事务或事件为单位,例如一个销售订单记录,一笔支付记录等,作为事实表里的一行数据。一旦事务被提交,事实表数据被插入,数据就不再进行更改,其更新方式为增量更新。

2)周期型快照事实表

周期型快照事实表中不会保留所有数据,只保留固定时间间隔的数据,例如每天或者每月的销售额,或每月的账户余额等。

例如购物车,有加减商品,随时都有可能变化,但是我们更关心每天结束时这里面有多少商品,方便我们后期统计分析。

3)累积型快照事实表

累计快照事实表用于跟踪业务事实的变化。例如,数据仓库中可能需要累积或者存储订单从下订单开始,到订单商品被打包、运输、和签收的各个业务阶段的时间点数据来跟踪订单声明周期的进展情况。当这个业务过程进行时,事实表的记录也要不断更新。

相关文章
|
存储 数据挖掘 BI
ODS,DWD,ADS是什么意思
ODS,DWD,ADS是什么意思
5226 0
|
Oracle Java 关系型数据库
Oracle jdk 的国内下载镜像
Oracle jdk 的国内下载镜像
60236 0
|
2月前
|
人工智能 自然语言处理 数据可视化
2026年新手零基础、零代码极速部署OpenClaw(Clawdbot)及接入Skills步骤流程
2026年,AI智能体工具迎来规模化落地,OpenClaw(前身为Clawdbot、Moltbot)凭借“自然语言指令+自动化任务执行+插件化技能扩展”的核心优势,成为个人办公提效、轻量团队协作、新手开发者入门的首选开源工具。不同于传统聊天机器人,OpenClaw可直接执行系统操作、文件处理、跨工具协同等具象化任务,而其核心价值的延伸——Skills技能插件,更让其能力边界实现无限拓展,通过安装不同场景的Skills,可快速适配办公、开发、学习、运营等各类需求,真正实现“一个工具搞定所有重复工作”。
498 2
|
2月前
|
人工智能 监控 API
一个人=8人AI团队:阿里云1分钟部署OpenClaw全文件驱动多Agent实战指南(直通率优化)
在AI工具深度应用的今天,很多人都会遇到这样的困境:用一个全能Agent处理所有任务,结果它写文案写到一半被拉去审代码,上下文切换导致思路断裂、效率低下。BPO公司总监Jason的经历正是如此——他最初打造的通用AI助手Oscar因“身兼数职”频繁崩掉,最终他将其拆分为8个专职Agent,组成AI团队,两周内实现80%内容直通率(无需修改直接发布),用“一个人指挥一个AI团队”的模式彻底改变了工作流程。
2487 2
|
4月前
|
人工智能 安全 Java
SpecKit 在成熟 Java 项目中的 AI 编码实践
本文探索AI Code与SpecKit在Java应用中的实践,结合规格驱动开发(SDD)与测试驱动开发(TDD),通过定义原则、需求规格化、技术方案设计等步骤,实现风格统一、可追溯的AI辅助编码。分享选型考量、执行流程及问题优化,总结经验并沉淀为应用级知识资产,提升研发效率与代码规范性。(239字)
2012 13
SpecKit 在成熟 Java 项目中的 AI 编码实践
|
存储 数据挖掘 大数据
大数据数仓建模基础理论【维度表、事实表、数仓分层及示例】
数据仓库建模是组织和设计数据以支持数据分析的过程,包括ER模型和维度建模。ER模型通过实体和关系描述数据结构,遵循三范式减少冗余。维度建模,特别是Kimball方法,用于数据仓库设计,便于分析和报告。事实表存储业务度量,如销售数据,分为累积、快照、事务和周期性快照类型。维度表提供描述性信息,如时间、产品、地点和客户详情。数仓通常分层为ODS(源数据)、DWD(明细数据)、DIM(公共维度)、DWS(数据汇总)和ADS(应用数据),以优化数据管理、质量、查询性能和适应性。
6307 5
|
SQL 存储 关系型数据库
离线数仓(五)【数据仓库建模】(1)
离线数仓(五)【数据仓库建模】
离线数仓(五)【数据仓库建模】(1)
|
机器学习/深度学习 数据采集 算法
基于机器学习的二手房价格分析与预测设计与实现
本文通过机器学习技术对西安市二手房市场价格进行分析与预测,利用数据预处理、特征提取和模型训练,深入挖掘影响房价的关键因素,旨在为市场参与者提供科学的定价信息和决策支持。
1075 1
基于机器学习的二手房价格分析与预测设计与实现
|
SQL 存储 Java
Hive 特殊的数据类型 Array、Map、Struct
在Hive中,`Array`、`Map`和`Struct`是三种特殊的数据类型。`Array`用于存储相同类型的列表,如`select array(1, &quot;1&quot;, 2, 3, 4, 5)`会产生一个整数数组。`Map`是键值对集合,键值类型需一致,如`select map(1, 2, 3, &quot;4&quot;)`会产生一个整数到整数的映射。`Struct`表示结构体,有固定数量和类型的字段,如`select struct(1, 2, 3, 4)`创建一个无名结构体。这些类型支持嵌套使用,允许更复杂的结构数据存储。例如,可以创建一个包含用户结构体的数组来存储多用户信息
3619 0