【DBMS 数据库管理系统】多维数据模型 ( 星型模式 | 雪片模型 | 事实群模型 | 度量 | 分布型 | 代数型

【DBMS 数据库管理系统】多维数据模型 ( 星型模式 | 雪片模型 | 事实群模型 | 度量 | 分布型 | 代数型 | 整体型 )

2022-01-26 614

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【DBMS 数据库管理系统】多维数据模型 ( 星型模式 | 雪片模型 | 事实群模型 | 度量 | 分布型 | 代数型 | 整体型 )

文章目录

一、星型模式

二、星型模式缺点

三、雪片模型

四、星型模型雪片模型折衷方案

五、事实群模型 ( 仅做了解 )

六、度量

一、星型模式

星型模式是多维数据模型的表现形式 ;

星型模式展示 : 中间有一个表 , 称为事实表 , 周围有很多小表 , 这些表称为维表 ;

以 “商品” 表为例 :

事实表 : 描述商品的时间 , 位置 , 供应商 , 零售价 , 商品颜色等信息 ;

维表 : 时间对应的维表包含年 , 月 , 日 , 时 , 分 , 秒等字段 ; 位置维表有国家 , 省份 , 地区 , 城市 , 街道等字段信息 , 供应商维表有公司名称 , 法人 , 税号 , 公司注册地点等字段信息 ;

事实表中的度量 : 上述零售价 , 商品颜色没有与维表关联 , 是度量 ;

二、星型模式缺点

星型模式缺点 :

1 . 星型模式不支持维的层结构 ;

单一维表 : 每个维只有一个维表 , 所有的维层属性都放在一个表中 , 没有进行规范化 ;

单一维表示例 : 以上述 “商品” 事实表的时间对应的维表为例 , 将年 , 月 , 日 , 时 , 分 , 秒等字段放在同一个维表中 , 时间维可以变成多个维表 , 如只包含年月日的维表 , 只包含年月的维表等 ;

2 . 数据冗余 :

数据冗余 : 每个维表都要表示所有的层 , 每个层有自己的属性 , 有很多数据冗余 ;

数据冗余示例 : 上述时间维表中每个商品 , 都要存储完整的年 , 月 , 日 , 时 , 分 , 秒数据 , 实际上商品的年 , 月 , 等数据 , 很多商品都是相同的 , 只记录一次即可 , 不同所有的商品都记录年月信息 , 因此产生了大量的冗余数据 ;

3 . 不同维层属性名相同查询问题 :

不同维层 , 有相同的属性 , 只能使用换名方式进行查询 ;

不同维层相同属性示例 : 如商店事实表中 , 城市 , 省份 , 国家 , 每个层级都有一个经理 Manager , 当查询 Manager 属性时 , 直接将城市经理 , 省份经理 , 国家经理 , 都查询出来了 , 无法查询单独一个级别的经理信息 ;

三、雪片模型

对于维层次复杂的维

为了避免冗余数据占用过多空间

为了支持不同维层相同属性查询

使用多个维表描述复杂的维 , 这样在星型模型的星的角上 , 出现了分支 , 类似于雪花形状 , 因此这种变种的星型模型称为 “雪片模型” ;

雪片模型示例 : 以 “商品” 表为例

事实表 : 描述商品的时间 , 位置 , 供应商 , 零售价 , 商品颜色等信息 ;

第一层维表 : 时间对应的维表包含日 , 时 , 分 , 秒等字段 ; 位置维表有城市 , 街道等字段信息 , 供应商维表有公司名称 , 法人 , 税号 , 公司注册地点等字段信息 ;

第二层维表 : 时间表的第一层维表的日 , 又使用第二层维表表示 , 该维表中有年 , 月 , 日 , 三个维度的信息 ; 地区表的第一层维表的城市 , 使用第二层维表表示 , 该第二层维表有国家 , 省份 , 城市 , 三个维度的信息表示 ;

事实表中的度量 : 上述零售价 , 商品颜色没有与维表关联 , 是度量 ;

雪片模型优缺点 :

雪片模型优点 : 雪片模型的维表是规范化的维表 , 雪片模型维表易于维护 , 节省存储空间 ;

雪片模型缺点 : 雪片模型查询时 , 需要进行较多的连接操作 , 影响系统性能 ;

雪片模型更好的体现了维层结构 ,

对于专业的数据库建模设计人员 , 更容易理解 , 分析 ;

- 对于普通用户来说 , 比较复杂 ;

四、星型模型雪片模型折衷方案

推荐采用一种星型模型和雪片模型折衷方案 , 将星型模式与雪片模式结合使用 ;

大维表节省空间 : 针对大维表 , 规范化 , 节省存储空间 ;

小维表效率优先 : 对于小维表 , 采用不规范化的形式 , 避免因为查询时 , 过多的表连接 , 引起性能降低 ;

五、事实群模型 ( 仅做了解 )

该模型比星型模式 , 雪片模型更复杂 , 上述两个模型 , 只有一个事实表 , 但是在事实群模型中 , 有多个事实表 , 两个事实表 , 可能公用一些维表 ;

六、度量

数据方体中的度量 , 可以分为三种不同的类型 :

分布型

代数型

整体型

分布型度量 :

特点 : 可以累加 ;

示例 : 求和 , 计数 , 求最小值 , 求最大值 ;

代数型度量 :

特点 : 无法累计 ; 但是可以转换成分布式度量 ;

示例 : 求平均值 , 无法累加 , 但是可以转成先求和 , 然后再计算平均值的分布性度量 ;

整体型度量 :

特点 : 必须有所有的值才能计算 , 无法累加 ;

示例 : 求中间值 , 求前 K KK 个最大值 , 排名 , 必须统计完整数据 , 才能计算出来 ;

【DBMS 数据库管理系统】多维数据模型 ( 星型模式 | 雪片模型 | 事实群模型 | 度量 | 分布型 | 代数型 | 整体型 )

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

【DBMS 数据库管理系统】多维数据模型 ( 星型模式 | 雪片模型 | 事实群模型 | 度量 | 分布型 | 代数型 | 整体型 )

热门文章

最新文章

相关课程

相关电子书