【DBMS 数据库管理系统】数据仓库 数据组织 ( 数据组织级别 | 元数据 | 粒度 | 分割 | 数据组织形式 )(一)

简介: 【DBMS 数据库管理系统】数据仓库 数据组织 ( 数据组织级别 | 元数据 | 粒度 | 分割 | 数据组织形式 )(一)

一、数据仓库中的 数据组织级别


数据仓库中的数据组织 级别 : 下面 细节程度 由低到高 逐一解析 ;


早期细节级别数据 : 之前的一段时间的历史数据 ;

当前细节级别数据 : 最近阶段的历史数据 ;

轻度综合级别数据 : 以 天 , 星期 , 月 , 为时间单位综合数据 ;

高度综合级别数据 : 以 季度 , 年 , 为时间单位综合数据 ;


引入 “力度” 概念 : 上述介绍的 数据的不同的综合级别 , 称为力度 ;


力度效果 : 力度越大 , 细节成都越低 , 综合程度越高 ;

级别划分 : 数据的综合级别的划分 , 是根据力度进行划分的 ;


数据仓库中的数据组织 涉及概念 : 粒度 与 分割 , 数据仓库数据组织形式 , 数据仓库数据追加 ;






二、数据仓库中的 元数据


元数据 ( MetaData ) :


概念 : 关于 “数据” 的 数据 ;

数据库 -> 数据仓库 : 从 操作型环境 向 数据仓库环境 转换 , 建立的元数据 ; 包含 元数据项名 , 属性 , 属性在数据仓库中的转换 ;

数据仓库 -> 前端应用 映射 : 多维数据模型 与 前端工具 之间建立的映射 , 该映射相关的数据 是 元数据 ;





三、粒度 ( 根据 数据综合程度 划分粒度 )


根据 “数据综合程度” 划分粒度 : “粒度” 是对 数据仓库 中的数据 的 综合程度高低 进行的度量 ;


粒度与综合 : 粒度越小 , 数据细节程度越高 , 数据的综合程度越低 ;

多粒度查询 : 数据仓库中一般查询是多粒度查询 , 不同的粒度 , 能回答不同的查询 ;


不同粒度查询举例 : 粒度大小影响数据库查询的效率 ;


细节查询 : 如果要查询 A AA 是否在昨天下午 3 33 点给 B BB 打过电话 , 此时应该直接查询该时间点的数据 ;


以 “年” 为粒度查询 : 如果要查询 A AA 去年通话时间 , 就需要查询以 “年” 为单位的通话数据 ;


以 “十年” 为粒度查询 : 如果要预测 A AA 未来几年的通话时间 , 就需查询 A AA 所有的通话数据记录 , 然后做出预测 ;






四、粒度 ( 根据 样本采样率 划分粒度 )


根据 “采样率高低” 划分粒度 :


样本数据库 : 以 一定的采样率 从 细节数据 / 轻度综合数据 中抽取出的 数据子集 , 称为样本数据库 ;

样本数据库 “作用” : 使用该 数据子集 进行 模拟分析 ;

抽象方式 : 随机抽取 ;


"样本数据库" 优点 :


效率 : 查询分析 效率 高 ;

降低数据量 : 如果源数据的数据量很大 , 抽样数据的量可以降低 ;

准确度高 : 分析结果的误差很小 , 准确度高 ;

主要因素 : 这种分析方式 , 有助于抓住 主要因素 , 主要矛盾 ;


两种形式的 “粒度” 举例 : “商品” 主题 ;


时间段上信息综合粒度 : 销售综合表 , 采购综合表 , 是 根据 “数据综合程度” 划分的粒度 ;

不同时间点的采样粒度 : 库存信息表 , 是 根据 “采样率高低” 划分的粒度 ;




目录
相关文章
|
15天前
|
存储 人工智能 Cloud Native
云栖重磅|从数据到智能:Data+AI驱动的云原生数据库
在9月20日2024云栖大会上,阿里云智能集团副总裁,数据库产品事业部负责人,ACM、CCF、IEEE会士(Fellow)李飞飞发表《从数据到智能:Data+AI驱动的云原生数据库》主题演讲。他表示,数据是生成式AI的核心资产,大模型时代的数据管理系统需具备多模处理和实时分析能力。阿里云瑶池将数据+AI全面融合,构建一站式多模数据管理平台,以数据驱动决策与创新,为用户提供像“搭积木”一样易用、好用、高可用的使用体验。
云栖重磅|从数据到智能:Data+AI驱动的云原生数据库
|
17天前
|
SQL 关系型数据库 数据库
国产数据实战之docker部署MyWebSQL数据库管理工具
【10月更文挑战第23天】国产数据实战之docker部署MyWebSQL数据库管理工具
56 4
国产数据实战之docker部署MyWebSQL数据库管理工具
|
14天前
|
关系型数据库 分布式数据库 数据库
云栖大会|从数据到决策:AI时代数据库如何实现高效数据管理?
在2024云栖大会「海量数据的高效存储与管理」专场,阿里云瑶池讲师团携手AMD、FunPlus、太美医疗科技、中石化、平安科技以及小赢科技、迅雷集团的资深技术专家深入分享了阿里云在OLTP方向的最新技术进展和行业最佳实践。
|
22天前
|
人工智能 Cloud Native 容灾
云数据库“再进化”,OB Cloud如何打造云时代的数据底座?
云数据库“再进化”,OB Cloud如何打造云时代的数据底座?
|
23天前
|
NoSQL 前端开发 MongoDB
前端的全栈之路Meteor篇(三):运行在浏览器端的NoSQL数据库副本-MiniMongo介绍及其前后端数据实时同步示例
MiniMongo 是 Meteor 框架中的客户端数据库组件,模拟了 MongoDB 的核心功能,允许前端开发者使用类似 MongoDB 的 API 进行数据操作。通过 Meteor 的数据同步机制,MiniMongo 与服务器端的 MongoDB 实现实时数据同步,确保数据一致性,支持发布/订阅模型和响应式数据源,适用于实时聊天、项目管理和协作工具等应用场景。
|
8天前
|
SQL 关系型数据库 MySQL
go语言数据库中mysql驱动安装
【11月更文挑战第2天】
23 4
|
6天前
|
SQL 关系型数据库 MySQL
12 PHP配置数据库MySQL
路老师分享了PHP操作MySQL数据库的方法,包括安装并连接MySQL服务器、选择数据库、执行SQL语句(如插入、更新、删除和查询),以及将结果集返回到数组。通过具体示例代码,详细介绍了每一步的操作流程,帮助读者快速入门PHP与MySQL的交互。
19 1
|
1月前
|
存储 关系型数据库 MySQL
Mysql(4)—数据库索引
数据库索引是用于提高数据检索效率的数据结构,类似于书籍中的索引。它允许用户快速找到数据,而无需扫描整个表。MySQL中的索引可以显著提升查询速度,使数据库操作更加高效。索引的发展经历了从无索引、简单索引到B-树、哈希索引、位图索引、全文索引等多个阶段。
61 3
Mysql(4)—数据库索引
|
15天前
|
监控 关系型数据库 MySQL
数据库优化:MySQL索引策略与查询性能调优实战
【10月更文挑战第27天】本文深入探讨了MySQL的索引策略和查询性能调优技巧。通过介绍B-Tree索引、哈希索引和全文索引等不同类型,以及如何创建和维护索引,结合实战案例分析查询执行计划,帮助读者掌握提升查询性能的方法。定期优化索引和调整查询语句是提高数据库性能的关键。
81 1
|
17天前
|
关系型数据库 MySQL Linux
在 CentOS 7 中通过编译源码方式安装 MySQL 数据库的详细步骤,包括准备工作、下载源码、编译安装、配置 MySQL 服务、登录设置等。
本文介绍了在 CentOS 7 中通过编译源码方式安装 MySQL 数据库的详细步骤,包括准备工作、下载源码、编译安装、配置 MySQL 服务、登录设置等。同时,文章还对比了编译源码安装与使用 RPM 包安装的优缺点,帮助读者根据需求选择最合适的方法。通过具体案例,展示了编译源码安装的灵活性和定制性。
59 2

热门文章

最新文章