【DBMS 数据库管理系统】数据仓库特征 ( 特征一 : 面向主题组织数据 | 特征二 : 数据集成 | 特征三 : 数据不可更新 | 特征四 : 随时间不断变化 )

简介: 【DBMS 数据库管理系统】数据仓库特征 ( 特征一 : 面向主题组织数据 | 特征二 : 数据集成 | 特征三 : 数据不可更新 | 特征四 : 随时间不断变化 )

文章目录

一、特征一 : 面向主题 数据组织方式

二、特征二 : 数据集成

三、特征三 : 数据不可更新

四、特征四 : 数据仓库中的数据 随时间不断变化





一、特征一 : 面向主题 数据组织方式


主题 :


主题是一个抽象 : 使用该抽象 , 在较高层次上 , 将企业信息系统中的数据 , 进行综合 , 归类 , 并进行分析利用 ;

逻辑意义 : 企业中 某个 宏观分析领域 涉及的分析对象 ;


较高层次 :


层次较高 : 相对于 面向应用 的 数据组织方式 , 层次较高

抽象级别 : 按照主题进行 数据组织方式 , 数据的抽象级别较高


面向主题 数据组织方式 特点 :


描述 : 对 分析对象的数据 的 , 完整的 , 一致的 , 描述 ;

内容 : 完整 , 统一 , 刻画 , 各个分析对象 , 涉及的数据 , 及数据对象之间的关系 ;


详情参考 : 【DBMS 数据库管理系统】数据仓库 ( 数据仓库简介 | 操作型数据与分析性数据对比 | 数据仓库特征 | 特征一 : 面向主题组织数据 | 面向应用 | ) 四、特征一 : 面向主题 数据组织方式






二、特征二 : 数据集成


数据集成含义 :


数据来源 : 从各个 子系统中的 分散的 OLTP 数据库 中 抽取 , 清洗 , 综合 , 得到 ;

重要性 : 数据集成 是 数据仓库 创建 中 , 最关键 , 最复杂 的步骤 ;


数据集成 :


数据统一 : 不同的数据来源 , 统一数据格式 , 包括 : 字段名称 , 字段含义 , 数据单位 , 数据长度 等 ;

综合计算 : 对数据进行 综合 , 计算 ; 其中包含下面的 综合时间生成 ;

综合时间 : 抽取数据时 生成综合时间 , 数据抽取完毕后 在 数据仓库 内部 生成综合时间 ;





三、特征三 : 数据不可更新


特征三 : 数据不可更新 :


历史数据 : 数据仓库中的数据都是历史数据 ;

查询操作 : 一般情况下 , 只能查询数据 , 不能对数据仓库中的数据进行 增删改 操作 ;

删除操作 : 数据仓库中的数据超过期限后 , 可以删除 , 但是这是 数据仓库维护范畴的概念 , 不是用户操作的 ;


数据仓库管理系统 :


简化数据管理 : 由于不能进行 增删改 操作 , 只能进行查询操作 , 一些数据管理功能可以简化 , 如 事务处理 , 脏数据 , 版本不一致 等功能可以简化 ;

数据查询要求 : 需要支持大数据查询 , 有友好的查询界面 , 分析结果直观 ;





四、特征四 : 数据仓库中的数据 随时间不断变化


特征四 : 数据仓库中的数据 随时间不断变化 :


数据仓库数据不可更新 : 针对用户而言 , 数据仓库中的数据 , 只能查询 , 不能 增删改 ;

定期更新数据仓库数据 : 数据仓库中的数据是需要定期更新的 , 这属于数据仓库管理员的工作 , 属于数据仓库维护范畴的工作 ;


数据保存时间 :


OLTP 数据库 : 操作型数据库 一般保存 2 ~ 3 个月的历史数据 ;

OLAP 数据仓库 : 分析型数据仓库 一般保存 5 ~ 10 年历史数据 ;


数据仓库数据 随时间变化 :


增加新数据 : 随着时间变化 , 数据仓库中需要添加最细的数据 , 定期更新数据 ;

删除旧数据 : 随着时间变化 , 数据仓库中旧的历史数据需要删除 ;

时间相关综合数据 : 数据仓库中需要维护大量与时间相关的综合数据 ;


时间相关的综合数据 :


时间段 : 按时间段 进行数据综合 ;

抽样 : 每隔一定时间片 , 进行数据抽样 ;

重新综合 : 随时间变化 , 不断重新综合数据 ;


数据仓库码键 : 时间项包含在数据仓库的码键中 , 可以从码键中看出数据的历史时期 ;


目录
相关文章
|
18天前
|
存储 人工智能 Cloud Native
云栖重磅|从数据到智能:Data+AI驱动的云原生数据库
在9月20日2024云栖大会上,阿里云智能集团副总裁,数据库产品事业部负责人,ACM、CCF、IEEE会士(Fellow)李飞飞发表《从数据到智能:Data+AI驱动的云原生数据库》主题演讲。他表示,数据是生成式AI的核心资产,大模型时代的数据管理系统需具备多模处理和实时分析能力。阿里云瑶池将数据+AI全面融合,构建一站式多模数据管理平台,以数据驱动决策与创新,为用户提供像“搭积木”一样易用、好用、高可用的使用体验。
云栖重磅|从数据到智能:Data+AI驱动的云原生数据库
|
20天前
|
SQL 关系型数据库 数据库
国产数据实战之docker部署MyWebSQL数据库管理工具
【10月更文挑战第23天】国产数据实战之docker部署MyWebSQL数据库管理工具
61 4
国产数据实战之docker部署MyWebSQL数据库管理工具
|
12天前
|
XML Java 数据库连接
SpringBoot集成Flowable:打造强大的工作流管理系统
在企业级应用开发中,工作流管理是一个核心组件,它能够帮助我们定义、执行和管理业务流程。Flowable是一个开源的工作流和业务流程管理(BPM)平台,它提供了强大的工作流引擎和建模工具。结合SpringBoot,我们可以快速构建一个高效、灵活的工作流管理系统。本文将探讨如何将Flowable集成到SpringBoot应用中,并展示其强大的功能。
47 1
|
18天前
|
关系型数据库 分布式数据库 数据库
云栖大会|从数据到决策:AI时代数据库如何实现高效数据管理?
在2024云栖大会「海量数据的高效存储与管理」专场,阿里云瑶池讲师团携手AMD、FunPlus、太美医疗科技、中石化、平安科技以及小赢科技、迅雷集团的资深技术专家深入分享了阿里云在OLTP方向的最新技术进展和行业最佳实践。
|
25天前
|
人工智能 Cloud Native 容灾
云数据库“再进化”,OB Cloud如何打造云时代的数据底座?
云数据库“再进化”,OB Cloud如何打造云时代的数据底座?
|
10天前
|
SQL 关系型数据库 MySQL
12 PHP配置数据库MySQL
路老师分享了PHP操作MySQL数据库的方法,包括安装并连接MySQL服务器、选择数据库、执行SQL语句(如插入、更新、删除和查询),以及将结果集返回到数组。通过具体示例代码,详细介绍了每一步的操作流程,帮助读者快速入门PHP与MySQL的交互。
25 1
|
12天前
|
SQL 关系型数据库 MySQL
go语言数据库中mysql驱动安装
【11月更文挑战第2天】
28 4
|
1月前
|
存储 关系型数据库 MySQL
Mysql(4)—数据库索引
数据库索引是用于提高数据检索效率的数据结构,类似于书籍中的索引。它允许用户快速找到数据,而无需扫描整个表。MySQL中的索引可以显著提升查询速度,使数据库操作更加高效。索引的发展经历了从无索引、简单索引到B-树、哈希索引、位图索引、全文索引等多个阶段。
61 3
Mysql(4)—数据库索引
|
19天前
|
监控 关系型数据库 MySQL
数据库优化:MySQL索引策略与查询性能调优实战
【10月更文挑战第27天】本文深入探讨了MySQL的索引策略和查询性能调优技巧。通过介绍B-Tree索引、哈希索引和全文索引等不同类型,以及如何创建和维护索引,结合实战案例分析查询执行计划,帮助读者掌握提升查询性能的方法。定期优化索引和调整查询语句是提高数据库性能的关键。
87 1
|
21天前
|
关系型数据库 MySQL Linux
在 CentOS 7 中通过编译源码方式安装 MySQL 数据库的详细步骤,包括准备工作、下载源码、编译安装、配置 MySQL 服务、登录设置等。
本文介绍了在 CentOS 7 中通过编译源码方式安装 MySQL 数据库的详细步骤,包括准备工作、下载源码、编译安装、配置 MySQL 服务、登录设置等。同时,文章还对比了编译源码安装与使用 RPM 包安装的优缺点,帮助读者根据需求选择最合适的方法。通过具体案例,展示了编译源码安装的灵活性和定制性。
61 2