【DBMS 数据库管理系统】数据仓库特征 ( 特征一 : 面向主题组织数据 | 特征二 : 数据集成 | 特征三 : 数据不可更新 | 特征四 : 随时间不断变化 )

简介: 【DBMS 数据库管理系统】数据仓库特征 ( 特征一 : 面向主题组织数据 | 特征二 : 数据集成 | 特征三 : 数据不可更新 | 特征四 : 随时间不断变化 )

文章目录

一、特征一 : 面向主题 数据组织方式

二、特征二 : 数据集成

三、特征三 : 数据不可更新

四、特征四 : 数据仓库中的数据 随时间不断变化





一、特征一 : 面向主题 数据组织方式


主题 :


主题是一个抽象 : 使用该抽象 , 在较高层次上 , 将企业信息系统中的数据 , 进行综合 , 归类 , 并进行分析利用 ;

逻辑意义 : 企业中 某个 宏观分析领域 涉及的分析对象 ;


较高层次 :


层次较高 : 相对于 面向应用 的 数据组织方式 , 层次较高

抽象级别 : 按照主题进行 数据组织方式 , 数据的抽象级别较高


面向主题 数据组织方式 特点 :


描述 : 对 分析对象的数据 的 , 完整的 , 一致的 , 描述 ;

内容 : 完整 , 统一 , 刻画 , 各个分析对象 , 涉及的数据 , 及数据对象之间的关系 ;


详情参考 : 【DBMS 数据库管理系统】数据仓库 ( 数据仓库简介 | 操作型数据与分析性数据对比 | 数据仓库特征 | 特征一 : 面向主题组织数据 | 面向应用 | ) 四、特征一 : 面向主题 数据组织方式






二、特征二 : 数据集成


数据集成含义 :


数据来源 : 从各个 子系统中的 分散的 OLTP 数据库 中 抽取 , 清洗 , 综合 , 得到 ;

重要性 : 数据集成 是 数据仓库 创建 中 , 最关键 , 最复杂 的步骤 ;


数据集成 :


数据统一 : 不同的数据来源 , 统一数据格式 , 包括 : 字段名称 , 字段含义 , 数据单位 , 数据长度 等 ;

综合计算 : 对数据进行 综合 , 计算 ; 其中包含下面的 综合时间生成 ;

综合时间 : 抽取数据时 生成综合时间 , 数据抽取完毕后 在 数据仓库 内部 生成综合时间 ;





三、特征三 : 数据不可更新


特征三 : 数据不可更新 :


历史数据 : 数据仓库中的数据都是历史数据 ;

查询操作 : 一般情况下 , 只能查询数据 , 不能对数据仓库中的数据进行 增删改 操作 ;

删除操作 : 数据仓库中的数据超过期限后 , 可以删除 , 但是这是 数据仓库维护范畴的概念 , 不是用户操作的 ;


数据仓库管理系统 :


简化数据管理 : 由于不能进行 增删改 操作 , 只能进行查询操作 , 一些数据管理功能可以简化 , 如 事务处理 , 脏数据 , 版本不一致 等功能可以简化 ;

数据查询要求 : 需要支持大数据查询 , 有友好的查询界面 , 分析结果直观 ;





四、特征四 : 数据仓库中的数据 随时间不断变化


特征四 : 数据仓库中的数据 随时间不断变化 :


数据仓库数据不可更新 : 针对用户而言 , 数据仓库中的数据 , 只能查询 , 不能 增删改 ;

定期更新数据仓库数据 : 数据仓库中的数据是需要定期更新的 , 这属于数据仓库管理员的工作 , 属于数据仓库维护范畴的工作 ;


数据保存时间 :


OLTP 数据库 : 操作型数据库 一般保存 2 ~ 3 个月的历史数据 ;

OLAP 数据仓库 : 分析型数据仓库 一般保存 5 ~ 10 年历史数据 ;


数据仓库数据 随时间变化 :


增加新数据 : 随着时间变化 , 数据仓库中需要添加最细的数据 , 定期更新数据 ;

删除旧数据 : 随着时间变化 , 数据仓库中旧的历史数据需要删除 ;

时间相关综合数据 : 数据仓库中需要维护大量与时间相关的综合数据 ;


时间相关的综合数据 :


时间段 : 按时间段 进行数据综合 ;

抽样 : 每隔一定时间片 , 进行数据抽样 ;

重新综合 : 随时间变化 , 不断重新综合数据 ;


数据仓库码键 : 时间项包含在数据仓库的码键中 , 可以从码键中看出数据的历史时期 ;


目录
相关文章
|
3月前
|
SQL 人工智能 JSON
Flink 2.1 SQL:解锁实时数据与AI集成,实现可扩展流处理
简介:本文整理自阿里云高级技术专家李麟在Flink Forward Asia 2025新加坡站的分享,介绍了Flink 2.1 SQL在实时数据处理与AI融合方面的关键进展,包括AI函数集成、Join优化及未来发展方向,助力构建高效实时AI管道。
777 43
|
3月前
|
SQL 人工智能 JSON
Flink 2.1 SQL:解锁实时数据与AI集成,实现可扩展流处理
本文整理自阿里云的高级技术专家、Apache Flink PMC 成员李麟老师在 Flink Forward Asia 2025 新加坡[1]站 —— 实时 AI 专场中的分享。将带来关于 Flink 2.1 版本中 SQL 在实时数据处理和 AI 方面进展的话题。
278 0
Flink 2.1 SQL:解锁实时数据与AI集成,实现可扩展流处理
|
4月前
|
缓存 NoSQL Linux
在CentOS 7系统中彻底移除MongoDB数据库的步骤
以上步骤完成后,MongoDB应该会从您的CentOS 7系统中被彻底移除。在执行上述操作前,请确保已经备份好所有重要数据以防丢失。这些步骤操作需要一些基本的Linux系统管理知识,若您对某一步骤不是非常清楚,请先进行必要的学习或咨询专业人士。在执行系统级操作时,推荐在实施前创建系统快照或备份,以便在出现问题时能够恢复到原先的状态。
411 79
|
2月前
|
安全 关系型数据库 数据管理
阿里云数据库:构建高性能与安全的数据管理系统
阿里云数据库提供RDS、PolarDB、Tair等核心产品,具备高可用、弹性扩展、安全合规及智能运维等技术优势,广泛应用于电商、游戏、金融等行业,助力企业高效管理数据,提升业务连续性与竞争力。
|
7月前
|
前端开发 数据库
会议室管理系统源码(含数据库脚本)
会议室管理系统源码(含数据库脚本)
127 0
|
3月前
|
SQL 关系型数据库 Apache
从 Flink 到 Doris 的实时数据写入实践 —— 基于 Flink CDC 构建更实时高效的数据集成链路
本文将深入解析 Flink-Doris-Connector 三大典型场景中的设计与实现,并结合 Flink CDC 详细介绍了整库同步的解决方案,助力构建更加高效、稳定的实时数据处理体系。
1703 0
从 Flink 到 Doris 的实时数据写入实践 —— 基于 Flink CDC 构建更实时高效的数据集成链路
|
3月前
|
机器学习/深度学习 SQL 大数据
什么是数据集成?和数据融合有什么区别?
在大数据领域,“数据集成”与“数据融合”常被混淆。数据集成关注数据的物理集中,解决“数据从哪来”的问题;数据融合则侧重逻辑协同,解决“数据怎么用”的问题。两者相辅相成,集成是基础,融合是价值提升的关键。理解其差异,有助于企业释放数据潜力,避免“数据堆积”或“盲目融合”的误区,实现数据从成本到生产力的转变。
什么是数据集成?和数据融合有什么区别?
|
4月前
|
SQL 监控 安全
数据库安全审计系统
Next-DBM数据库审计系统助力企业解决数据安全难题,提供统一身份管理、全方位监控、智能风险识别、完整审计追溯及精细化权限管控,有效防范数据泄露与内部威胁,保障企业核心资产安全,满足合规要求,提升运维效率。
|
5月前
|
运维 安全 数据管理
Dataphin V5.1 企业级发布:全球数据无缝集成,指标管理全新升级!
企业数据管理难题?Dataphin 5.1版来解决!聚焦跨云数据、研发效率、指标管理和平台运维四大场景,助力数据团队轻松应对挑战。无论是统一指标标准、快速定位问题,还是提升管理安全性,Dataphin都能提供强大支持。3分钟了解新版本亮点,让数据治理更高效!
104 0
|
7月前
|
Java 数据库
jsp CRM客户管理系统(含数据库脚本以及文档)
jsp CRM客户管理系统(含数据库脚本以及文档)
163 10
下一篇
oss云网关配置