【DBMS 数据库管理系统】数据仓库特征 ( 特征一 : 面向主题组织数据 | 特征二 : 数据集成 | 特征三 : 数据不可更新 | 特征四 : 随时间不断变化 )

简介: 【DBMS 数据库管理系统】数据仓库特征 ( 特征一 : 面向主题组织数据 | 特征二 : 数据集成 | 特征三 : 数据不可更新 | 特征四 : 随时间不断变化 )

文章目录

一、特征一 : 面向主题 数据组织方式

二、特征二 : 数据集成

三、特征三 : 数据不可更新

四、特征四 : 数据仓库中的数据 随时间不断变化





一、特征一 : 面向主题 数据组织方式


主题 :


主题是一个抽象 : 使用该抽象 , 在较高层次上 , 将企业信息系统中的数据 , 进行综合 , 归类 , 并进行分析利用 ;

逻辑意义 : 企业中 某个 宏观分析领域 涉及的分析对象 ;


较高层次 :


层次较高 : 相对于 面向应用 的 数据组织方式 , 层次较高

抽象级别 : 按照主题进行 数据组织方式 , 数据的抽象级别较高


面向主题 数据组织方式 特点 :


描述 : 对 分析对象的数据 的 , 完整的 , 一致的 , 描述 ;

内容 : 完整 , 统一 , 刻画 , 各个分析对象 , 涉及的数据 , 及数据对象之间的关系 ;


详情参考 : 【DBMS 数据库管理系统】数据仓库 ( 数据仓库简介 | 操作型数据与分析性数据对比 | 数据仓库特征 | 特征一 : 面向主题组织数据 | 面向应用 | ) 四、特征一 : 面向主题 数据组织方式






二、特征二 : 数据集成


数据集成含义 :


数据来源 : 从各个 子系统中的 分散的 OLTP 数据库 中 抽取 , 清洗 , 综合 , 得到 ;

重要性 : 数据集成 是 数据仓库 创建 中 , 最关键 , 最复杂 的步骤 ;


数据集成 :


数据统一 : 不同的数据来源 , 统一数据格式 , 包括 : 字段名称 , 字段含义 , 数据单位 , 数据长度 等 ;

综合计算 : 对数据进行 综合 , 计算 ; 其中包含下面的 综合时间生成 ;

综合时间 : 抽取数据时 生成综合时间 , 数据抽取完毕后 在 数据仓库 内部 生成综合时间 ;





三、特征三 : 数据不可更新


特征三 : 数据不可更新 :


历史数据 : 数据仓库中的数据都是历史数据 ;

查询操作 : 一般情况下 , 只能查询数据 , 不能对数据仓库中的数据进行 增删改 操作 ;

删除操作 : 数据仓库中的数据超过期限后 , 可以删除 , 但是这是 数据仓库维护范畴的概念 , 不是用户操作的 ;


数据仓库管理系统 :


简化数据管理 : 由于不能进行 增删改 操作 , 只能进行查询操作 , 一些数据管理功能可以简化 , 如 事务处理 , 脏数据 , 版本不一致 等功能可以简化 ;

数据查询要求 : 需要支持大数据查询 , 有友好的查询界面 , 分析结果直观 ;





四、特征四 : 数据仓库中的数据 随时间不断变化


特征四 : 数据仓库中的数据 随时间不断变化 :


数据仓库数据不可更新 : 针对用户而言 , 数据仓库中的数据 , 只能查询 , 不能 增删改 ;

定期更新数据仓库数据 : 数据仓库中的数据是需要定期更新的 , 这属于数据仓库管理员的工作 , 属于数据仓库维护范畴的工作 ;


数据保存时间 :


OLTP 数据库 : 操作型数据库 一般保存 2 ~ 3 个月的历史数据 ;

OLAP 数据仓库 : 分析型数据仓库 一般保存 5 ~ 10 年历史数据 ;


数据仓库数据 随时间变化 :


增加新数据 : 随着时间变化 , 数据仓库中需要添加最细的数据 , 定期更新数据 ;

删除旧数据 : 随着时间变化 , 数据仓库中旧的历史数据需要删除 ;

时间相关综合数据 : 数据仓库中需要维护大量与时间相关的综合数据 ;


时间相关的综合数据 :


时间段 : 按时间段 进行数据综合 ;

抽样 : 每隔一定时间片 , 进行数据抽样 ;

重新综合 : 随时间变化 , 不断重新综合数据 ;


数据仓库码键 : 时间项包含在数据仓库的码键中 , 可以从码键中看出数据的历史时期 ;


目录
相关文章
|
11月前
|
缓存 NoSQL Linux
在CentOS 7系统中彻底移除MongoDB数据库的步骤
以上步骤完成后,MongoDB应该会从您的CentOS 7系统中被彻底移除。在执行上述操作前,请确保已经备份好所有重要数据以防丢失。这些步骤操作需要一些基本的Linux系统管理知识,若您对某一步骤不是非常清楚,请先进行必要的学习或咨询专业人士。在执行系统级操作时,推荐在实施前创建系统快照或备份,以便在出现问题时能够恢复到原先的状态。
1202 79
|
10月前
|
存储 数据管理 数据库
数据字典是什么?和数据库、数据仓库有什么关系?
在数据处理中,你是否常困惑于字段含义、指标计算或数据来源?数据字典正是解答这些问题的关键工具,它清晰定义数据的名称、类型、来源、计算方式等,服务于开发者、分析师和数据管理者。本文详解数据字典的定义、组成及其与数据库、数据仓库的关系,助你夯实数据基础。
数据字典是什么?和数据库、数据仓库有什么关系?
|
9月前
|
数据采集 关系型数据库 MySQL
python爬取数据存入数据库
Python爬虫结合Scrapy与SQLAlchemy,实现高效数据采集并存入MySQL/PostgreSQL/SQLite。通过ORM映射、连接池优化与批量提交,支持百万级数据高速写入,具备良好的可扩展性与稳定性。
|
9月前
|
人工智能 Java 关系型数据库
使用数据连接池进行数据库操作
使用数据连接池进行数据库操作
231 11
|
9月前
|
安全 关系型数据库 数据管理
阿里云数据库:构建高性能与安全的数据管理系统
阿里云数据库提供RDS、PolarDB、Tair等核心产品,具备高可用、弹性扩展、安全合规及智能运维等技术优势,广泛应用于电商、游戏、金融等行业,助力企业高效管理数据,提升业务连续性与竞争力。
|
10月前
|
存储 关系型数据库 数据库
【赵渝强老师】PostgreSQL数据库的WAL日志与数据写入的过程
PostgreSQL中的WAL(预写日志)是保证数据完整性的关键技术。在数据修改前,系统会先将日志写入WAL,确保宕机时可通过日志恢复数据。它减少了磁盘I/O,提升了性能,并支持手动切换日志文件。WAL文件默认存储在pg_wal目录下,采用16进制命名规则。此外,PostgreSQL提供pg_waldump工具解析日志内容。
967 0
|
11月前
|
SQL 监控 安全
数据库安全审计系统
Next-DBM数据库审计系统助力企业解决数据安全难题,提供统一身份管理、全方位监控、智能风险识别、完整审计追溯及精细化权限管控,有效防范数据泄露与内部威胁,保障企业核心资产安全,满足合规要求,提升运维效率。
|
数据采集 DataWorks 监控
DataWorks产品使用合集之数据集成并发数不支持批量修改,该怎么办
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
271 0
|
SQL 弹性计算 DataWorks
Flink CDC 在阿里云 DataWorks 数据集成入湖场景的应用实践
Flink CDC 在阿里云 DataWorks 数据集成入湖场景的应用实践
797 6

热门文章

最新文章