文章目录
一、特征一 : 面向主题 数据组织方式
二、特征二 : 数据集成
三、特征三 : 数据不可更新
四、特征四 : 数据仓库中的数据 随时间不断变化
一、特征一 : 面向主题 数据组织方式
主题 :
主题是一个抽象 : 使用该抽象 , 在较高层次上 , 将企业信息系统中的数据 , 进行综合 , 归类 , 并进行分析利用 ;
逻辑意义 : 企业中 某个 宏观分析领域 涉及的分析对象 ;
较高层次 :
层次较高 : 相对于 面向应用 的 数据组织方式 , 层次较高
抽象级别 : 按照主题进行 数据组织方式 , 数据的抽象级别较高
面向主题 数据组织方式 特点 :
描述 : 对 分析对象的数据 的 , 完整的 , 一致的 , 描述 ;
内容 : 完整 , 统一 , 刻画 , 各个分析对象 , 涉及的数据 , 及数据对象之间的关系 ;
详情参考 : 【DBMS 数据库管理系统】数据仓库 ( 数据仓库简介 | 操作型数据与分析性数据对比 | 数据仓库特征 | 特征一 : 面向主题组织数据 | 面向应用 | ) 四、特征一 : 面向主题 数据组织方式
二、特征二 : 数据集成
数据集成含义 :
数据来源 : 从各个 子系统中的 分散的 OLTP 数据库 中 抽取 , 清洗 , 综合 , 得到 ;
重要性 : 数据集成 是 数据仓库 创建 中 , 最关键 , 最复杂 的步骤 ;
数据集成 :
数据统一 : 不同的数据来源 , 统一数据格式 , 包括 : 字段名称 , 字段含义 , 数据单位 , 数据长度 等 ;
综合计算 : 对数据进行 综合 , 计算 ; 其中包含下面的 综合时间生成 ;
综合时间 : 抽取数据时 生成综合时间 , 数据抽取完毕后 在 数据仓库 内部 生成综合时间 ;
三、特征三 : 数据不可更新
特征三 : 数据不可更新 :
历史数据 : 数据仓库中的数据都是历史数据 ;
查询操作 : 一般情况下 , 只能查询数据 , 不能对数据仓库中的数据进行 增删改 操作 ;
删除操作 : 数据仓库中的数据超过期限后 , 可以删除 , 但是这是 数据仓库维护范畴的概念 , 不是用户操作的 ;
数据仓库管理系统 :
简化数据管理 : 由于不能进行 增删改 操作 , 只能进行查询操作 , 一些数据管理功能可以简化 , 如 事务处理 , 脏数据 , 版本不一致 等功能可以简化 ;
数据查询要求 : 需要支持大数据查询 , 有友好的查询界面 , 分析结果直观 ;
四、特征四 : 数据仓库中的数据 随时间不断变化
特征四 : 数据仓库中的数据 随时间不断变化 :
数据仓库数据不可更新 : 针对用户而言 , 数据仓库中的数据 , 只能查询 , 不能 增删改 ;
定期更新数据仓库数据 : 数据仓库中的数据是需要定期更新的 , 这属于数据仓库管理员的工作 , 属于数据仓库维护范畴的工作 ;
数据保存时间 :
OLTP 数据库 : 操作型数据库 一般保存 2 ~ 3 个月的历史数据 ;
OLAP 数据仓库 : 分析型数据仓库 一般保存 5 ~ 10 年历史数据 ;
数据仓库数据 随时间变化 :
增加新数据 : 随着时间变化 , 数据仓库中需要添加最细的数据 , 定期更新数据 ;
删除旧数据 : 随着时间变化 , 数据仓库中旧的历史数据需要删除 ;
时间相关综合数据 : 数据仓库中需要维护大量与时间相关的综合数据 ;
时间相关的综合数据 :
时间段 : 按时间段 进行数据综合 ;
抽样 : 每隔一定时间片 , 进行数据抽样 ;
重新综合 : 随时间变化 , 不断重新综合数据 ;
数据仓库码键 : 时间项包含在数据仓库的码键中 , 可以从码键中看出数据的历史时期 ;