一、数据仓库简介
数据仓库 简介 :
用途 : 作为 DSS ( Decision Support System 决策支持系统 ) 服务基础的 分析型数据库 ;
数据 : 用于存储 大量的 只读数据 ;
应用场景 : 为管理者 决策 提供相关信息 ;
数据仓库 与操作系统分离 , 基于标准的企业模型集成 , 带时间属性 , 面向主题 , 不可更新 的 数据集合 ;
二、操作型数据与分析型数据对比
操作型数据 分析型数据
① 数据粒度 细节的 综合的
② 数据时效 存储瞬间准确 过去的历史数据
③ 是否只读 可更新 不可更新
④ 需求可知 操作时实现知道需求 操作时事先不知道需求
⑤ 生命周期 生命周期符合 SDLC 完全不同的生命周期
⑥ 性能要求 性能要求高 性能要求低
⑦ 操作大小 同一时刻操作一个单元的数据 同一时刻操作一个集合的数据
⑧ 数据大小 单词操作数据量小 单词操作数据量大
⑨ 驱动力量 事务驱动 分析驱动
⑩ 具体用途 面向应用 面向分析
⑪ 应用场景 支持日常操作 支持管理需求
三、数据仓库 特征 与 定义
数据仓库特征 :
面向主题
集成
不可更新
随时间不断变化
数据仓库定义 : 数据仓库 是 用于 更好地 支持 企业 / 组织 决策分析处理 , 面向主题的 , 集成的 , 不可更新的 , 随时间不断变化的 数据集合 ;
四、特征一 : 面向主题 数据组织方式
主题 :
主题是一个抽象 : 使用该抽象 , 在较高层次上 , 将企业信息系统中的数据 , 进行综合 , 归类 , 并进行分析利用 ;
逻辑意义 : 企业中 某个 宏观分析领域 涉及的分析对象 ;
较高层次 :
层次较高 : 相对于 面向应用 的 数据组织方式 , 层次较高
抽象级别 : 按照主题进行 数据组织方式 , 数据的抽象级别较高
面向主题 数据组织方式 特点 :
描述 : 对 分析对象的数据 的 , 完整的 , 一致的 , 描述 ;
内容 : 完整 , 统一 , 刻画 , 各个分析对象 , 涉及的数据 , 及数据对象之间的关系 ;
五、面向应用 数据组织方式
面向应用 数据组织方式 特点 :
调查收集需求 : 需要详细调查企业中相关组织 , 部门 , 收集数据库 基础数据 , 及 数据的处理过程 ; ( 这是在需求分析阶段进行的工作 )
组织数据依据 : 反映 企业内部的组织结构 , 业务活动特点 ;
数据组织本质 : 反映 组织 , 部门 , 内部数据 动态特征 , 每个部门的业务处理的 : 输入 , 处理 , 输出 , 的数据
数据组织方式 : 按 实际应用的 业务处理流程 组织 ;
数据组织目的 : 提供 OLTP 业务处理的速度 , 和 准确性 ;
存储介质改变 : OLTP 应用只是将传统的业务活动 , 从纸质介质 , 转为电子信息 , 系统中的数据 与 现实中被替代的纸质文档对应 ;
上述 OLTP 面向应用的数据组织 , 数据 , 与 数据处理 是分开的 , 一个客观实体的数据 , 与不同的应用场景捆绑 , 无法统一 , 分散存储在不同的表中 , 如商品信息 , 分别存储在采购子系统 , 销售子系统 , 库存子系统中 , 数据被分开存储 ;
面向应用 数据组织方式 缺点 : 数据抽象程度太低 , 数据 与 应用没有分离 ;
引入数据仓库 : 应该将 数据 从 数据处理 中抽象出来 , 组成和具体应用独立的 数据仓库 ;
面向应用 数据组织方式 优点 :
操作性好 : 将 数据库 与 企业的业务逻辑 对应 , 可操作性高 ;
方便转换 : 方便 企业 将原有的纸质业务 , 转为计算机处理的业务 ;
支持 OLTP 应用