开发者社区> 韩曙亮> 正文

【DBMS 数据库管理系统】数据仓库 ( 数据仓库简介 | 操作型数据与分析性数据对比 | 数据仓库特征 | 特征一 : 面向主题组织数据 | 面向应用 | )(一)

简介: 【DBMS 数据库管理系统】数据仓库 ( 数据仓库简介 | 操作型数据与分析性数据对比 | 数据仓库特征 | 特征一 : 面向主题组织数据 | 面向应用 | )(一)
+关注继续查看

一、数据仓库简介


数据仓库 简介 :


用途 : 作为 DSS ( Decision Support System 决策支持系统 ) 服务基础的 分析型数据库 ;


数据 : 用于存储 大量的 只读数据 ;


应用场景 : 为管理者 决策 提供相关信息 ;


数据仓库 与操作系统分离 , 基于标准的企业模型集成 , 带时间属性 , 面向主题 , 不可更新 的 数据集合 ;






二、操作型数据与分析型数据对比


操作型数据 分析型数据

① 数据粒度 细节的 综合的

② 数据时效 存储瞬间准确 过去的历史数据

③ 是否只读 可更新 不可更新

④ 需求可知 操作时实现知道需求 操作时事先不知道需求

⑤ 生命周期 生命周期符合 SDLC 完全不同的生命周期

⑥ 性能要求 性能要求高 性能要求低

⑦ 操作大小 同一时刻操作一个单元的数据 同一时刻操作一个集合的数据

⑧ 数据大小 单词操作数据量小 单词操作数据量大

⑨ 驱动力量 事务驱动 分析驱动

⑩ 具体用途 面向应用 面向分析

⑪ 应用场景 支持日常操作 支持管理需求





三、数据仓库 特征 与 定义


数据仓库特征 :


面向主题

集成

不可更新

随时间不断变化

数据仓库定义 : 数据仓库 是 用于 更好地 支持 企业 / 组织 决策分析处理 , 面向主题的 , 集成的 , 不可更新的 , 随时间不断变化的 数据集合 ;






四、特征一 : 面向主题 数据组织方式


主题 :


主题是一个抽象 : 使用该抽象 , 在较高层次上 , 将企业信息系统中的数据 , 进行综合 , 归类 , 并进行分析利用 ;

逻辑意义 : 企业中 某个 宏观分析领域 涉及的分析对象 ;


较高层次 :


层次较高 : 相对于 面向应用 的 数据组织方式 , 层次较高

抽象级别 : 按照主题进行 数据组织方式 , 数据的抽象级别较高


面向主题 数据组织方式 特点 :


描述 : 对 分析对象的数据 的 , 完整的 , 一致的 , 描述 ;

内容 : 完整 , 统一 , 刻画 , 各个分析对象 , 涉及的数据 , 及数据对象之间的关系 ;





五、面向应用 数据组织方式


面向应用 数据组织方式 特点 :


调查收集需求 : 需要详细调查企业中相关组织 , 部门 , 收集数据库 基础数据 , 及 数据的处理过程 ; ( 这是在需求分析阶段进行的工作 )

组织数据依据 : 反映 企业内部的组织结构 , 业务活动特点 ;

数据组织本质 : 反映 组织 , 部门 , 内部数据 动态特征 , 每个部门的业务处理的 : 输入 , 处理 , 输出 , 的数据

数据组织方式 : 按 实际应用的 业务处理流程 组织 ;

数据组织目的 : 提供 OLTP 业务处理的速度 , 和 准确性 ;

存储介质改变 : OLTP 应用只是将传统的业务活动 , 从纸质介质 , 转为电子信息 , 系统中的数据 与 现实中被替代的纸质文档对应 ;


上述 OLTP 面向应用的数据组织 , 数据 , 与 数据处理 是分开的 , 一个客观实体的数据 , 与不同的应用场景捆绑 , 无法统一 , 分散存储在不同的表中 , 如商品信息 , 分别存储在采购子系统 , 销售子系统 , 库存子系统中 , 数据被分开存储 ;



面向应用 数据组织方式 缺点 : 数据抽象程度太低 , 数据 与 应用没有分离 ;


引入数据仓库 : 应该将 数据 从 数据处理 中抽象出来 , 组成和具体应用独立的 数据仓库 ;



面向应用 数据组织方式 优点 :


操作性好 : 将 数据库 与 企业的业务逻辑 对应 , 可操作性高 ;

方便转换 : 方便 企业 将原有的纸质业务 , 转为计算机处理的业务 ;

支持 OLTP 应用



版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
【操作系统】3、存储管理
计算机的工作方式可以归结为两种基本能力,即存储程序和自动地执行程序,前者靠存储器实现,后者靠CPU实现。计算机的工作原理即不断地从内存 中取出一条条指令放在CPU中运行。
839 0
基于TableStore的数据采集分析系统介绍
摘要 在互联网高度发达的今天,ipad、手机等智能终端设备随处可见,运行在其中的APP、网站也非常多,如何采集终端数据进行分析,提升软件的品质非常重要,例如PV/UV统计、用户行为数据统计与分析等。虽然场景简单,但是数据量大,对系统的吞吐量、实时性、分析能力、查询能力都有较高的要求,搭建起来并不容易。
7190 0
【操作系统】2、进程管理与死锁
1、进程 所谓进程,可以认为是一个程序及其正在运行的过程。相对来说,程序是一个静态的概念,而进程是一个动态的概念,更加强调程序运行的过程和状态。一般一个进程至少要包含几个内容,即程序代码、程序处理的数据、CPU寄存器的值、堆和栈以及进程所占用的系统资源。
866 0
MODIS数据的简介和下载(二)——MODIS数据下载方式(FTP)
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/ESA_DSQ/article/details/70171937 前一篇我们已经介绍了MODIS数据的简介、参数以及相关的典型应用。
1413 0
数据仓库建设步骤
数据仓库建设步骤Posted on 2015-03-04 10:18 xuzhengzhu 阅读(1164) 评论(0) 编辑 收藏 1.系统分析,确定主题 确定一下几个因素:    ·操作出现的频率,即业务部门每隔多长时间做一次查询分析。
1579 0
大数据简介
第三次信息浪潮: 大数据 、 云计算 、 物联网 大数据 、 云计算 、 物联网区别和联系: 云计算 通过网络提供廉价的计算能力叫云计算。 saas 软件既是服务 software as a service paas 平台既是服务 platform as a service lass 基础设施即时服务 infrastructure as a service 虚拟化,分布式存储,分布式计算,多租户 物联网 把人,物,物与物互相关联叫物联网。
945 0
创业公司如何做数据分析(五)微信分享追踪系统
微信分享,早已成为移动互联网运营的主要方向之一,这部分数据驱动了公司去年近一半的推广业务!本文重点探讨如何搭建微信分享追踪系统,利用微信庞大的好友关系进行传播,实现宣传、拉新等营销目的。
3850 0
+关注
韩曙亮
专注 Android 领域
2605
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
JS零基础入门教程(上册)
立即下载
性能优化方法论
立即下载
手把手学习日志服务SLS,云启实验室实战指南
立即下载