简单的说下什么是数据仓库-阿里云开发者社区

开发者社区> 浣熊干面包> 正文

简单的说下什么是数据仓库

简介:
+关注继续查看

一般的数据库是一个操作型的数据存储工具,比如一个学校的选课系统的数据库,学生选课系统由教务处建设和管理,主要用于课程的排课和学生的选课,教务处人员可以在选课系统中增加、修改、删除和查询排课信息,学生也可以在选课系统中对选课信息进行操作。由于该数据库面向的是选课,所以记录的是与课程安排与选课的信息,其数据库模型简化如下图所示:

image

与一般操作型的数据库不同的是数据仓库主要是面向查询操作,而且查询的数据来自于多个数据库系统。同样以一个学校为例,学校除了选课系统以外还有人力资源系统(HR系统)用于管理教师信息、学籍管理系统管理学生的学籍信息等。

HR系统是由人事处建设和管理的,主要保存与教师相关的信息,所以该系统中不会出现学生的信息,其系统数据库模型如下图所示:

image

学籍管理系统是由学生处建设和管理,数据库中保存了学生的学历、毕业去向、家庭情况等基本信息外还保存了学生每学期的考试成绩等信息。由于该系统关注的是学生,所以不会出现教师的信息,其系统数据库模型如下图所示:

image

由于不同的系统由不同的部门和人员建设和管理,保存了不同的信息,如果需要进行数据的联合查询,而查询的数据又存放在不同的数据库中,那么就需要将这3个系统数据库的信息集成在一起,放在一个数据模型中,形成数据仓库,以便对教师信息、学生信息和选课信息进行联合的查询,建立的数据仓库模型如下图所示: 
image

例如要查询一次教师的培训是否对教师所教学生的成绩有影响,以便决定是否对教师进行下一步的培训,则只能在数据仓库中才能完成,因为教师的培训信息和学生的成绩是存放在不同的系统中,相互独立,查询单独的一个数据库是没办法完成的。

数据仓库与一般数据库比较,还有一个特点是记录了数据变更历史。在数据库中对数据进行的修改一般是直接在数据行上进行更新操作,所以只记录最新的数据结果,而数据仓库则会记录每天数据的变动情况,将变动之前的数据和变动后的数据都保存在数据仓库中,以便进行时间序列分析。

同样以学校的3个数据库和数据仓库为例,在HR系统中记录了每个教师的基本信息,其中一项是教师的职称。教师职称变动时只需在HR数据库中修改该教师的职称字段即可。如果要查询一个教授从刚开始的讲师到现在的教授不同的职称情况下所教学生的平均成绩情况,则需要从数据仓库中查出该教师每次职称变动的时间,然后统计每个时间段内该教师所教课程所教学生的平均成绩即可得出结果,而这个查询在HR数据库是没办法实现的。

本文转自深蓝居博客园博客,原文链接:http://www.cnblogs.com/studyzy/archive/2010/07/09/1774642.html,如需转载请自行联系原作者

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
数据仓库专题(3)-分布式数据仓库事实表设计思考
一、前言   最近在设计数据仓库的数据逻辑模型,考虑到海量数据存储在分布式数据仓库中的技术架构模式,需要针对传统的面相关系型数据仓库的数据存储模型进行技术改造。设计出一套真正适合分布式数据仓库的数据存储模型。
1044 0
阿里云服务器怎么设置密码?怎么停机?怎么重启服务器?
如果在创建实例时没有设置密码,或者密码丢失,您可以在控制台上重新设置实例的登录密码。本文仅描述如何在 ECS 管理控制台上修改实例登录密码。
10062 0
阿里云服务器端口号设置
阿里云服务器初级使用者可能面临的问题之一. 使用tomcat或者其他服务器软件设置端口号后,比如 一些不是默认的, mysql的 3306, mssql的1433,有时候打不开网页, 原因是没有在ecs安全组去设置这个端口号. 解决: 点击ecs下网络和安全下的安全组 在弹出的安全组中,如果没有就新建安全组,然后点击配置规则 最后如上图点击添加...或快速创建.   have fun!  将编程看作是一门艺术,而不单单是个技术。
10882 0
什么是数据湖分析?
数据湖分析(Data Lake Analytics,DLA)是无服务器(Serverless)化的云上交互式查询分析服务。无需ETL,就可通过DLA在云上通过标准JDBC直接对阿里云OSS,TableStore,RDS,MongoDB等不同数据源中存储的数据进行查询和分析。
683 0
阿里云服务器如何登录?阿里云服务器的三种登录方法
购买阿里云ECS云服务器后如何登录?场景不同,阿里云优惠总结大概有三种登录方式: 登录到ECS云服务器控制台 在ECS云服务器控制台用户可以更改密码、更换系.
13875 0
阿里云ECS云服务器初始化设置教程方法
阿里云ECS云服务器初始化是指将云服务器系统恢复到最初状态的过程,阿里云的服务器初始化是通过更换系统盘来实现的,是免费的,阿里云百科网分享服务器初始化教程: 服务器初始化教程方法 本文的服务器初始化是指将ECS云服务器系统恢复到最初状态,服务器中的数据也会被清空,所以初始化之前一定要先备份好。
11888 0
AnalyticDB for PostgreSQL 实时数据仓库上手指南
AnalyticDB for PostgreSQL 提供企业级数据仓库云服务,基于开源Greenplum构建,采用MPP架构,支持1000+节点PB级数据的实时分析。
4780 0
自研云原生数据仓库AnalyticDB再破权威评测TPC-DS世界纪录!
阿里云自研云原生数据仓库AnalyticDB连续两年成为TPC-DS榜单第一的数据仓库! 性能较前世界纪录提升29%,单位成本仅为其1/3。
2055 0
阿里云ECS云服务器初始化设置教程方法
阿里云ECS云服务器初始化是指将云服务器系统恢复到最初状态的过程,阿里云的服务器初始化是通过更换系统盘来实现的,是免费的,阿里云百科网分享服务器初始化教程: 服务器初始化教程方法 本文的服务器初始化是指将ECS云服务器系统恢复到最初状态,服务器中的数据也会被清空,所以初始化之前一定要先备份好。
7361 0
941
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载