数据仓库复习(一)

简介: 对数据仓库基本内容进行概述

概念

数据仓库概念创始人在《建立数据仓库》一书中对数据仓库的定义是:数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、数据集成的(Integrated)、相对稳定(非易失)的(Non-Volatile)、反映历史变化(时变)(Time Variant)的数据集合,用于支持管理决策(Decision Making Support)。

数据仓库是决策支持系统(dss)的结构化数据环境。

OLAP与OLTP

  • OLTP是联机事务处理,面向交易的处理过程,常见于ERP系统、CRM系统、电商系统等,特点是操作繁琐,数据量小
  • OLAP是联机分析处理,是面向决策的系统,支持复杂的分析操作,特点是数据量大,且主要为查询操作。
对比项目 OLTP OLAP
功能 面向交易的事务处理 面向分析查询
设计 面向业务 面向主题
数据 最新数据,二维数据 历史数据,多维数据

数据仓库特点

面向主题

数据库应用是以业务流程来划分应用程序和数据库,比如人力资源管理系统、财务管理系统等等

数据仓库是以数据分析需求来对数据进行组织划分若干主题,比如销售主题、产品主题。

主题的意义在于:以分析需求为导向来组织数据,可以跨库分析,解决数据孤岛问题。

数据集成

主题中的数据是跨应用系统的,也就是说数据是分散在各各应用系统

数据非易失

为了保证数据分析的准确性和稳定性,数据仓库中的数据一般是很少更新的,会将历史快照保存下来

时变

  • 增加新数据
  • 删除过期数据
  • 历史数据明细进行聚合

系统架构

目录
相关文章
|
存储 数据采集 监控
【2022持续更新】大数据最全知识点整理-数据仓库篇
【2022持续更新】大数据最全知识点整理-数据仓库篇
1743 0
【2022持续更新】大数据最全知识点整理-数据仓库篇
|
存储 数据挖掘 大数据
第16章 数据仓库与联机分析处理技术——复习笔记
第16章 数据仓库与联机分析处理技术——复习笔记
|
SQL 数据采集 存储
数据仓库实战 1
数据仓库实战 1
212 0
|
关系型数据库 MySQL 开发工具
|
数据库
|
存储 数据挖掘 数据管理
数据仓库概论
数据仓库,英文名称Data Warehouse,可简写为DW和DWH,数据仓库顾名思义,是一个很大的数据存储集合,出于企业的分析性报告和决策支持目的而创建,它为企业提供一定的BI(商业智能)能力,指导业务流程改进、监视时间、成本、质量以及控制。数据库:数据库是面向交易的处理系统,它是针对具体业务在数据库联机的日常操作,通常对记录进行查询、修改。数据仓库的输入方式各种各样的数据源,最终的输出用于企业的数据分析、数据挖掘、数据报表等方向。数据库是面向事务的设计,数据仓库是面向主题设计的。数据库和数据仓库区别。
334 0
|
存储 数据采集 大数据
数据仓库面试知识总结
数据仓库面试知识总结
数据仓库面试知识总结
|
SQL 分布式计算 大数据
数据仓库实战教程
数据仓库已经是企业的数据竞争的核心了,学好数据仓库对提高自己和找到一份好的工作都至关重要,但是很多人对数仓的印象还是停留在写SQL的层面,其实今天的数仓更像是一个数据平台应用,我们学习的大数据技术其实最终的价值都体现在数据服务上,数仓是数据服务的基石,如果说业界以前还有离线和实时之分的话,那么现在实时数仓的提出与落地,未来数仓将是数据战争的最激烈的战场,一切大数据技术都将为数仓提供服务,也都将在数仓这一环节进行收口。 本专栏主要专注于数仓工具学习、数仓建模以及业务建模、SQL 实战和平台建设,最后以3家公司的数仓建建设和实时数仓作为结尾项目,这份教程有以下特点 1. 知识体系完善,从数仓的
874 2
|
SQL 存储 数据采集
数据仓库工程师面试题
数据仓库工程师面试题
数据仓库复习(十)
维度建模三种模式
86 0