数据仓库专题(16)-分布式数据仓库实践指南-目录篇

简介: 前言: 准备系统化整理一套分布式数据仓库建模实践指南,先把目录列出来吧,算是给自己设计一个目标吧。第一部分 基础篇 第一章 数据仓库概念与定义1.1 数据管理体系1.2 数据仓库概念1.

前言:

 准备系统化整理一套分布式数据仓库建模实践指南,先把目录列出来吧,算是给自己设计一个目标吧。

第一部分 基础篇

第一章 数据仓库概念与定义

1.1 数据管理体系

1.2 数据仓库概念

1.3 数据仓库职责

第二章 数据仓库体系结构

2.1 Inmon CIF

2.2 Kimball 

2.3 对比与分析

2.4 分布式数据仓库架构体系

第三章 维度建模基础

 3.1 kimball四步建模法

 3.2 维度设计

 3.3 事实表设计

第四章 数据分类体系

4.1 数据分类思想

4.1.1 主数据

4.1.2 参考数据

4.1.3 交易数据

4.1.4 元数据

4.2 数据分类与数据存储模型

4.2.1 关系型数据仓库

4.2.2 分布式数据仓库

第二部分 实践篇

 第一章 主题域模型设计

 第二章 路线图

 第三章 业务分析-深浅有度

 第四章 数据分析-区别对待

 第五章 数据建模-概念模型、逻辑模型、物理模型

 第六章 聚集模型

6.1 星型模型与聚集模型概念与定义

6.2 聚集模型聚集粒度展现方式

6.3 聚集模型与汇总

第三部分 工具篇

第一章 数据建模基础

 1.1 数据模型分类

 1.2 数据建模语言

 1.3 数据建模收益

 1.4 数据建模原则

  第二章 维度建模工具

 2.1 Hello ERwin

 2.3 建模语言设置

 2.3 对象命名规范

 2.4 对象配色管理

 2.5 对象样式设置

 2.6 维度建模实践

第三章 分布式数据仓库系统

 3.1 Hadoop

 3.2 Hive

 3.3 Spark

第四部分 提高篇

第一章 数据仓库与业务系统改造

1.1 业务重构

1.2 数据重构

第二章 数据仓库与数据变现

2.1 数据价值链理论

2.2 数据变现链条

2.3 数据变现模式

第三章 数据仓库成熟度模型

3.1 数据仓库成熟度模型

3.2 改进的数据仓库成熟度模型

 

 

未完待续,意见征集中,欢迎回复留言,如果对于分布式数据仓库建设有兴趣,可加群:

分布式数据仓库建模 398419457

 


 


作者:张子良
出处:http://www.cnblogs.com/hadoopdev
本文版权归作者所有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。

相关文章
|
5月前
|
存储 数据采集 数据挖掘
【软件设计师备考 专题 】数据仓库和分布式数据库基础知识
【软件设计师备考 专题 】数据仓库和分布式数据库基础知识
251 0
|
SQL 存储 分布式计算
「大数据系列」:Apache Hive 分布式数据仓库项目介绍
「大数据系列」:Apache Hive 分布式数据仓库项目介绍
|
SQL 存储 分布式计算
Apache Tajo:一个运行在YARN上支持SQL的分布式数据仓库
将SQL转化为MapReduce。典型代表是Apache Hive,这种系统的特点是扩展性和容错性好,但性能低下。为了弥补SQL on MapReduce的不足,google提出了Tenzing(见参考资料[3]),与Hive不同,Tenzing充分借鉴了MapReduce和DataBase的优势,首先,它对传统的MapReduce进行了优化(比如Map 可以不写磁盘,Reduce可不必排序等),使其性能更高,采用MapReduce一大优势是使Tenzing具有了很好的扩展性和容错性,Tenzing论文是这样表述的
234 0
Apache Tajo:一个运行在YARN上支持SQL的分布式数据仓库
|
存储 运维 Cloud Native
DTCC 2020 | 阿里云李飞飞:云原生分布式数据库与数据仓库系统点亮数据上云之路
数据库将面临怎样的变革?云原生数据库与数据仓库有哪些独特优势?在日前的 DTCC 2020大会上,阿里巴巴集团副总裁、阿里云数据库产品事业部总裁、ACM杰出科学家李飞飞就《云原生分布式数据库与数据仓库系统点亮数据上云之路》进行了精彩分享。
8145 0
DTCC 2020 | 阿里云李飞飞:云原生分布式数据库与数据仓库系统点亮数据上云之路
|
存储 分布式计算 Cloud Native
分布式数据仓库实践指南:第三章 数据主题域模型设计
说明:数据仓库主题域模型设计答疑专题
3586 0
|
存储 算法
数据产品设计专题(5)- 分布式数据仓库技术架构
一、分布式数据仓库技术架构   二、核心内容解读  (1)分布式数据仓库存储技术:hive+hdfs;  (2)事实计算平台技术框架:spark;  (3)数据挖掘算法技术框架:mllib + sparkR   作者:张子良 出处:http://www.cnblogs.com/hadoopdev 本文版权归作者所有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。
1639 0

热门文章

最新文章