数据仓库专题(16)-分布式数据仓库实践指南-目录篇

简介: 前言: 准备系统化整理一套分布式数据仓库建模实践指南,先把目录列出来吧,算是给自己设计一个目标吧。第一部分 基础篇 第一章 数据仓库概念与定义1.1 数据管理体系1.2 数据仓库概念1.

前言:

 准备系统化整理一套分布式数据仓库建模实践指南,先把目录列出来吧,算是给自己设计一个目标吧。

第一部分 基础篇

第一章 数据仓库概念与定义

1.1 数据管理体系

1.2 数据仓库概念

1.3 数据仓库职责

第二章 数据仓库体系结构

2.1 Inmon CIF

2.2 Kimball 

2.3 对比与分析

2.4 分布式数据仓库架构体系

第三章 维度建模基础

 3.1 kimball四步建模法

 3.2 维度设计

 3.3 事实表设计

第四章 数据分类体系

4.1 数据分类思想

4.1.1 主数据

4.1.2 参考数据

4.1.3 交易数据

4.1.4 元数据

4.2 数据分类与数据存储模型

4.2.1 关系型数据仓库

4.2.2 分布式数据仓库

第二部分 实践篇

 第一章 主题域模型设计

 第二章 路线图

 第三章 业务分析-深浅有度

 第四章 数据分析-区别对待

 第五章 数据建模-概念模型、逻辑模型、物理模型

 第六章 聚集模型

6.1 星型模型与聚集模型概念与定义

6.2 聚集模型聚集粒度展现方式

6.3 聚集模型与汇总

第三部分 工具篇

第一章 数据建模基础

 1.1 数据模型分类

 1.2 数据建模语言

 1.3 数据建模收益

 1.4 数据建模原则

  第二章 维度建模工具

 2.1 Hello ERwin

 2.3 建模语言设置

 2.3 对象命名规范

 2.4 对象配色管理

 2.5 对象样式设置

 2.6 维度建模实践

第三章 分布式数据仓库系统

 3.1 Hadoop

 3.2 Hive

 3.3 Spark

第四部分 提高篇

第一章 数据仓库与业务系统改造

1.1 业务重构

1.2 数据重构

第二章 数据仓库与数据变现

2.1 数据价值链理论

2.2 数据变现链条

2.3 数据变现模式

第三章 数据仓库成熟度模型

3.1 数据仓库成熟度模型

3.2 改进的数据仓库成熟度模型

 

 

未完待续,意见征集中,欢迎回复留言,如果对于分布式数据仓库建设有兴趣,可加群:

分布式数据仓库建模 398419457

 


 

目录
相关文章
|
8月前
|
SpringCloudAlibaba 负载均衡 Java
【Springcloud Alibaba微服务分布式架构 | Spring Cloud】之学习笔记(目录大纲)
【Springcloud Alibaba微服务分布式架构 | Spring Cloud】之学习笔记(目录大纲)
197 1
|
8月前
|
存储 数据采集 数据挖掘
【软件设计师备考 专题 】数据仓库和分布式数据库基础知识
【软件设计师备考 专题 】数据仓库和分布式数据库基础知识
267 0
|
存储 大数据
大数据数据存储的分布式文件系统的HDFS的基本使用的命令行接口的删除文件/目录
在 Hdfs 中,使用命令行接口可以方便地对数据进行操作。
118 1
|
存储 大数据
大数据数据存储的分布式文件系统的HDFS的基本使用的命令行接口的创建目录/文件
在 Hdfs 中,使用命令行接口可以方便地对数据进行操作。
111 1
|
SQL 存储 分布式计算
「大数据系列」:Apache Hive 分布式数据仓库项目介绍
「大数据系列」:Apache Hive 分布式数据仓库项目介绍
|
存储 机器学习/深度学习 数据采集
谈谈数据湖分布式数据治理的数据目录应具备的四大能力【数据发现】
在过去几年中,数据湖已成为现代数据堆栈的必备要素。但是,虽然支持我们访问和分析数据的技术已经成熟,但在分布式环境中理解和信任这些数据的机制却落后了。
谈谈数据湖分布式数据治理的数据目录应具备的四大能力【数据发现】
|
SQL 存储 分布式计算
Apache Tajo:一个运行在YARN上支持SQL的分布式数据仓库
将SQL转化为MapReduce。典型代表是Apache Hive,这种系统的特点是扩展性和容错性好,但性能低下。为了弥补SQL on MapReduce的不足,google提出了Tenzing(见参考资料[3]),与Hive不同,Tenzing充分借鉴了MapReduce和DataBase的优势,首先,它对传统的MapReduce进行了优化(比如Map 可以不写磁盘,Reduce可不必排序等),使其性能更高,采用MapReduce一大优势是使Tenzing具有了很好的扩展性和容错性,Tenzing论文是这样表述的
250 0
Apache Tajo:一个运行在YARN上支持SQL的分布式数据仓库
|
存储 缓存 NoSQL
REDIS6_分布式存储极致性能目录
REDIS6_分布式存储极致性能目录
226 0
|
存储 运维 Cloud Native
DTCC 2020 | 阿里云李飞飞:云原生分布式数据库与数据仓库系统点亮数据上云之路
数据库将面临怎样的变革?云原生数据库与数据仓库有哪些独特优势?在日前的 DTCC 2020大会上,阿里巴巴集团副总裁、阿里云数据库产品事业部总裁、ACM杰出科学家李飞飞就《云原生分布式数据库与数据仓库系统点亮数据上云之路》进行了精彩分享。
8197 0
DTCC 2020 | 阿里云李飞飞:云原生分布式数据库与数据仓库系统点亮数据上云之路
|
存储 分布式计算 Cloud Native