电仓项目之数仓的外围建设|学习笔记

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
云原生数据仓库AnalyticDB MySQL版,基础版 8ACU 100GB 1个月
简介: 快速学习电仓项目之数仓的外围建设

开发者学堂课程【新电商大数据平台2020最新课程电仓项目之数仓的外围建设】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/640/detail/10497


电仓项目之数仓的外围建设

 

内容介绍:

一. 数据库里的层级调用原则

二. 电仓项目之数仓的外围建设

 

一. 数据库里的层级调用原则:

1. 禁止逆向调用

2. 避免同层调用

3. 优先使用公共层

4.避免跨层调用(尽量遵守原则,有时避免不了需要调用,否则无法写出正确代码,因此要在遵循原则的基础上应变)

image.png


二.电仓项目之数仓的外围建设

image.png 

1.什么叫主要外部依赖?

(1)调度系统,整体的任务,在我们写完所有的代码,完成业务以后可能需要一个工作流调度器,比如像 Ooize 、Azkabanafrou 这三个都是工作流调度器,使用过程中需要做一个任务调度,不能手动或者人为调度。

比如 Ooize   Azkaban  ,清断性,调度的功能比较强大,但是调度的脚本编写比较复杂。 

Azkaban 相对来说适用于一个清断性的调度。所有的任务都会通过一个任务流,工作调度器来调度。这是一个调度系统,即写好脚本,放入调度系统,让调度系统每天去执行任务。

(2)元数据管理系统,下节课将分为几个点进行介绍。元数据管理系统是主要依赖的一个系统组件,主要管理一些对应的源数据操作。

(3)离线和实时计算,可选用的工具比较多。

离线可以使用:

比如 MR  ,是我们 Hadoop 所用到的一个执行引擎,使用较多。

但现在的内存更大,数据量更大,可以使用 spark 这个执行引擎进行任务计算。

实时计算要用到 spark streaming flink 。实时数仓也是通过  spark streaming flink ,或者 storm 来实现。本次项目会用 MR 和 spark 进行任务执行,以便对比两者的速度和执行代码编写的难易程度。

(4)数据质量监控:

对数据质量把关,比如计算机指标、最后的准确性、可信度进行监控处理,后面将详细介绍并通过例子进行讲解。

相关实践学习
AnalyticDB MySQL海量数据秒级分析体验
快速上手AnalyticDB MySQL,玩转SQL开发等功能!本教程介绍如何在AnalyticDB MySQL中,一键加载内置数据集,并基于自动生成的查询脚本,运行复杂查询语句,秒级生成查询结果。
阿里云云原生数据仓库AnalyticDB MySQL版 使用教程
云原生数据仓库AnalyticDB MySQL版是一种支持高并发低延时查询的新一代云原生数据仓库,高度兼容MySQL协议以及SQL:92、SQL:99、SQL:2003标准,可以对海量数据进行即时的多维分析透视和业务探索,快速构建企业云上数据仓库。 了解产品 https://www.aliyun.com/product/ApsaraDB/ads
相关文章
|
SQL 分布式计算 运维
开源大数据 OLAP 引擎最佳实践 | 学习笔记(二)
快速学习开源大数据 OLAP 引擎最佳实践
开源大数据 OLAP 引擎最佳实践 | 学习笔记(二)
|
3月前
|
数据采集 大数据
大数据实战项目之电商数仓(二)
大数据实战项目之电商数仓(二)
|
28天前
|
BI
数仓项目总结--持续更新中
数仓项目总结--持续更新中
29 2
|
3月前
|
SQL 关系型数据库 MySQL
详尽分享音乐数据中心数仓综合项目
详尽分享音乐数据中心数仓综合项目
38 0
|
3月前
|
消息中间件 分布式计算 Hadoop
大数据实战项目之电商数仓(一)
大数据实战项目之电商数仓(一)
128 0
|
4月前
|
存储 SQL 分布式计算
Hadoop(HDFS+MapReduce+Hive+数仓基础概念)学习笔记(自用)
Hadoop(HDFS+MapReduce+Hive+数仓基础概念)学习笔记(自用)
452 0
|
存储 运维 DataWorks
数仓建模理论与规范(一)| 学习笔记
快速学习数仓建模理论与规范。
568 1
数仓建模理论与规范(一)| 学习笔记
|
存储 SQL DataWorks
数仓建模理论与规范(三)| 学习笔记
快速学习数仓建模理论与规范。
449 0
数仓建模理论与规范(三)| 学习笔记
|
存储 数据建模 开发者
数仓建模理论与规范(二)| 学习笔记
快速学习数仓建模理论与规范。
219 1
数仓建模理论与规范(二)| 学习笔记
|
SQL 数据采集 存储
客户案例:数仓规范化-菜鸟数据模型管理实践(三)| 学习笔记
快速学习客户案例:数仓规范化-菜鸟数据模型管理实践。
272 0
客户案例:数仓规范化-菜鸟数据模型管理实践(三)| 学习笔记