电商项目之数仓的数据产品服务化讲解|学习笔记

本文涉及的产品
云原生数据仓库AnalyticDB MySQL版,基础版 8ACU 100GB 1个月
简介: 快速学习电商项目之数仓的数据产品服务化讲解

开发者学堂课程【新电商大数据平台2020最新课程电商项目之数仓的数据产品服务化讲解】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/640/detail/10493


电商项目之数仓的数据产品服务化讲解


内容简介

一、 数据产品服务化

二、 建模分析

三、 词用原则

四、 外围建设

五、 元数据管理

六、数据质量监控


一、 数据产品服务化

1、数据产品化

面向管理层的宏观经营分析系统面向运营人员的业务监控报表系统面向广告已经营销的一体化数据营销平台其中营销平台涉及用户画像+用户触达+日志回流+效果分析(实验组+对照组)

2、数据服务化

数据以接方式直接服务于线上业务数据以共享平台方式提供基础标签服务什么是数据产品和服务化?第1点是面向管理层的一个宏观金融分析系统,数据应用是一个指标统计然后进行一个数据分析得出一些指标,这个指标会存到管理层的操作系统当中。主要是用于战略的调整,包括后期的一些数据分析得到第2个是面向运营人员业务的监控报表系统。这个报表系统是面向运营人员的,运营人员主要是监控我们的一些性能指标。第3个是面向广告以及营销的一体化 ,这种数据营销平台可能是对外进行提供了一些数据接口,主要是进行一些营销。第4个是在这个营销系统中它可能包含的东西比较多,在面向营销这个方面的话可能会包含一些画像,营销系统里边这个平台涉及的面比较广尤其是我们的用户画像,这个面向广告营销系统的话它要稍微复杂一些,里面的功能也稍微多一些。其实整体来说就是直接对接我们的一个线上服务为我们的第3方提供一个接口,为其他合作的公司提供数据知识。数据是以共享的平台的方式提供一些基础的。


二、 建模分析

数据产品化和数据服务化在智能开发中要对外提供数据服务,此时就需要一个建模分析。

 

三、 词用原则

总体原则:

1. 禁止逆向调用

2. 避免同层调用

3. 优先使用共同层避免跨层调用


四、外围建设


五、元数据管理

元数据管理:

1.表信息。包括表英文名、中文注释、表状态(在线级下线)

2.字段信息,包括字段类型、英文名、中文名、字段注释、保密级别(机密\保密\- -般)、逻辑说明

3.负责人信息,业务/开发负责人名超链接、所在部门

4.分区信息:分区名、分区大小、分区记录条数、生成分区的时间

5.血缘信息:表上游、下游节点信息

6.代码信息:生成该表对应的代码地址超链接

7.存储信息,总表大小、波动情况

8.热度情况,标识被下游依赖过多

9.权限信息,申请访问超链接、权限审批到单人单表单字段粒度、不同保密级别对应不用的审批流程六、

10.使用注意事项


六、 数据质量监控

数据质量监控系统主要是基于规则判断达到数据监控的目的,系统建设一般分为三个阶段。数据质量监控:表级别监控:主要为表的总条数、总大小、分区数据、各分区条数、各分区大小,条数/大小同环比,日增长情况等字段级别监控:枚举值异常判断、特殊值判断、范围判断等

image.png

全链路数据监控:主要依赖于上下游血缘分析,自动判断跟踪故障点,并及时告知相关负责人,表级别和字段级别的监控是比较常规且易实现的监控方式,全链路数据监控比这两着要复杂很多,涉及到从:源数据- >数据通道- >数据 ETL->数据展示的全过程

相关实践学习
AnalyticDB MySQL海量数据秒级分析体验
快速上手AnalyticDB MySQL,玩转SQL开发等功能!本教程介绍如何在AnalyticDB MySQL中,一键加载内置数据集,并基于自动生成的查询脚本,运行复杂查询语句,秒级生成查询结果。
阿里云云原生数据仓库AnalyticDB MySQL版 使用教程
云原生数据仓库AnalyticDB MySQL版是一种支持高并发低延时查询的新一代云原生数据仓库,高度兼容MySQL协议以及SQL:92、SQL:99、SQL:2003标准,可以对海量数据进行即时的多维分析透视和业务探索,快速构建企业云上数据仓库。 了解产品 https://www.aliyun.com/product/ApsaraDB/ads
相关文章
|
13天前
|
3月前
|
BI
数仓项目总结--持续更新中
数仓项目总结--持续更新中
52 2
|
3月前
|
DataWorks 负载均衡 Serverless
实时数仓 Hologres产品使用合集之如何导入大量数据
实时数仓Hologres是阿里云推出的一款高性能、实时分析的数据库服务,专为大数据分析和复杂查询场景设计。使用Hologres,企业能够打破传统数据仓库的延迟瓶颈,实现数据到决策的无缝衔接,加速业务创新和响应速度。以下是Hologres产品的一些典型使用场景合集。
|
3月前
|
SQL 消息中间件 OLAP
OneSQL OLAP实践问题之实时数仓中数据的分层如何解决
OneSQL OLAP实践问题之实时数仓中数据的分层如何解决
53 1
|
3月前
|
SQL DataWorks 数据库连接
实时数仓 Hologres操作报错合集之如何将物理表数据写入临时表
实时数仓Hologres是阿里云推出的一款高性能、实时分析的数据库服务,专为大数据分析和复杂查询场景设计。使用Hologres,企业能够打破传统数据仓库的延迟瓶颈,实现数据到决策的无缝衔接,加速业务创新和响应速度。以下是Hologres产品的一些典型使用场景合集。
|
3月前
|
SQL 分布式计算 关系型数据库
实时数仓 Hologres操作报错合集之指定主键更新模式报错主键数据重复,该如何处理
实时数仓Hologres是阿里云推出的一款高性能、实时分析的数据库服务,专为大数据分析和复杂查询场景设计。使用Hologres,企业能够打破传统数据仓库的延迟瓶颈,实现数据到决策的无缝衔接,加速业务创新和响应速度。以下是Hologres产品的一些典型使用场景合集。
|
3月前
|
SQL 分布式计算 MaxCompute
实时数仓 Hologres产品使用合集之如何在插入数据后获取自增的id值
实时数仓Hologres是阿里云推出的一款高性能、实时分析的数据库服务,专为大数据分析和复杂查询场景设计。使用Hologres,企业能够打破传统数据仓库的延迟瓶颈,实现数据到决策的无缝衔接,加速业务创新和响应速度。以下是Hologres产品的一些典型使用场景合集。
实时数仓 Hologres产品使用合集之如何在插入数据后获取自增的id值
|
3月前
|
存储 搜索推荐 关系型数据库
实时数仓 Hologres产品使用合集之如何在新增列的时候将历史数据也补上默认值
实时数仓Hologres是阿里云推出的一款高性能、实时分析的数据库服务,专为大数据分析和复杂查询场景设计。使用Hologres,企业能够打破传统数据仓库的延迟瓶颈,实现数据到决策的无缝衔接,加速业务创新和响应速度。以下是Hologres产品的一些典型使用场景合集。
|
3月前
|
存储 关系型数据库 分布式数据库
实时数仓 Hologres产品使用合集之对于大量数据的写入,该如何优化
实时数仓Hologres是阿里云推出的一款高性能、实时分析的数据库服务,专为大数据分析和复杂查询场景设计。使用Hologres,企业能够打破传统数据仓库的延迟瓶颈,实现数据到决策的无缝衔接,加速业务创新和响应速度。以下是Hologres产品的一些典型使用场景合集。
|
3月前
|
消息中间件 SQL Java
实时数仓 Hologres产品使用合集之如何用python将kafka数据写入
实时数仓Hologres是阿里云推出的一款高性能、实时分析的数据库服务,专为大数据分析和复杂查询场景设计。使用Hologres,企业能够打破传统数据仓库的延迟瓶颈,实现数据到决策的无缝衔接,加速业务创新和响应速度。以下是Hologres产品的一些典型使用场景合集。