开发者学堂课程【阿里云实时数仓实战2:实时计算与结果输出:DWD 到 ADS 层的业务流程(商品统计)】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/109/detail/1889
实时计算与结果输出
统计商品订单个数、订单金额
源表在哪里?
一个是在 datahub 中的 dwd-paid-order-detail,另一张表是在 rds 中的维度表 dim-sku-info。
接下来就可以对两张表进行双流 join 聚合,聚合之后输出到 ADB 中并创建一张表叫 dws-sku-stat 结果表。
图中标红处为是将订单 id 随机打散,是一个优化的操作,防止数据倾斜。
中间部分是两张表的双流 join,上半部分商品表信息的 join,下面是商品维度表信息对应的 join。
一、创建业务流程:
控制台>新建任务>填写名称>切换到 SQL 模式
将源表维表信息复制粘贴,一定检查是否有问题
源表 RDS 地址一定要换成自己的内网地址
二、创建结果表:
要将结果写到 AnalyticDB 中,并且修改成自己的内网地址。以上
三、聚合源表和维表
首先创建视图(若不进行优化也可以),接下来将两张表进行 join 处理,拼接完成后,保存,点击执行计划,稍等片刻,对任务进行发布,自动配置执行计划:3cu(由于购买时只有6个 cu,前两个任务已使用 4cu,但剩下 2cu 对本任务运行不起来,所以停掉上一个任务)
点击运营界面,对任务进行启动,点击任务名称,等待图像成为流水形
返回结果表查看是否有数据,最后商品表和省份表都有对应的信息。
至此两个指标的结果,就都已经写入到 AnalyticDB 中,数据都已存储成功。