开发者学堂课程【新电商大数据平台2020最新课程:电商项目之商家用户交互记录宽表总结】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/640/detail/10549
电商项目之商家用户交互记录宽表总结
商家用户交互记录宽表总结
回顾商家用户交互记录宽表:
先补全语句,在--整合指标到 DWS 表下输入
insert overwrite table
然后先创建该宽表,如图创建成功
然后复制表 dws_nshop.dws_nshop_supplier_user,即
insert overwrite table dws_nshop.dws_nshop_supplier_user partition(bdp_day=’20200321’)
在刚才运行结果中是无数据的,因为其中有一个字段少了两位,无法匹配,但是各部分分开运行有数据
总结:
商家用户交互记录宽表用到浏览和关注两个表,用这两个表来计算商家用户记录宽表,其中需要记住三个值:浏览次数、关注人数(这两个依赖于不同的表
浏览次数依赖于浏览明细表,关注人数依赖于关注明细表
SQL 实现方式其实有多种,除了讲解的该方式,还可以单独将维度抽取出,先将维度表汇总在一起,然后保留供应商id 和供应商类型。抽出公共维度后,再去统计浏览次数和关注人数。最后实现效果一样,只是会考虑一些效率问题,比如减少一些 join 或者查询或者表关联等等。
该表结果没有数据不是 SQL 实现不了,是因为43201010109数据对应不上,使用4320101010101去关联商品信息表时关联不到,然后再去查询下面的字段时就查不到
之后还有 day7天:dws_nshop.dws_nshop_supplier_user_7d,加 where 条件就可以查多少天的
另外需要注意在运行该表时,尽量使用本地模式