开发者学堂课程【新电商大数据平台2020最新课程:电商项目之总体运营指标统计表分析】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/640/detail/10562
电商项目之总体运营指标统计表分析
内容介绍:
一、总体运营指标统计表 4X【ADS】代码
二、分析
一、总体运营指标统计表 4X【ADS】
代码如下:
create external table if not exists ads_ nshop.ads_ nshop_ oper_ stat(
customer_gender TINYINT COMMENT‘性别: 1男0女’,
age_ range string COMMENT ‘年龄段’,
customer_natives string COMMENT ‘所在地区’,
- -consignee_zipcode string COMMENT ‘收货人地区’ //与所在地区相同,多余注释掉
product_ type int comment ‘ 商品类别',
order_ counts int comment‘订单数’,
order_ rate int comment ‘下单率’,
order_ amounts int comment ‘销售总金额’,
order_ discounts int comment ‘优惠总金额’,
shipping_ amounts int comment ‘运费总金额' ,
per_ customer_ transaction int comment ‘客单价’
) partitioned by (bdp_day string)
stored as parquet
location‘/data/nshop/ads/operation/ads_nshop_oper_ stat/'
复制粘贴以上内容先来创建表
二、分析
可以看到该表中统计性别、年龄段、所在地区、商品类别、订单数、下单率、销售总金额、优惠总金额、运费总金额、客单价。
其中销售总金额、优惠总金额、运费总金额三个与金额有关,用到业务表,是交易类业务数据库中表的数据。
性别、年龄段、所在地区需要用到 customer 用户基本信息表。商品类别、订单数、下单率需要进行计算,比如订单数需要 order_count,商品类别用到 product_type。
接下来先找到用户商品基本信息表和页面布局列表两个表,因为取销售总金额等三个金额信息需要用到这两个表中的字段,取商品类别时也需要用。
先找到页面布局,页面布局中有页面编码 page_code
商品信息表中有 product_code,该表中还要用到 category_code 分类 id,稍后进行具体说明。
以上两个维表必须要用到,因为需要取到其中的一些相关信息,所以这两个表必须要进行取值。
接着分析字段下单率,应该使用下单次数除浏览次数进行计算,所以还需要找到总浏览次数,需要找到用户的产品浏览表。此外金额也需要用到交易订单明细流水表。
总结目前需要用到五个表:
页面布局维表、商品信息维表、customer 用户基本信息表、用户产品浏览表、交易订单明细流水表.
在真正取值时还需要进行 join,较复杂。所以总体运营指标统计表要按照统一维度进行分组,然后进行聚合取值。