电商项目之商家用户交互记录宽表 SQL 实现|学习笔记

简介: 快速学习电商项目之商家用户交互记录宽表 SQL 实现

开发者学堂课程【新电商大数据平台2020最新课程电商项目之商家用户交互记录宽表 SQL 实现】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/640/detail/10548


电商项目之商家用户交互记录宽表 SQL 实现

 

商家用户交互记录宽表 SQL 实现

上节内容已经找到了字段

4320903966101

4320101010101

43201010109

32010101

32010101

只是其中一个表字段缺失两位,并不影响

接着使用 SQL 实现,输入

--统计商家维度下用户的浏览次数

with pgview as(

select

from dwd_nshop.dwd_nshop_actlog_pdtview pv  

//用户产品浏览表

join

ods_nshop.dim_pub_page pp //页面布局表

on

pp.page_type= ‘4’  //找到产品页

and pp.page_code=pv.target_id

join

ods_nshop.dim_pub_product pr  //商品信息表

on

pr.product_code=pp.page_code

join

ods_nshop.dim_pub_supplier su   //供应商信息表

on

su.supplier_code=pr.supplier_code

where

pv.bdp_day=’20200321’

group by

su.supplier_code,

su.supplier_type

)

继续加值

su.supplier_code,

su.supplier_type,

然后 count 统计浏览次数,输入

count(*)as view_count

这是第一步,接着输入

--统计商家维度下关注人数、关注地区数

prcomment as(

select

from

dwd_nshop.dwd_actlog_product_comment pc //用户关注表

join

ods_nshop.dim_pub_page pp

on

pp.page_type=’4’(代表产品页)

and pp.page_code=pc.target_id

join

ods_nshop.dim_pub_product pr

on

pr.product_code=pp.page_code

join

ods_nshop.dim_pub_supplier su  

on

su.supplier_code=pr.supplier_code

where

pc.bdp_day=’20200321’

group by

su.supplier_code,

su.supplier_type

)

同样再在 select 下,加入值

su.supplier_code,

su.supplier_type

count(distinct pc.user_id) as comment_users,

count(distinct pc.area_code) as comment_area_code,

两个表都取到数据,接下来进行整合,输入

--整合指标到 DWS 表

select

from  pgview

join

prcomment

on

pgview.supplier_code=prcomment.supplier_code

and

pgview.supplier_type=prcomment.supplier_type

然后将值分别取到,输入

pgview.supplier_code

pgview.supplier_type

pgview.view_count,

prcomment.comment_users,

prcomment.comment_area_code,

current_timestamp() as ct  //获取当前时间

之后试着查询

image.png

但是没有数据,因为存在缺口,刚开始的值差了两位,若是将三部分每个单独运行,则存在数据

相关文章
|
8月前
|
SQL 关系型数据库 MySQL
项目中遇到一张900w的数据表把原先要花费17s执行的SQL优化到300ms经验加100哈哈哈
项目中遇到一张900w的数据表把原先要花费17s执行的SQL优化到300ms经验加100哈哈哈
66 1
|
8月前
|
SQL 存储 大数据
每天一道大厂SQL题【Day02】电商场景TopK统计
每天一道大厂SQL题【Day02】电商场景TopK统计
79 1
|
8月前
|
SQL 大数据 HIVE
每天一道大厂SQL题【Day06】电商购买金额统计实战
每天一道大厂SQL题【Day06】电商购买金额统计实战
90 0
|
8月前
|
SQL 分布式计算 数据可视化
Spark SQL案例【电商购买数据分析】
Spark SQL案例【电商购买数据分析】
|
8月前
|
SQL Java 应用服务中间件
Java项目防止SQL注入的四种方案
Java项目防止SQL注入的四种方案
150 0
|
8月前
|
SQL 大数据 HIVE
每天一道大厂SQL题【Day10】电商分组TopK实战
每天一道大厂SQL题【Day10】电商分组TopK实战
73 0
|
5月前
|
SQL 分布式计算 DataWorks
DataWorks操作报错合集之新建项目的元数据的sql报错,如何解决
DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
|
3月前
|
SQL 关系型数据库 MySQL
Go语言项目高效对接SQL数据库:实践技巧与方法
在Go语言项目中,与SQL数据库进行对接是一项基础且重要的任务
115 11
|
4月前
|
SQL 存储 并行计算
Lindorm Ganos 一条 SQL 计算轨迹
Lindorm Ganos 针对轨迹距离计算场景提供了内置函数 ST_Length_Rows,结合原生时空二级索引和时空聚合计算下推技术,能够高效过滤数据并并行执行运算任务。该方案通过主键索引和时空索引快速过滤数据,并利用多Region并行计算轨迹点距离,适用于车联网等场景。具体步骤包括根据车辆识别代码和时间戳过滤数据、范围过滤轨迹点以及并行计算距离。使用限制包括只支持点类型列聚合运算及表中轨迹点需按顺序排列等。测试结果显示,Lindorm Ganos 在不同数据量下均能实现秒级响应。
44 3
|
5月前
|
监控 Java 开发者
揭秘Struts 2性能监控:选对工具与方法,让你的应用跑得更快,赢在起跑线上!
【8月更文挑战第31天】在企业级应用开发中,性能监控对系统的稳定运行至关重要。针对流行的Java EE框架Struts 2,本文探讨了性能监控的工具与方法,包括商用的JProfiler、免费的VisualVM以及Struts 2自带的性能监控插件。通过示例代码展示了如何在实际项目中实施这些监控手段,帮助开发者发现和解决性能瓶颈,确保应用在高并发、高负载环境下稳定运行。选择合适的监控工具需综合考虑项目需求、成本、易用性和可扩展性等因素。
55 0