电商项目之商家用户交互记录宽表 SQL 实现|学习笔记

简介: 快速学习电商项目之商家用户交互记录宽表 SQL 实现

开发者学堂课程【新电商大数据平台2020最新课程电商项目之商家用户交互记录宽表 SQL 实现】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/640/detail/10548


电商项目之商家用户交互记录宽表 SQL 实现

 

商家用户交互记录宽表 SQL 实现

上节内容已经找到了字段

4320903966101

4320101010101

43201010109

32010101

32010101

只是其中一个表字段缺失两位,并不影响

接着使用 SQL 实现,输入

--统计商家维度下用户的浏览次数

with pgview as(

select

from dwd_nshop.dwd_nshop_actlog_pdtview pv  

//用户产品浏览表

join

ods_nshop.dim_pub_page pp //页面布局表

on

pp.page_type= ‘4’  //找到产品页

and pp.page_code=pv.target_id

join

ods_nshop.dim_pub_product pr  //商品信息表

on

pr.product_code=pp.page_code

join

ods_nshop.dim_pub_supplier su   //供应商信息表

on

su.supplier_code=pr.supplier_code

where

pv.bdp_day=’20200321’

group by

su.supplier_code,

su.supplier_type

)

继续加值

su.supplier_code,

su.supplier_type,

然后 count 统计浏览次数,输入

count(*)as view_count

这是第一步,接着输入

--统计商家维度下关注人数、关注地区数

prcomment as(

select

from

dwd_nshop.dwd_actlog_product_comment pc //用户关注表

join

ods_nshop.dim_pub_page pp

on

pp.page_type=’4’(代表产品页)

and pp.page_code=pc.target_id

join

ods_nshop.dim_pub_product pr

on

pr.product_code=pp.page_code

join

ods_nshop.dim_pub_supplier su  

on

su.supplier_code=pr.supplier_code

where

pc.bdp_day=’20200321’

group by

su.supplier_code,

su.supplier_type

)

同样再在 select 下,加入值

su.supplier_code,

su.supplier_type

count(distinct pc.user_id) as comment_users,

count(distinct pc.area_code) as comment_area_code,

两个表都取到数据,接下来进行整合,输入

--整合指标到 DWS 表

select

from  pgview

join

prcomment

on

pgview.supplier_code=prcomment.supplier_code

and

pgview.supplier_type=prcomment.supplier_type

然后将值分别取到,输入

pgview.supplier_code

pgview.supplier_type

pgview.view_count,

prcomment.comment_users,

prcomment.comment_area_code,

current_timestamp() as ct  //获取当前时间

之后试着查询

image.png

但是没有数据,因为存在缺口,刚开始的值差了两位,若是将三部分每个单独运行,则存在数据

相关文章
|
3月前
|
SQL 存储 并行计算
Lindorm Ganos 一条 SQL 计算轨迹
Lindorm Ganos 针对轨迹距离计算场景提供了内置函数 ST_Length_Rows,结合原生时空二级索引和时空聚合计算下推技术,能够高效过滤数据并并行执行运算任务。该方案通过主键索引和时空索引快速过滤数据,并利用多Region并行计算轨迹点距离,适用于车联网等场景。具体步骤包括根据车辆识别代码和时间戳过滤数据、范围过滤轨迹点以及并行计算距离。使用限制包括只支持点类型列聚合运算及表中轨迹点需按顺序排列等。测试结果显示,Lindorm Ganos 在不同数据量下均能实现秒级响应。
31 3
|
7月前
|
SQL 关系型数据库 MySQL
简简单单 My SQL 学习笔记(1)——表中数据的整删改查
简简单单 My SQL 学习笔记(1)——表中数据的整删改查
|
7月前
|
SQL 关系型数据库 MySQL
简简单单 My SQL 学习笔记(2)——分组和简单数据的查询
简简单单 My SQL 学习笔记(2)——分组和简单数据的查询
|
7月前
|
SQL 关系型数据库 MySQL
简简单单 My SQL 学习笔记(3)——连接和嵌套查询
简简单单 My SQL 学习笔记(3)——连接和嵌套查询
|
7月前
|
SQL OLAP Serverless
第五章:SQL高级处理---SQL学习笔记
第五章:SQL高级处理---SQL学习笔记
66 0
|
3月前
|
关系型数据库 MySQL 网络安全
5-10Can't connect to MySQL server on 'sh-cynosl-grp-fcs50xoa.sql.tencentcdb.com' (110)")
5-10Can't connect to MySQL server on 'sh-cynosl-grp-fcs50xoa.sql.tencentcdb.com' (110)")
|
5月前
|
SQL 存储 监控
SQL Server的并行实施如何优化?
【7月更文挑战第23天】SQL Server的并行实施如何优化?
118 13
|
5月前
|
SQL
解锁 SQL Server 2022的时间序列数据功能
【7月更文挑战第14天】要解锁SQL Server 2022的时间序列数据功能,可使用`generate_series`函数生成整数序列,例如:`SELECT value FROM generate_series(1, 10)。此外,`date_bucket`函数能按指定间隔(如周)对日期时间值分组,这些工具结合窗口函数和其他时间日期函数,能高效处理和分析时间序列数据。更多信息请参考官方文档和技术资料。
|
5月前
|
SQL 存储 网络安全
关系数据库SQLserver 安装 SQL Server
【7月更文挑战第26天】
63 6
|
5月前
|
存储 SQL C++
对比 SQL Server中的VARCHAR(max) 与VARCHAR(n) 数据类型
【7月更文挑战7天】SQL Server 中的 VARCHAR(max) vs VARCHAR(n): - VARCHAR(n) 存储最多 n 个字符(1-8000),适合短文本。 - VARCHAR(max) 可存储约 21 亿个字符,适合大量文本。 - VARCHAR(n) 在处理小数据时性能更好,空间固定。 - VARCHAR(max) 对于大文本更合适,但可能影响性能。 - 选择取决于数据长度预期和业务需求。
408 1

热门文章

最新文章