电商项目之广告投放数据表 SQL 实现(下)|学习笔记

简介: 快速学习电商项目之广告投放数据表 SQL 实现(下)

开发者学堂课程【新电商大数据平台2020最新课程电商项目之广告投放数据表 SQL 实现(下)】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/640/detail/10538


电商项目之广告投放数据表 SQL 实现(下)


广告投放数据表下部分

select

from tbrelease a

join ods_ nshop.dim. pub. page P

on a.release_ product_ page-p.page_ code and p.page_ type- ' 4'

join ods_ nshop.dim pub_ product

既然要去分类页的产品,类型需要找产品页的,所以需要加 and 的条件。

此时用 UID 进行 join 不太合适,商品信息表中并没 UID,如果用页面布局进行 join

Time taken: 0.206 seconds, Fetched: 10 row(s)

hive> select p.category code from ods_ nshop.dim pub_ product p join ods_ nshop.dim pub_ page PP on pp page tar

get=p . product code timit 10;

WARNING: Hive-on-MR is deprecated in Hive 2 and may not be available in the future versions. Consider using

a different execution engine (i.e. spark, tez) or using Hive 1.x releases .

Query ID = root 20200329101234 9df406ec -4ea3-43a7 bbd7 267485fece14

Total jobs = 1

Stage-1 is selected by condition resolver.

Launching Job 1 out of 1

Number of reduce tasks not specified. Estimated from input data size: 2

In order to change the average Load for a reducer (in

bytes):

set hive,exec . reducers. bytes . per,reduce rE<number>

In order to limit the maxinum number of reducers :

set hive . exec . reducers .max=<number>

In order to set a constant number of reducers:

set map reduce. j ob. reduc esscnumbe P

Cannot run job Locally: Input Size (= 338042241) is larger than hive . exec,mode. Local. auto . inputbytes,max (=134217728)

Starting Job = job 1585434648842 0001, Tracking URL = http://node1: 8088/proxy/ application 1585434648842 000

1/

Kill Command = /usr/local/hadoop-2.7.6/bin/hadoop job kill job_ 1585434648842 0001

页面布局中页面对应的实体编号(如产品、店铺)就是商品信息表的商品ID编号(分类编码+供应商编码+编号)join 会导致有一定的时间间隔,join 出现之后,如果能取到数据,就算完成了。

select

a.customer. id,(取值)

a.device_ _num ,

a.device_ type,

a.05 ,

a.os_ version ,

a. manuf acturer

a.area_ code,

a.release_ sid ,

a.release_ ip,

a.release_ session,

a.release_ sources ,

f.category_ code release. category,(投放产品分类)

b.page_ target release. product,(投放浏览产品)

a.release_ product. page ,

a.ct

from tbrelease a

join ods_ nshop.dim pub_ page p

on a.release prouuct page-p.page code and p.page_ type- 4

相关文章
|
2月前
|
算法 数据挖掘 数据库
通过 SQL 快速使用 OceanBase 向量检索学习笔记
通过 SQL 快速使用 OceanBase 向量检索学习笔记
|
2月前
|
SQL 数据库
SQL 学习笔记 - 多表关系与多表查询
数据库多表关系包括一对多、多对多和一对一,常用外键关联。多表查询方式有隐式/显式内连接、外连接、子查询等,支持别名和条件筛选。子查询分为标量、列、行、表子查询,常用于复杂查询场景。
|
SQL 关系型数据库 Serverless
sql注入原理与实战(四)数据表操作
sql注入原理与实战(四)数据表操作
|
SQL 关系型数据库 MySQL
简简单单 My SQL 学习笔记(2)——分组和简单数据的查询
简简单单 My SQL 学习笔记(2)——分组和简单数据的查询
|
SQL 关系型数据库 MySQL
简简单单 My SQL 学习笔记(3)——连接和嵌套查询
简简单单 My SQL 学习笔记(3)——连接和嵌套查询
|
SQL HIVE UED
【Hive SQL 每日一题】分析电商平台的用户行为和订单数据
作为一名数据分析师,你需要分析电商平台的用户行为和订单数据。你有三张表:`users`(用户信息),`orders`(订单信息)和`order_items`(订单商品信息)。任务包括计算用户总订单金额和数量,按月统计订单,找出最常购买的商品,找到平均每月最高订单金额和数量的用户,以及分析高消费用户群体的年龄和性别分布。通过SQL查询,你可以实现这些分析,例如使用`GROUP BY`、`JOIN`和窗口函数来排序和排名。
1199 2
|
关系型数据库 MySQL 网络安全
5-10Can't connect to MySQL server on 'sh-cynosl-grp-fcs50xoa.sql.tencentcdb.com' (110)")
5-10Can't connect to MySQL server on 'sh-cynosl-grp-fcs50xoa.sql.tencentcdb.com' (110)")
|
SQL 存储 监控
SQL Server的并行实施如何优化?
【7月更文挑战第23天】SQL Server的并行实施如何优化?
528 13
解锁 SQL Server 2022的时间序列数据功能
【7月更文挑战第14天】要解锁SQL Server 2022的时间序列数据功能,可使用`generate_series`函数生成整数序列,例如:`SELECT value FROM generate_series(1, 10)。此外,`date_bucket`函数能按指定间隔(如周)对日期时间值分组,这些工具结合窗口函数和其他时间日期函数,能高效处理和分析时间序列数据。更多信息请参考官方文档和技术资料。
347 9
|
SQL 存储 网络安全
关系数据库SQLserver 安装 SQL Server
【7月更文挑战第26天】
246 6