电商项目之商家用户交互记录宽表总结|学习笔记

简介: 快速学习电商项目之商家用户交互记录宽表总结

开发者学堂课程【新电商大数据平台2020最新课程电商项目之商家用户交互记录宽表总结】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/640/detail/10549


电商项目之商家用户交互记录宽表总结

 

商家用户交互记录宽表总结

回顾商家用户交互记录宽表:

先补全语句,在--整合指标到 DWS 表下输入

insert overwrite table

然后先创建该宽表,如图创建成功

image.png

然后复制表 dws_nshop.dws_nshop_supplier_user,即

insert overwrite table dws_nshop.dws_nshop_supplier_user partition(bdp_day=’20200321’)

在刚才运行结果中是无数据的,因为其中有一个字段少了两位,无法匹配,但是各部分分开运行有数据

总结:

商家用户交互记录宽表用到浏览和关注两个表,用这两个表来计算商家用户记录宽表,其中需要记住三个值:浏览次数、关注人数(这两个依赖于不同的表

浏览次数依赖于浏览明细表,关注人数依赖于关注明细表

SQL 实现方式其实有多种,除了讲解的该方式,还可以单独将维度抽取出,先将维度表汇总在一起,然后保留供应商id 和供应商类型。抽出公共维度后,再去统计浏览次数和关注人数。最后实现效果一样,只是会考虑一些效率问题,比如减少一些 join 或者查询或者表关联等等。

该表结果没有数据不是 SQL 实现不了,是因为43201010109数据对应不上,使用4320101010101去关联商品信息表时关联不到,然后再去查询下面的字段时就查不到

之后还有 day7天:dws_nshop.dws_nshop_supplier_user_7d,加 where 条件就可以查多少天的

另外需要注意在运行该表时,尽量使用本地模式

相关文章
|
监控 开发者
网站流量日志分析—数据入库—宽表、窄表由来概述|学习笔记
快速学习网站流量日志分析—数据入库—宽表、窄表由来概述
293 0
网站流量日志分析—数据入库—宽表、窄表由来概述|学习笔记
|
SQL 监控 数据库
网站流量日志分析—数据入库—宽表具体表现1—时间拓宽|学习笔记
快速学习网站流量日志分析—数据入库—宽表具体表现1—时间拓宽
238 0
网站流量日志分析—数据入库—宽表具体表现1—时间拓宽|学习笔记
|
SQL 监控 HIVE
网站流量日志分析--数据入库--宽表具体实现2—解析 url|学习笔记
快速学习网站流量日志分析--数据入库--宽表具体实现2—解析 url
181 0
网站流量日志分析--数据入库--宽表具体实现2—解析 url|学习笔记
|
大数据 开发者
电商项目之用户交易宽表分析|学习笔记
快速学习电商项目之用户交易宽表分析
电商项目之用户交易宽表分析|学习笔记
|
6月前
|
存储 SQL 多模数据库
多模数据库Lindorm再升级:对接Dataphin,打通数据治理“最后一公里”
Lindorm通过与Dataphin的深度整合,进一步解决了数据集成和数据治理的问题,为企业提供更加高效和更具性价比的方案。
多模数据库Lindorm再升级:对接Dataphin,打通数据治理“最后一公里”
|
5月前
|
安全 数据管理
DataphinV4.1大升级:支持Lindorm开启高性价比数据治理,迎来“公共云半托管”云上自助新模式
DataphinV4.1大升级:支持Lindorm开启高性价比数据治理,迎来“公共云半托管”云上自助新模式
|
6月前
|
数据采集 安全 API
DataphinV4.1大升级: 支持Lindorm开启高性价比数据治理,迎来“公共云半托管”云上自助新模式
Dataphin 是阿里巴巴旗下的一个智能数据建设与治理平台,旨在帮助企业构建高效、可靠、安全的数据资产。在V4.1版本升级中,Dataphin 引入了Lindorm等多项新功能,并开启公共云半托管模式,优化代码搜索,为用户提供更加高效、灵活、安全的数据管理和运营环境,提升用户体验,促进企业数据资产的建设和价值挖掘。
1582 3
DataphinV4.1大升级: 支持Lindorm开启高性价比数据治理,迎来“公共云半托管”云上自助新模式
|
5月前
|
SQL 分布式计算 BI
实时计算 Flink版产品使用问题之基于宽表数据展示实时报表,该如何实现
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
6月前
|
存储 DataWorks 安全
DataWorks产品使用合集之没有使用独享资源组,如何将Lindorm中的数据导出或迁移到其他数据存储服务
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
52 0
|
6月前
|
时序数据库
时序数据库工具grafana里的$timeFilter查询1个小时内的数据如何写查询条件
【6月更文挑战第24天】时序数据库工具grafana里的$timeFilter查询1个小时内的数据如何写查询条件
788 0

热门文章

最新文章