网站流量日志分析--统计分析--漏斗模型转化分析 &hive 级联求和问题|学习笔记

简介: 快速学习网站流量日志分析--统计分析--漏斗模型转化分析 &hive 级联求和问题

开发者学堂课程【大数据分析之企业级网站流量运营分析系统开发实战(第四阶段)网站流量日志分析--统计分析--漏斗模型转化分析 &hive 级联求和问题】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/696/detail/12242


网站流量日志分析--统计分析--漏斗模型转化分析 &hive 级联求和问题


1、页面路径转化率的分析分析背后会包含非常生动的模型叫做漏斗模型在企业业务会定一个目标目标跟需求相关到达目标要制定业务流程流程有各不同的步骤用户按照步骤层层递进的过程最终到达目标问题在于在递进过程用户会因为各种各样内部外部的原因离开转化流程就会使得数据越越少最后形成漏斗模型上面大下面小漏斗模型可以到相关转化率的情况或流失率的情况根据相关的问题做出相关的改变

2、漏斗模型可以计算哪些指标并且在漏斗模型还隐藏着 have 非常深的问题因为如果只业务模型都可以理解非常的方便也非常的生动形象问题在于如何把指标转化成的 sql 层面进行计算

3、打开画图板进行逐级递减在企业所希望的是100%在层层递减的过程就形成漏斗模型

image.png

化,业务中制定的目标了到达目标会制定业务流程,在指引用根据流程到达目标的过程称之为转化

step

nums

1

1000

2

800

3

500

4

200

在漏斗模型中计算最多的就是转化率相反的词叫做流失率转数学层面可以知道转化率和流失率是同一种现象两种不同角度的描述转化60%意味着流失40%加起等于一每一步相对第一步的转化率都跟第一步相比较叫做绝对转化每一步相对上一步的转化率就是两步骤之间衔接有没有问题叫做相对转化业务从背后理解就是相处的过程比如500除以800是第三步相对于第二步,200除以500是第四相对于第三步寻找规律发现不管是绝对转化还是相对转化现象就是记算第二步的绝对转化需要第二步的数据800以及第一步的数据相处才能得到如果计算第四步的绝对转化需要第四步的200和第一步的1000,2001000才可以得到同样后面的指标也有规律存在

4、规律计算的每个指标除了依赖自己的当前行的数据还依赖之前行的数据一个指标的计算除自己当前相关还跟上一行相关称之为hive级联求和问题如果直接写sql是计算不出不可以两行数据第一行的一列第二行的一列进行操作因为当下操作sql的操作表的方式是基于行的就是能拿到一行一行的不同列不可能拿到多行取不同的

5、针对级别集合问题解题思路

自己和自己进行关联 join本质原因在于通过自己和自己 join 可以把当前行和之前行出现在一行中

6、比如数据处在三行中,如果需要a除以C或者C除以a不好操作但是如果给的数据是 abc 放在一行中可以在一行拿第一个字段和第三个字段本质是如何ab个出现在两行中变成一行join 就可以改变它不同列的abc可以出现九种结果可以通过 join 把数据多行变成一行再根据相关的规律寻找计算即可所以集合问题背后的规律非常重要只要发现出现一个指标需要当前行的数据和上一行的数据就用自己和自己join进行解决这是突破一类问题的核心点

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
25天前
|
存储 分布式计算 监控
【Flume】Flume 监听日志文件案例分析
【4月更文挑战第4天】【Flume】Flume 监听日志文件案例分析
|
4月前
|
监控 Android开发 C语言
深度解读Android崩溃日志案例分析2:tombstone日志
深度解读Android崩溃日志案例分析2:tombstone日志
86 0
|
4月前
|
Go 数据处理 Docker
elk stack部署自动化日志收集分析平台
elk stack部署自动化日志收集分析平台
81 0
|
7天前
|
机器学习/深度学习 前端开发 数据挖掘
工具变量法(两阶段最小二乘法2SLS)线性模型分析人均食品消费时间序列数据和回归诊断(下)
工具变量法(两阶段最小二乘法2SLS)线性模型分析人均食品消费时间序列数据和回归诊断
77 11
|
12天前
工具变量法(两阶段最小二乘法2SLS)线性模型分析人均食品消费时间序列数据和回归诊断2
工具变量法(两阶段最小二乘法2SLS)线性模型分析人均食品消费时间序列数据和回归诊断
18 0
|
13天前
|
机器学习/深度学习 前端开发 数据挖掘
R语言计量经济学:工具变量法(两阶段最小二乘法2SLS)线性模型分析人均食品消费时间序列数据和回归诊断
R语言计量经济学:工具变量法(两阶段最小二乘法2SLS)线性模型分析人均食品消费时间序列数据和回归诊断
40 0
|
24天前
|
SQL 存储 监控
日志问题精要:分析与总结
该文档讲述了应用系统日志记录的重要性和规则。主要目的是记录操作轨迹、监控系统状态和回溯故障。日志记录点包括系统入口、调用其他模块、调用结束、出口和出错时。内容应遵循UTF-8编码,避免敏感信息,按INFO级别记录,及时、完整且安全。日志输出要控制频率和长度,不影响系统性能,并按策略备份和清理。日志等级分为DEBUG、INFO、WARN、ERROR和FATAL。日志文件应有明确目录结构,大小有限制,并定期清理。注意事项包括输出异常堆栈、避免打印对象实例的hashCode、选择合适的日志框架和格式,并支持动态修改日志级别。还要实现链路追踪,确保在多线程环境中正确记录日志。
23 0
|
2月前
|
存储 监控 NoSQL
【Redis技术专区】「优化案例」谈谈使用Redis慢查询日志以及Redis慢查询分析指南
【Redis技术专区】「优化案例」谈谈使用Redis慢查询日志以及Redis慢查询分析指南
28 0
|
2月前
|
SQL JSON 算法
hive学习笔记
hive学习笔记
|
2月前
|
存储
Hudi Log日志文件格式分析(一)
Hudi Log日志文件格式分析(一)
27 1