网站流量日志分析--统计分析--漏斗模型转化分析 &hive 级联求和问题|学习笔记

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 快速学习网站流量日志分析--统计分析--漏斗模型转化分析 &hive 级联求和问题

开发者学堂课程【大数据分析之企业级网站流量运营分析系统开发实战(第四阶段)网站流量日志分析--统计分析--漏斗模型转化分析 &hive 级联求和问题】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/696/detail/12242


网站流量日志分析--统计分析--漏斗模型转化分析 &hive 级联求和问题


1、页面路径转化率的分析分析背后会包含非常生动的模型叫做漏斗模型在企业业务会定一个目标目标跟需求相关到达目标要制定业务流程流程有各不同的步骤用户按照步骤层层递进的过程最终到达目标问题在于在递进过程用户会因为各种各样内部外部的原因离开转化流程就会使得数据越越少最后形成漏斗模型上面大下面小漏斗模型可以到相关转化率的情况或流失率的情况根据相关的问题做出相关的改变

2、漏斗模型可以计算哪些指标并且在漏斗模型还隐藏着 have 非常深的问题因为如果只业务模型都可以理解非常的方便也非常的生动形象问题在于如何把指标转化成的 sql 层面进行计算

3、打开画图板进行逐级递减在企业所希望的是100%在层层递减的过程就形成漏斗模型

image.png

化,业务中制定的目标了到达目标会制定业务流程,在指引用根据流程到达目标的过程称之为转化

step

nums

1

1000

2

800

3

500

4

200

在漏斗模型中计算最多的就是转化率相反的词叫做流失率转数学层面可以知道转化率和流失率是同一种现象两种不同角度的描述转化60%意味着流失40%加起等于一每一步相对第一步的转化率都跟第一步相比较叫做绝对转化每一步相对上一步的转化率就是两步骤之间衔接有没有问题叫做相对转化业务从背后理解就是相处的过程比如500除以800是第三步相对于第二步,200除以500是第四相对于第三步寻找规律发现不管是绝对转化还是相对转化现象就是记算第二步的绝对转化需要第二步的数据800以及第一步的数据相处才能得到如果计算第四步的绝对转化需要第四步的200和第一步的1000,2001000才可以得到同样后面的指标也有规律存在

4、规律计算的每个指标除了依赖自己的当前行的数据还依赖之前行的数据一个指标的计算除自己当前相关还跟上一行相关称之为hive级联求和问题如果直接写sql是计算不出不可以两行数据第一行的一列第二行的一列进行操作因为当下操作sql的操作表的方式是基于行的就是能拿到一行一行的不同列不可能拿到多行取不同的

5、针对级别集合问题解题思路

自己和自己进行关联 join本质原因在于通过自己和自己 join 可以把当前行和之前行出现在一行中

6、比如数据处在三行中,如果需要a除以C或者C除以a不好操作但是如果给的数据是 abc 放在一行中可以在一行拿第一个字段和第三个字段本质是如何ab个出现在两行中变成一行join 就可以改变它不同列的abc可以出现九种结果可以通过 join 把数据多行变成一行再根据相关的规律寻找计算即可所以集合问题背后的规律非常重要只要发现出现一个指标需要当前行的数据和上一行的数据就用自己和自己join进行解决这是突破一类问题的核心点

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
4月前
|
存储 运维 监控
超越传统模型:从零开始构建高效的日志分析平台——基于Elasticsearch的实战指南
【10月更文挑战第8天】随着互联网应用和微服务架构的普及,系统产生的日志数据量日益增长。有效地收集、存储、检索和分析这些日志对于监控系统健康状态、快速定位问题以及优化性能至关重要。Elasticsearch 作为一种分布式的搜索和分析引擎,以其强大的全文检索能力和实时数据分析能力成为日志处理的理想选择。
343 6
|
21天前
|
机器学习/深度学习 人工智能 运维
智能日志分析:用AI点亮运维的未来
智能日志分析:用AI点亮运维的未来
148 15
|
1月前
|
SQL 关系型数据库 MySQL
MySQL事务日志-Undo Log工作原理分析
事务的持久性是交由Redo Log来保证,原子性则是交由Undo Log来保证。如果事务中的SQL执行到一半出现错误,需要把前面已经执行过的SQL撤销以达到原子性的目的,这个过程也叫做"回滚",所以Undo Log也叫回滚日志。
MySQL事务日志-Undo Log工作原理分析
|
2月前
|
存储 运维 监控
Linux--深入理与解linux文件系统与日志文件分析
深入理解 Linux 文件系统和日志文件分析,对于系统管理员和运维工程师来说至关重要。文件系统管理涉及到文件的组织、存储和检索,而日志文件则记录了系统和应用的运行状态,是排查故障和维护系统的重要依据。通过掌握文件系统和日志文件的管理和分析技能,可以有效提升系统的稳定性和安全性。
58 7
|
2月前
|
监控 安全 Linux
启用Linux防火墙日志记录和分析功能
为iptables启用日志记录对于监控进出流量至关重要
|
2月前
|
监控 应用服务中间件 定位技术
要统计Nginx的客户端IP,可以通过分析Nginx的访问日志文件来实现
要统计Nginx的客户端IP,可以通过分析Nginx的访问日志文件来实现
206 3
|
3月前
|
存储 SQL 监控
|
3月前
|
运维 监控 安全
|
4月前
|
PyTorch 算法框架/工具
Pytorch学习笔记(七):F.softmax()和F.log_softmax函数详解
本文介绍了PyTorch中的F.softmax()和F.log_softmax()函数的语法、参数和使用示例,解释了它们在进行归一化处理时的作用和区别。
628 1
Pytorch学习笔记(七):F.softmax()和F.log_softmax函数详解
|
3月前
|
监控 关系型数据库 MySQL
分析慢查询日志
【10月更文挑战第29天】分析慢查询日志
85 3

热门文章

最新文章