网站流量日志分析--统计分析--漏斗模型转化分析 &hive 级联求和问题|学习笔记

简介: 快速学习网站流量日志分析--统计分析--漏斗模型转化分析 &hive 级联求和问题

开发者学堂课程【大数据分析之企业级网站流量运营分析系统开发实战(第四阶段)网站流量日志分析--统计分析--漏斗模型转化分析 &hive 级联求和问题】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/696/detail/12242


网站流量日志分析--统计分析--漏斗模型转化分析 &hive 级联求和问题


1、页面路径转化率的分析分析背后会包含非常生动的模型叫做漏斗模型在企业业务会定一个目标目标跟需求相关到达目标要制定业务流程流程有各不同的步骤用户按照步骤层层递进的过程最终到达目标问题在于在递进过程用户会因为各种各样内部外部的原因离开转化流程就会使得数据越越少最后形成漏斗模型上面大下面小漏斗模型可以到相关转化率的情况或流失率的情况根据相关的问题做出相关的改变

2、漏斗模型可以计算哪些指标并且在漏斗模型还隐藏着 have 非常深的问题因为如果只业务模型都可以理解非常的方便也非常的生动形象问题在于如何把指标转化成的 sql 层面进行计算

3、打开画图板进行逐级递减在企业所希望的是100%在层层递减的过程就形成漏斗模型

image.png

化,业务中制定的目标了到达目标会制定业务流程,在指引用根据流程到达目标的过程称之为转化

step

nums

1

1000

2

800

3

500

4

200

在漏斗模型中计算最多的就是转化率相反的词叫做流失率转数学层面可以知道转化率和流失率是同一种现象两种不同角度的描述转化60%意味着流失40%加起等于一每一步相对第一步的转化率都跟第一步相比较叫做绝对转化每一步相对上一步的转化率就是两步骤之间衔接有没有问题叫做相对转化业务从背后理解就是相处的过程比如500除以800是第三步相对于第二步,200除以500是第四相对于第三步寻找规律发现不管是绝对转化还是相对转化现象就是记算第二步的绝对转化需要第二步的数据800以及第一步的数据相处才能得到如果计算第四步的绝对转化需要第四步的200和第一步的1000,2001000才可以得到同样后面的指标也有规律存在

4、规律计算的每个指标除了依赖自己的当前行的数据还依赖之前行的数据一个指标的计算除自己当前相关还跟上一行相关称之为hive级联求和问题如果直接写sql是计算不出不可以两行数据第一行的一列第二行的一列进行操作因为当下操作sql的操作表的方式是基于行的就是能拿到一行一行的不同列不可能拿到多行取不同的

5、针对级别集合问题解题思路

自己和自己进行关联 join本质原因在于通过自己和自己 join 可以把当前行和之前行出现在一行中

6、比如数据处在三行中,如果需要a除以C或者C除以a不好操作但是如果给的数据是 abc 放在一行中可以在一行拿第一个字段和第三个字段本质是如何ab个出现在两行中变成一行join 就可以改变它不同列的abc可以出现九种结果可以通过 join 把数据多行变成一行再根据相关的规律寻找计算即可所以集合问题背后的规律非常重要只要发现出现一个指标需要当前行的数据和上一行的数据就用自己和自己join进行解决这是突破一类问题的核心点

相关实践学习
【涂鸦即艺术】基于云应用开发平台CAP部署AI实时生图绘板
【涂鸦即艺术】基于云应用开发平台CAP部署AI实时生图绘板
相关文章
|
Linux 应用服务中间件 PHP
性能工具之linux常见日志统计分析命令
通过本文的介绍,我相信同学们一定会发现 linux三剑客强大之处。在命令行中,它还能够接受,和执行外部的 AWK 程序文件,可以对文本信息进行非常复杂的处理,可以说“只有想不到的,没有它做不到的。
471 1
|
存储 运维 监控
超越传统模型:从零开始构建高效的日志分析平台——基于Elasticsearch的实战指南
【10月更文挑战第8天】随着互联网应用和微服务架构的普及,系统产生的日志数据量日益增长。有效地收集、存储、检索和分析这些日志对于监控系统健康状态、快速定位问题以及优化性能至关重要。Elasticsearch 作为一种分布式的搜索和分析引擎,以其强大的全文检索能力和实时数据分析能力成为日志处理的理想选择。
1101 6
|
人工智能 运维 监控
一招高效解析 Access Log,轻松应对泼天流量
一招高效解析 Access Log,轻松应对泼天流量
242 0
一招高效解析 Access Log,轻松应对泼天流量
|
SQL 存储 人工智能
阿里云日志服务的傻瓜式极易预测模型
预测服务有助于提前规划,减少资源消耗和成本。阿里云日志服务的AI预测服务简化了数学建模,仅需SQL操作即可预测未来指标,具备高准确性,并能处理远期预测。此外,通过ScheduledSQL功能,可将预测任务自动化,定时执行并保存结果。
415 3
|
监控 网络协议 CDN
阿里云国际监控查询流量、用量查询流量与日志统计流量有差异?
阿里云国际监控查询流量、用量查询流量与日志统计流量有差异?
|
存储 弹性计算 监控
日志服务SLS最佳实践:通过SLS数据加工从VPC flowlog中过滤出跨region CEN流量
本文就通过一个客户的实际案例开介绍如何使用在无法直接开启CEN flowlog的情况下,使用SLS的数据加工能力,从VPC flowlog的数据中过滤出客户需要的流量日志出来。
752 0
日志服务SLS最佳实践:通过SLS数据加工从VPC flowlog中过滤出跨region CEN流量
|
XML 安全 Java
【日志框架整合】Slf4j、Log4j、Log4j2、Logback配置模板
本文介绍了Java日志框架的基本概念和使用方法,重点讨论了SLF4J、Log4j、Logback和Log4j2之间的关系及其性能对比。SLF4J作为一个日志抽象层,允许开发者使用统一的日志接口,而Log4j、Logback和Log4j2则是具体的日志实现框架。Log4j2在性能上优于Logback,推荐在新项目中使用。文章还详细说明了如何在Spring Boot项目中配置Log4j2和Logback,以及如何使用Lombok简化日志记录。最后,提供了一些日志配置的最佳实践,包括滚动日志、统一日志格式和提高日志性能的方法。
4629 31
【日志框架整合】Slf4j、Log4j、Log4j2、Logback配置模板
|
监控 安全 Apache
什么是Apache日志?为什么Apache日志分析很重要?
Apache是全球广泛使用的Web服务器软件,支持超过30%的活跃网站。它通过接收和处理HTTP请求,与后端服务器通信,返回响应并记录日志,确保网页请求的快速准确处理。Apache日志分为访问日志和错误日志,对提升用户体验、保障安全及优化性能至关重要。EventLog Analyzer等工具可有效管理和分析这些日志,增强Web服务的安全性和可靠性。
521 9
|
11月前
|
监控 容灾 算法
阿里云 SLS 多云日志接入最佳实践:链路、成本与高可用性优化
本文探讨了如何高效、经济且可靠地将海外应用与基础设施日志统一采集至阿里云日志服务(SLS),解决全球化业务扩展中的关键挑战。重点介绍了高性能日志采集Agent(iLogtail/LoongCollector)在海外场景的应用,推荐使用LoongCollector以获得更优的稳定性和网络容错能力。同时分析了多种网络接入方案,包括公网直连、全球加速优化、阿里云内网及专线/CEN/VPN接入等,并提供了成本优化策略和多目标发送配置指导,帮助企业构建稳定、低成本、高可用的全球日志系统。
1064 54