网站流量日志分析--分析指标和分析模型--复合级指标|学习笔记

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 快速学习网站流量日志分析--分析指标和分析模型--复合级指标

开发者学堂课程【大数据分析之企业级网站流量运营分析系统开发实战(第三阶段) 网站流量日志分析--分析指标和分析模型--复合级指标】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/695/detail/12209


网站流量日志分析--分析指标和分析模型--复合级指标


内容介绍:

一.平均访问频度

二.人均浏览页数(平均访问深度)

三.平均访问时长

四.跳出率

 

复合级指标就是把一些基础指标做一些相关的组合。这些复合级指标在企业当中有具体的业务含义和需求,对于开发的来说,需要注意的是如何去解读这些复合机指标,把里面的业务,背景弄清楚,并且思考通过计算得出这些复合级指标。接下来介绍四个常见的复合级指标。


一.平均访问频度

第一个指标叫做平均访问频度,看到平均应该就会想到有一个除法操作,只有谁除以谁才可以得到一个平均。平均访问频度指的是平均每个独立访客一天内访问网站的次数或产生的 session 个数。通俗的说,一天之内每个人产生的平均会话数是多少。再直白一些,就是一个人一天来了几次。

所以,要想得到复合指标,需要得到一天内总的会话次数(session)/总的独立访客数。这两个数相除就得到了每个人一天之内人均会话数。而这两个指标指的就是基础指标中的VV和UV,即VV/UV,用VV除以UV就可以得到今天人均产生的会话数。但是这里有一个更专业的说法叫做平均访问频度。

平均访问频度一天之内人数均会话数

==总的会话次数(session)/总的独立访客数

==VV/UV


二.人均浏览页数(平均访问深度)

第二个复合级指标指的是人均浏览页数,它也有一个专业的说法叫做平均访问深度。深入的意思指的是当去浏览一个网站,或者打开一个页面就走了,浏览的深度就不够深。若浏览了七八个页面,十几个页面,说明在网站逗留的时间比较长,浏览的深度就比较多一点。所以平均访问深度背后所描述的是人均浏览的页数,这个均字又想到了一个除法,要用总的浏览页除以人,就得到了平均访问深度。

平均访问深度:一天之内人均浏览页面数。要想得到这个指标,用总的页面浏览数据/总的独立访客数。今天总的页面浏览数,打开页面就加一,指的就是PV,即等于 PV/UV。会发现它就是一些基础指标的复合,平均访问深度的好处是可以体现出网站对用户的吸引程度,一个吸引力。例如A网站的人均页数是3.2,B网站的人均页数是7.8,意味着一个人只要来到B网站,通常会打开七八个页面,这个网站肯定会有吸引力。如果你的网站人均浏览页数只有一点几,那意味着你的网站吸引力不够好。

但是需要知道,不会出现一个网站的人均浏览页数是零点几,小于一的情况。因为来到一个网站至少会打开一个页面,所以是至少一个PV,那么平均下来这个值至少是等于一。如果今天都来,这个网站都打开一次,那么平均下来平均值也是一,那一定不可能会产生小于一的情况。所以这种规定也从侧面告诉我们,在计算的时候,也可以帮我们去评估计算的指标到底有没有问题,这就是第二个指标人均浏览页数,也可以把它称之为平均访问深度。

平均访问深度:一天之内人均浏览页面数

==总的页面游览数、总的独立访客数

==PV/UV


三.平均访问时长

第三个指标叫做平均访问时长,它所描述的是平均每次访问在网站上停留的时间。要想计算这个指标,需要总的停留时间除以每次会话的次数。

这个指标非常简单,叫做平均访问时长。平均会话时长:平均每次会话停留的时间。需要用总的会话停留时间/会话次数,总的会话时间,需要把每次会话的时间加起来,会话次数就是俗称的 VV,这两个指标相除,就可以得到平均访问时长。平均访问时长也可体现出网站对访客的吸引程度,别人来到这个网站,平均访问时长只有一点几秒钟,打开一下网站就关闭走了,那这个网站是没有任何吸引程度的。若打开另一个网站,在这个页面上至少待个三五分钟,两三百秒,说明这个网站还是很有吸引力的,愿意花时间在这个网站上浏览一些信息。所以说些指标是有用的,它可以帮助我们业务去解读一些情况,体现网站对用户的吸引程度。

平均会话时长:平均每次会话停留的时间

=总的会话停留时间/会话次数vv


四.跳出率

第四个复合级指标叫做跳出率,这个指标描述的比较专业,即是指用户到达你的网站上,并在你的网站上仅浏览了一个页面就离开的访问次数与所有访问次数的百分比。若一个人今天来了,并且只浏览了一个页面,这样的人数与总的访问次数的百分比,就是跳出率。例如,进行计算首页的跳出率,需要去找出今天访问网站,第一个要求是访问网站且访问一个页面,这个页面要计算的是首页跳出率,所以该页面要是首页。

这样的访问次数,和总的访问次数的百分比,得出的就是首页的跳出率。即:首页跳出率=访问网站且访问一个页面且该页面是首页/总的访问次数。那么跳出率可以用来衡量网站在某个页面上的浏览情况,也是评价网站性能的重要指标。例如A网站首页跳出率为百分之百,可以解读为今天来到这个公司的用户都只打开一个页面,而页面都是主页,他们打开页面之后再也不往下继续浏览了,这意味着你们公司,你们网站对用户的吸引程度为0。跳出率为零意味着没有一个页面从页面上流失,大家都在这个页面上浏览,继续浏览其他页面,这是一个网站比较好的情况。

因此以上所说的几个复合级指标帮助业务,帮助需求,甚至帮助公司的老板去看待网站经营访问的情况。要做的就是要正确的解读这些指标背后所包含的业务含义,当中有无存在业务歧义,有无存在中文误差,时间范围到底是一天之内,还是一个月之内。每个公司都是不一样的,例如它让我们计算的一周之内的平均访问深度,也是可以计算的。理清沟通好确定出来这些复合极指标的具体含义,再根据这些含义去寻找相关的数据,思考如何通过处理数据把这些指标计算出来,这是作为大数据人员的职业。这就是第二类指标:复合级指标。

image.png

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
5月前
|
存储 Java 关系型数据库
基于JSP的九宫格日志网站
基于JSP的九宫格日志网站
|
6月前
|
监控 安全 前端开发
Nginx 访问日志中有 Get 别的网站的请求是什么原因?
Nginx 访问日志中有 Get 别的网站的请求是什么原因?
87 0
|
13天前
|
XML 安全 Java
【日志框架整合】Slf4j、Log4j、Log4j2、Logback配置模板
本文介绍了Java日志框架的基本概念和使用方法,重点讨论了SLF4J、Log4j、Logback和Log4j2之间的关系及其性能对比。SLF4J作为一个日志抽象层,允许开发者使用统一的日志接口,而Log4j、Logback和Log4j2则是具体的日志实现框架。Log4j2在性能上优于Logback,推荐在新项目中使用。文章还详细说明了如何在Spring Boot项目中配置Log4j2和Logback,以及如何使用Lombok简化日志记录。最后,提供了一些日志配置的最佳实践,包括滚动日志、统一日志格式和提高日志性能的方法。
123 30
【日志框架整合】Slf4j、Log4j、Log4j2、Logback配置模板
|
1月前
|
XML JSON Java
Logback 与 log4j2 性能对比:谁才是日志框架的性能王者?
【10月更文挑战第5天】在Java开发中,日志框架是不可或缺的工具,它们帮助我们记录系统运行时的信息、警告和错误,对于开发人员来说至关重要。在众多日志框架中,Logback和log4j2以其卓越的性能和丰富的功能脱颖而出,成为开发者们的首选。本文将深入探讨Logback与log4j2在性能方面的对比,通过详细的分析和实例,帮助大家理解两者之间的性能差异,以便在实际项目中做出更明智的选择。
226 3
|
3月前
|
Kubernetes Ubuntu Windows
【Azure K8S | AKS】分享从AKS集群的Node中查看日志的方法(/var/log)
【Azure K8S | AKS】分享从AKS集群的Node中查看日志的方法(/var/log)
131 3
|
1月前
|
存储 缓存 关系型数据库
MySQL事务日志-Redo Log工作原理分析
事务的隔离性和原子性分别通过锁和事务日志实现,而持久性则依赖于事务日志中的`Redo Log`。在MySQL中,`Redo Log`确保已提交事务的数据能持久保存,即使系统崩溃也能通过重做日志恢复数据。其工作原理是记录数据在内存中的更改,待事务提交时写入磁盘。此外,`Redo Log`采用简单的物理日志格式和高效的顺序IO,确保快速提交。通过不同的落盘策略,可在性能和安全性之间做出权衡。
1631 14
|
1月前
|
Python
log日志学习
【10月更文挑战第9天】 python处理log打印模块log的使用和介绍
31 0
|
1月前
|
数据可视化
Tensorboard可视化学习笔记(一):如何可视化通过网页查看log日志
关于如何使用TensorBoard进行数据可视化的教程,包括TensorBoard的安装、配置环境变量、将数据写入TensorBoard、启动TensorBoard以及如何通过网页查看日志文件。
197 0
|
1月前
|
存储 分布式计算 NoSQL
大数据-136 - ClickHouse 集群 表引擎详解1 - 日志、Log、Memory、Merge
大数据-136 - ClickHouse 集群 表引擎详解1 - 日志、Log、Memory、Merge
40 0
|
1月前
|
缓存 Linux 编译器
【C++】CentOS环境搭建-安装log4cplus日志组件包及报错解决方案
通过上述步骤,您应该能够在CentOS环境中成功安装并使用log4cplus日志组件。面对任何安装或使用过程中出现的问题,仔细检查错误信息,对照提供的解决方案进行调整,通常都能找到合适的解决之道。log4cplus的强大功能将为您的项目提供灵活、高效的日志管理方案,助力软件开发与维护。
54 0