网站流量日志分析--分析指标和分析模型--复合级指标|学习笔记

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 快速学习网站流量日志分析--分析指标和分析模型--复合级指标

开发者学堂课程【大数据分析之企业级网站流量运营分析系统开发实战(第三阶段) 网站流量日志分析--分析指标和分析模型--复合级指标】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/695/detail/12209


网站流量日志分析--分析指标和分析模型--复合级指标


内容介绍:

一.平均访问频度

二.人均浏览页数(平均访问深度)

三.平均访问时长

四.跳出率

 

复合级指标就是把一些基础指标做一些相关的组合。这些复合级指标在企业当中有具体的业务含义和需求,对于开发的来说,需要注意的是如何去解读这些复合机指标,把里面的业务,背景弄清楚,并且思考通过计算得出这些复合级指标。接下来介绍四个常见的复合级指标。


一.平均访问频度

第一个指标叫做平均访问频度,看到平均应该就会想到有一个除法操作,只有谁除以谁才可以得到一个平均。平均访问频度指的是平均每个独立访客一天内访问网站的次数或产生的 session 个数。通俗的说,一天之内每个人产生的平均会话数是多少。再直白一些,就是一个人一天来了几次。

所以,要想得到复合指标,需要得到一天内总的会话次数(session)/总的独立访客数。这两个数相除就得到了每个人一天之内人均会话数。而这两个指标指的就是基础指标中的VV和UV,即VV/UV,用VV除以UV就可以得到今天人均产生的会话数。但是这里有一个更专业的说法叫做平均访问频度。

平均访问频度一天之内人数均会话数

==总的会话次数(session)/总的独立访客数

==VV/UV


二.人均浏览页数(平均访问深度)

第二个复合级指标指的是人均浏览页数,它也有一个专业的说法叫做平均访问深度。深入的意思指的是当去浏览一个网站,或者打开一个页面就走了,浏览的深度就不够深。若浏览了七八个页面,十几个页面,说明在网站逗留的时间比较长,浏览的深度就比较多一点。所以平均访问深度背后所描述的是人均浏览的页数,这个均字又想到了一个除法,要用总的浏览页除以人,就得到了平均访问深度。

平均访问深度:一天之内人均浏览页面数。要想得到这个指标,用总的页面浏览数据/总的独立访客数。今天总的页面浏览数,打开页面就加一,指的就是PV,即等于 PV/UV。会发现它就是一些基础指标的复合,平均访问深度的好处是可以体现出网站对用户的吸引程度,一个吸引力。例如A网站的人均页数是3.2,B网站的人均页数是7.8,意味着一个人只要来到B网站,通常会打开七八个页面,这个网站肯定会有吸引力。如果你的网站人均浏览页数只有一点几,那意味着你的网站吸引力不够好。

但是需要知道,不会出现一个网站的人均浏览页数是零点几,小于一的情况。因为来到一个网站至少会打开一个页面,所以是至少一个PV,那么平均下来这个值至少是等于一。如果今天都来,这个网站都打开一次,那么平均下来平均值也是一,那一定不可能会产生小于一的情况。所以这种规定也从侧面告诉我们,在计算的时候,也可以帮我们去评估计算的指标到底有没有问题,这就是第二个指标人均浏览页数,也可以把它称之为平均访问深度。

平均访问深度:一天之内人均浏览页面数

==总的页面游览数、总的独立访客数

==PV/UV


三.平均访问时长

第三个指标叫做平均访问时长,它所描述的是平均每次访问在网站上停留的时间。要想计算这个指标,需要总的停留时间除以每次会话的次数。

这个指标非常简单,叫做平均访问时长。平均会话时长:平均每次会话停留的时间。需要用总的会话停留时间/会话次数,总的会话时间,需要把每次会话的时间加起来,会话次数就是俗称的 VV,这两个指标相除,就可以得到平均访问时长。平均访问时长也可体现出网站对访客的吸引程度,别人来到这个网站,平均访问时长只有一点几秒钟,打开一下网站就关闭走了,那这个网站是没有任何吸引程度的。若打开另一个网站,在这个页面上至少待个三五分钟,两三百秒,说明这个网站还是很有吸引力的,愿意花时间在这个网站上浏览一些信息。所以说些指标是有用的,它可以帮助我们业务去解读一些情况,体现网站对用户的吸引程度。

平均会话时长:平均每次会话停留的时间

=总的会话停留时间/会话次数vv


四.跳出率

第四个复合级指标叫做跳出率,这个指标描述的比较专业,即是指用户到达你的网站上,并在你的网站上仅浏览了一个页面就离开的访问次数与所有访问次数的百分比。若一个人今天来了,并且只浏览了一个页面,这样的人数与总的访问次数的百分比,就是跳出率。例如,进行计算首页的跳出率,需要去找出今天访问网站,第一个要求是访问网站且访问一个页面,这个页面要计算的是首页跳出率,所以该页面要是首页。

这样的访问次数,和总的访问次数的百分比,得出的就是首页的跳出率。即:首页跳出率=访问网站且访问一个页面且该页面是首页/总的访问次数。那么跳出率可以用来衡量网站在某个页面上的浏览情况,也是评价网站性能的重要指标。例如A网站首页跳出率为百分之百,可以解读为今天来到这个公司的用户都只打开一个页面,而页面都是主页,他们打开页面之后再也不往下继续浏览了,这意味着你们公司,你们网站对用户的吸引程度为0。跳出率为零意味着没有一个页面从页面上流失,大家都在这个页面上浏览,继续浏览其他页面,这是一个网站比较好的情况。

因此以上所说的几个复合级指标帮助业务,帮助需求,甚至帮助公司的老板去看待网站经营访问的情况。要做的就是要正确的解读这些指标背后所包含的业务含义,当中有无存在业务歧义,有无存在中文误差,时间范围到底是一天之内,还是一个月之内。每个公司都是不一样的,例如它让我们计算的一周之内的平均访问深度,也是可以计算的。理清沟通好确定出来这些复合极指标的具体含义,再根据这些含义去寻找相关的数据,思考如何通过处理数据把这些指标计算出来,这是作为大数据人员的职业。这就是第二类指标:复合级指标。

image.png

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
2天前
|
监控 安全 Linux
启用Linux防火墙日志记录和分析功能
为iptables启用日志记录对于监控进出流量至关重要
|
24天前
|
运维 监控 Cloud Native
一行代码都不改,Golang 应用链路指标日志全知道
本文将通过阿里云开源的 Golang Agent,帮助用户实现“一行代码都不改”就能获取到应用产生的各种观测数据,同时提升运维团队和研发团队的幸福感。
|
23天前
|
监控 应用服务中间件 定位技术
要统计Nginx的客户端IP,可以通过分析Nginx的访问日志文件来实现
要统计Nginx的客户端IP,可以通过分析Nginx的访问日志文件来实现
|
1月前
|
存储 SQL 监控
|
1月前
|
XML 安全 Java
【日志框架整合】Slf4j、Log4j、Log4j2、Logback配置模板
本文介绍了Java日志框架的基本概念和使用方法,重点讨论了SLF4J、Log4j、Logback和Log4j2之间的关系及其性能对比。SLF4J作为一个日志抽象层,允许开发者使用统一的日志接口,而Log4j、Logback和Log4j2则是具体的日志实现框架。Log4j2在性能上优于Logback,推荐在新项目中使用。文章还详细说明了如何在Spring Boot项目中配置Log4j2和Logback,以及如何使用Lombok简化日志记录。最后,提供了一些日志配置的最佳实践,包括滚动日志、统一日志格式和提高日志性能的方法。
343 30
【日志框架整合】Slf4j、Log4j、Log4j2、Logback配置模板
|
14天前
|
监控 安全 Apache
什么是Apache日志?为什么Apache日志分析很重要?
Apache是全球广泛使用的Web服务器软件,支持超过30%的活跃网站。它通过接收和处理HTTP请求,与后端服务器通信,返回响应并记录日志,确保网页请求的快速准确处理。Apache日志分为访问日志和错误日志,对提升用户体验、保障安全及优化性能至关重要。EventLog Analyzer等工具可有效管理和分析这些日志,增强Web服务的安全性和可靠性。
|
2月前
|
XML JSON Java
Logback 与 log4j2 性能对比:谁才是日志框架的性能王者?
【10月更文挑战第5天】在Java开发中,日志框架是不可或缺的工具,它们帮助我们记录系统运行时的信息、警告和错误,对于开发人员来说至关重要。在众多日志框架中,Logback和log4j2以其卓越的性能和丰富的功能脱颖而出,成为开发者们的首选。本文将深入探讨Logback与log4j2在性能方面的对比,通过详细的分析和实例,帮助大家理解两者之间的性能差异,以便在实际项目中做出更明智的选择。
332 3
|
24天前
|
存储 监控 安全
什么是事件日志管理系统?事件日志管理系统有哪些用处?
事件日志管理系统是IT安全的重要工具,用于集中收集、分析和解释来自组织IT基础设施各组件的事件日志,如防火墙、路由器、交换机等,帮助提升网络安全、实现主动威胁检测和促进合规性。系统支持多种日志类型,包括Windows事件日志、Syslog日志和应用程序日志,通过实时监测、告警及可视化分析,为企业提供强大的安全保障。然而,实施过程中也面临数据量大、日志管理和分析复杂等挑战。EventLog Analyzer作为一款高效工具,不仅提供实时监测与告警、可视化分析和报告功能,还支持多种合规性报告,帮助企业克服挑战,提升网络安全水平。
|
2月前
|
存储 缓存 关系型数据库
MySQL事务日志-Redo Log工作原理分析
事务的隔离性和原子性分别通过锁和事务日志实现,而持久性则依赖于事务日志中的`Redo Log`。在MySQL中,`Redo Log`确保已提交事务的数据能持久保存,即使系统崩溃也能通过重做日志恢复数据。其工作原理是记录数据在内存中的更改,待事务提交时写入磁盘。此外,`Redo Log`采用简单的物理日志格式和高效的顺序IO,确保快速提交。通过不同的落盘策略,可在性能和安全性之间做出权衡。
1709 14
|
1月前
|
存储 监控 安全
什么是日志管理,如何进行日志管理?
日志管理是对IT系统生成的日志数据进行收集、存储、分析和处理的实践,对维护系统健康、确保安全及获取运营智能至关重要。本文介绍了日志管理的基本概念、常见挑战、工具的主要功能及选择解决方案的方法,强调了定义管理目标、日志收集与分析、警报和报告、持续改进等关键步骤,以及如何应对数据量大、安全问题、警报疲劳等挑战,最终实现日志数据的有效管理和利用。
108 0