网站流量日志分析--分析指标和分析模型--基础级指标|学习笔记

简介: 快速学习网站流量日志分析--分析指标和分析模型--基础级指标

开发者学堂课程【大数据分析之企业级网站流量运营分析系统开发实战(第三阶段) 网站流量日志分析--分析指标和分析模型--基础级指标】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/695/detail/12208


网站流量日志分析--分析指标和分析模型--基础级指标


内容介绍:

一.pageview 浏览次数(PC)

二.uniquevisitor 独立访客数(UV)

三.访问次数(VV)

四.IP


网站分析中一些常见的指标分类。指标对网站分析来说非常重要,通过各种指标可以去衡量记录网站访问者的一些行为。例如流量,流量多,流量少,流量就是一个指标,但是这个指标描述的不够专业。

在企业当中这个指标往往因为业务的进行不断的增加,给业务人员,需求人员提取出来新的指标,需要根据这些指标进行计算。最重要的一点是指标的正确解读,当中有没有奇异,有没有多音字,语义上的差异,要跟我们的需求沟通清楚。在网站分析中一些常见的指标。第一部分是基础及指标,骨灰级的指标。可以说任何一家公司任何一个网站,只要你开展网站分析,这些指标应该就会出现,因为这些指标衡量的信息非常的基本,非常的重要。


一.pageview 浏览次数(PC)

PV 的名称叫做 pageview 浏览次数,即用户没打开一个网站页面,记录一个 PV 值,看到打开同一页面,PV 累计多次,通俗解释就是页面被加载的总次数,也就是浏览器加服务器发行一个,请求加载一次,PV 值就会加1。例如,打开浏览器访问百度,此时一刷新一加载,百度的 PV 值就会加1,此时按一下刷新键,PV 值还会加1,再按一下键盘上的 f5,PV 级还是会加1。

也就是说,只要向服务器发起请求,这个页面就会被加载一次,PV 值就会累计加1。所以PV的通俗解释就是页面被加载的总次数,但是要记住,仅仅通过这个 PV 值,并不能得出什么结论。例如A网站今天的 PV 值是1000万,B 网站的 PV 值是10万,并不能说a网站来的人比较多,因为这1000万可能是一个人来这个网站,你们可能是这个人一直在按f5在刷新,可能写了一个爬虫不断的来请求,可能会造成 PV 值增大,但不见得是人多。单独的看指标没有过多的意义。要想增加人的关系。


二.uniquevisitor 独立访客数(UV)

第二个基础级指标叫做uv,全称叫做 uniquevisitor 独立访客数,指的是一天之内,访问网站的不重复用户数。说的直白一点,当你今天来到一个网站,无论你来了多少次,我只计算一次,叫做独立访客数,这就可以表示来这个网站的人数多与少。访客的识别,在过去通常以IP来表示访客,但是现在用IP来表示访客已经不精准了,例如在同一个小区,同一家公司当中同一栋楼当中,可能不同的用户,但是官网 IP 就是一个 IP,也就是所谓的 NVT,Net 一直转换,在内网中都是不同的用户,但是出去官网可能都是同一个 IP。所以这是用 IP 来计算的,可能更加精准。

现在可以使用 Cookie 用户的标识来进行独立访客的识别,这叫做 UV,UV 和 PV 之间存在一个天然的关系,PV 是不可能小于 UV 的,因为只要你今天来了十个人,至少每个人会打开一个页面,如果一个页面都没有打开,那就不知道你来了,只要你来了,今天就会打开一个页面,也就是说这两个指标存在的客观逻辑是:PV 一定是大于等于 UV 的。当它相等的时候意味着今天来的人都打开了一个页面就走了。通常来说 PV 是大于 UV 的,一定不会出现 PV<UV。


三.访问次数(VV)

第三个指标是 VV 访问次数,访问次数里面的次不是页面次数,而是会话的次数。会话 session 概念,在网站上的一系列活动称为一次会话。前后会话的识别,通常以前后两段的时间差来表示不同的会话。再一次会话中,可能只访问一个页面,打开一个页面,产生一个PV,也可能打开多个页面,产生多个 PV,通过这样的指标,又可以衡量出访问的次数。


四.IP

最后一个指标叫做 IP,过去十年IP可能用来表示 UV 访客数,不同的IP表示不同的人,但是现在的 IP 已经不能表示不同的人了,因为它不够精准。但是现在可以 用 IP 来访客的地理位置信息。不同的IP背后可以解读出不同的云商。例如,打开百度浏览器,输入一个 IP,我当前的ip就会被识别出来,来自于北京。此时要是分析地理相关,就知道可以根据IP来分析来自网站的人有多少。

为了更加准确的理解这几个基础标,举个例子:张三今天上午来到网站打开3个页面,下午来到网站打开2个页面,晚上又来到网站打开5个页面,问:PV,UV, VV,IP是多少?首先必须明白 PV 代表什么意思,PV 指的是页面加载总次数,今天上午来三个页面,下午来两个页面,晚上又来五个页面,只要打开页面一次就加一,所以 PV 数就是3+2+5=10。第二个是 UV,指的是独立访客数,不管来多少次,只算一次,无论是上午来,下午来,还是晚上来,只要在一天之内,无论你来多少次,都只算一次,所以张三产生的 UV 值是1,因为他今天只来了一次。下面一个是 VV,叫做会话次数,涉及到会话的识别,张三上午来,下午来,晚上来,中间的时差应该在30分钟以上,此时具体来说,还要根据数据来做一个判断,如果是30分钟以上,那就是上午一个会话,下午一个会话,晚上一个会话,所以今天产生的次数是三会话。最后一个指标 IP,指的是一天之内不重复的 IP 数,不论你今天来多少次,只要你是同一个用户,IP 值计算为1。现在只能表示它为地理位置信息,这样就计算出这几个基础指标。

通过这个简单的例子,再去梳理这四个基础指标背后的含义,在企业中对指标的业务解读极其重要。如果解读失败了,他的条件没有看清,那后面分析出来的指标可能就是错误的。而这几个指标是在网站分析中是非常常见的,称之为基础级指标,也称为骨灰级指标,任何一家公司网站都必须存在,理解 PV,UV,VV,IP 含义。

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
2天前
|
存储 监控 NoSQL
【MongoDB 专栏】MongoDB 的日志管理与分析
【5月更文挑战第11天】MongoDB日志管理与分析至关重要,包括系统日志和操作日志,用于监控、故障排查和性能优化。合理配置日志详细程度、存储位置和保留策略,使用日志分析工具提升效率,发现性能瓶颈和安全性问题。日志分析有助于优化查询、调整配置,确保数据安全,并可与其他监控系统集成。面对日志量增长的挑战,需采用新技术如分布式存储和数据压缩来保障存储和传输。随着技术发展,不断进化日志管理与分析能力,以支持MongoDB的稳定高效运行。
【MongoDB 专栏】MongoDB 的日志管理与分析
|
14天前
|
存储 监控 关系型数据库
PHP编写的电脑监控软件:用户登录日志记录与分析
使用PHP编写简单但功能强大的电脑监控软件,记录用户登录日志并进行分析。代码示例展示了如何获取并存储用户IP地址和登录时间到数据库,然后进行登录数据的分析,如计算登录频率和常见登录时间。此外,还介绍了如何通过定时任务自动将监控数据提交到网站,以便实时监控用户活动,提升系统安全性和稳定性。
43 0
|
15天前
|
数据可视化
R语言两阶段最小⼆乘法2SLS回归、工具变量法分析股息收益、股权溢价和surfaces曲面图可视化
R语言两阶段最小⼆乘法2SLS回归、工具变量法分析股息收益、股权溢价和surfaces曲面图可视化
|
20天前
|
机器学习/深度学习 前端开发 数据挖掘
工具变量法(两阶段最小二乘法2SLS)线性模型分析人均食品消费时间序列数据和回归诊断(下)
工具变量法(两阶段最小二乘法2SLS)线性模型分析人均食品消费时间序列数据和回归诊断
223 11
|
1月前
|
安全 Linux 网络安全
/var/log/secure日志详解
Linux系统的 `/var/log/secure` 文件记录安全相关消息,包括身份验证和授权尝试。它涵盖用户登录(成功或失败)、`sudo` 使用、账户锁定解锁及其他安全事件和PAM错误。例如,SSH登录成功会显示&quot;Accepted password&quot;,失败则显示&quot;Failed password&quot;。查看此文件可使用 `tail -f /var/log/secure`,但通常只有root用户有权访问。
116 4
|
6天前
|
C++
JNI Log 日志输出
JNI Log 日志输出
15 1
|
7天前
|
存储 运维 大数据
聊聊日志硬扫描,阿里 Log Scan 的设计与实践
泛日志(Log/Trace/Metric)是大数据的重要组成,伴随着每一年业务峰值的新脉冲,日志数据量在快速增长。同时,业务数字化运营、软件可观测性等浪潮又在对日志的存储、计算提出更高的要求。
|
13天前
|
XML Java Maven
Springboot整合与使用log4j2日志框架【详解版】
该文介绍了如何在Spring Boot中切换默认的LogBack日志系统至Log4j2。首先,需要在Maven依赖中排除`spring-boot-starter-logging`并引入`spring-boot-starter-log4j2`。其次,创建`log4j2-spring.xml`配置文件放在`src/main/resources`下,配置包括控制台和文件的日志输出、日志格式和文件切分策略。此外,可通过在不同环境的`application.yml`中指定不同的log4j2配置文件。最后,文章提到通过示例代码解释了日志格式中的各种占位符含义。
|
13天前
|
运维 监控 Go
Golang深入浅出之-Go语言中的日志记录:log与logrus库
【4月更文挑战第27天】本文比较了Go语言中标准库`log`与第三方库`logrus`的日志功能。`log`简单但不支持日志级别配置和多样化格式,而`logrus`提供更丰富的功能,如日志级别控制、自定义格式和钩子。文章指出了使用`logrus`时可能遇到的问题,如全局logger滥用、日志级别设置不当和过度依赖字段,并给出了避免错误的建议,强调理解日志级别、合理利用结构化日志、模块化日志管理和定期审查日志配置的重要性。通过这些实践,开发者能提高应用监控和故障排查能力。
88 1
|
14天前
|
弹性计算 运维 Shell