网站流量日志分析—分析指标和分析模型—受访、访客分析模型|学习笔记

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 快速学习网站流量日志分析—分析指标和分析模型—受访、访客分析模型

开发者学堂课程【大数据分析之企业级网站流量运营分析系统开发实战(第三阶段) 网站流量日志分析—分析指标和分析模型—受访、访客分析模型】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/695/detail/12211


网站流量日志分析—分析指标和分析模型—受访、访客分析模型


受访这两个字可以理解为受到访问,它所描述的就是网站的页面和域名被用户访问的情况。

打开数据看一下,在数据当中正好有一个字段叫做 request ,z 这个字段所描述的是用户请求网站,请求的是哪一个资源哪一个路径,比如说有的是图片,有的是请求的文本,还有请求斜杆的,通过专业知识解读应该知道背后所反应请求的是网站的首页,因为只有该目录下问页面就是首页。那么这个就是表示用户访问网站的受访情况,可以

image.png

分析好多指标,比如统计昨天访问页面受访页面,看一下昨天的页面有哪几个分别访问多少,这时候可以看一下对比分析,分析2018年1月1号访问网站最多的页面是首页,但是发现1月2号首页下降20%,登录页做了一个上升,注册页做了一个上升,这样再做一个升降榜,这样就可以看到每天的访问页面波动情况。这些指标最终计算出来可能难度不大,根据不同栏目不同的页面进行分组同进,但是构建出来这样的一个升降榜,波动情况又构成了一个受访分析模型。

image.png

如上图,左边就是统计每个页面的情况,比如斜杠代表根目录,具体到下面每个字,当中有当天请求页面数还有升降波动的情况,比如昨天是100今天是800,降了20%,今天升了35%,昨天和今天持平,这样看一眼页面在这一天相对于昨天波动情况,这个就构成第二个受访分析。

接下来最后一个分析是访客分析,主要与用户相关。访客分析分析很多,根据 IP 关联不同地方,对应上的网站息息相关。比如说游戏直播类的网站,直播最重要的是带宽网站的一个访问速度,国内有不同的运营商电信,移动,如果五个省运营商配合的不好,发现访问网站之后非常卡,用户将变低,低了之后不能刷礼物,收入情况降低,所以这个开展分析。再比如说终端情况分析,终端在数据当中有一个字段,叫做 user agent 检测 ua 就是终端信息,这里面可以记录下来访问的网站使用的是什么浏览器,什么版本,什么平台。根据终端就可以解读出来这个用户是怎么来的,当下企业当中访问网站主流的两种情况,要么是 PC 电脑端,要么手机移动端,同样的访问针对不同的终端需要进行不同的优化,以手机来说是分为安卓和苹果手机,同样的 PC 端分为 windows 平台、Mark 平台,对它进行优化。如果发现公司当中90%的人都是通过安卓手机来的,是否对安卓手机进行相关特殊的优化。

接下来是新老访客分析,新访是没有来过,老访是来过,问题在于怎样把新老访客分析计算出来。举个例子,今天通过相关的计算得到一些IP ,今天的访客有 IP1、IP2、IP3,这些访客哪些是新哪些是老,做一个比对,这时候把这两个数据作为一个关联比较判断,当中有的,能查询到就是老访客,没有就是新访客,这样又能构成一个模型进行相关的展示。

image.png

有个图叫做热力图(如上图),这个在全国重大场合都能看到这个图,这个图是不同省份不同地域所在的百分比情况,非常直观便捷,统计出来北京来了50%,上海来了20%,广东来了10%,这些数据计算出来直接给人看肯定会是枯燥无聊的,不能够理解,但是来到热力图,相信只要眼睛不是有问题,颜色越深来的越多,颜色越浅的来的越少,这就是另外一个展示模型。可以发现这里所说的各种模型背后都跟数据展示,数据课时化相关,这些模型所展示的是所分析的指标,所分析的数据到底以何种形式更加友好,更加理解的方式展示给别人看,而不是直接把分析的指标非常枯燥,呆板展示出来,这就是所谓的分析模型,分析模型结合分析指标就可以构成网站分析最终课时化展示的数据,当然还要强调这些模型指标是不断维护发展的过程,所以随着业务不断进行开展,指标越来越多,展示的模型展现的越来越多,这就是网站分析当中常见的分析模型。

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
11天前
|
SQL 关系型数据库 MySQL
MySQL事务日志-Undo Log工作原理分析
事务的持久性是交由Redo Log来保证,原子性则是交由Undo Log来保证。如果事务中的SQL执行到一半出现错误,需要把前面已经执行过的SQL撤销以达到原子性的目的,这个过程也叫做"回滚",所以Undo Log也叫回滚日志。
MySQL事务日志-Undo Log工作原理分析
|
1天前
|
SQL 存储 监控
让跨 project 联查更轻松,SLS StoreView 查询和分析实践
在业务场景中,日志数据可能存储在日志服务 Project 的不同 Logstore/MetricStore 中或不同地域的 Project 中。日志服务的数据集(StoreView)功能支持跨地域、跨 Store 联合查询和分析,让用户基于数据集就能高效便捷地查询分析全地域的数据,真正做到数据分析不受地域边界的限制。
|
18天前
|
存储 运维 监控
Linux--深入理与解linux文件系统与日志文件分析
深入理解 Linux 文件系统和日志文件分析,对于系统管理员和运维工程师来说至关重要。文件系统管理涉及到文件的组织、存储和检索,而日志文件则记录了系统和应用的运行状态,是排查故障和维护系统的重要依据。通过掌握文件系统和日志文件的管理和分析技能,可以有效提升系统的稳定性和安全性。
37 7
|
21天前
|
监控 安全 Linux
启用Linux防火墙日志记录和分析功能
为iptables启用日志记录对于监控进出流量至关重要
|
1月前
|
监控 应用服务中间件 定位技术
要统计Nginx的客户端IP,可以通过分析Nginx的访问日志文件来实现
要统计Nginx的客户端IP,可以通过分析Nginx的访问日志文件来实现
116 3
|
2月前
|
XML 安全 Java
【日志框架整合】Slf4j、Log4j、Log4j2、Logback配置模板
本文介绍了Java日志框架的基本概念和使用方法,重点讨论了SLF4J、Log4j、Logback和Log4j2之间的关系及其性能对比。SLF4J作为一个日志抽象层,允许开发者使用统一的日志接口,而Log4j、Logback和Log4j2则是具体的日志实现框架。Log4j2在性能上优于Logback,推荐在新项目中使用。文章还详细说明了如何在Spring Boot项目中配置Log4j2和Logback,以及如何使用Lombok简化日志记录。最后,提供了一些日志配置的最佳实践,包括滚动日志、统一日志格式和提高日志性能的方法。
621 31
【日志框架整合】Slf4j、Log4j、Log4j2、Logback配置模板
|
1月前
|
监控 安全 Apache
什么是Apache日志?为什么Apache日志分析很重要?
Apache是全球广泛使用的Web服务器软件,支持超过30%的活跃网站。它通过接收和处理HTTP请求,与后端服务器通信,返回响应并记录日志,确保网页请求的快速准确处理。Apache日志分为访问日志和错误日志,对提升用户体验、保障安全及优化性能至关重要。EventLog Analyzer等工具可有效管理和分析这些日志,增强Web服务的安全性和可靠性。
|
3月前
|
XML JSON Java
Logback 与 log4j2 性能对比:谁才是日志框架的性能王者?
【10月更文挑战第5天】在Java开发中,日志框架是不可或缺的工具,它们帮助我们记录系统运行时的信息、警告和错误,对于开发人员来说至关重要。在众多日志框架中,Logback和log4j2以其卓越的性能和丰富的功能脱颖而出,成为开发者们的首选。本文将深入探讨Logback与log4j2在性能方面的对比,通过详细的分析和实例,帮助大家理解两者之间的性能差异,以便在实际项目中做出更明智的选择。
393 3
|
1月前
|
存储 监控 安全
什么是事件日志管理系统?事件日志管理系统有哪些用处?
事件日志管理系统是IT安全的重要工具,用于集中收集、分析和解释来自组织IT基础设施各组件的事件日志,如防火墙、路由器、交换机等,帮助提升网络安全、实现主动威胁检测和促进合规性。系统支持多种日志类型,包括Windows事件日志、Syslog日志和应用程序日志,通过实时监测、告警及可视化分析,为企业提供强大的安全保障。然而,实施过程中也面临数据量大、日志管理和分析复杂等挑战。EventLog Analyzer作为一款高效工具,不仅提供实时监测与告警、可视化分析和报告功能,还支持多种合规性报告,帮助企业克服挑战,提升网络安全水平。
|
3月前
|
存储 缓存 关系型数据库
MySQL事务日志-Redo Log工作原理分析
事务的隔离性和原子性分别通过锁和事务日志实现,而持久性则依赖于事务日志中的`Redo Log`。在MySQL中,`Redo Log`确保已提交事务的数据能持久保存,即使系统崩溃也能通过重做日志恢复数据。其工作原理是记录数据在内存中的更改,待事务提交时写入磁盘。此外,`Redo Log`采用简单的物理日志格式和高效的顺序IO,确保快速提交。通过不同的落盘策略,可在性能和安全性之间做出权衡。
1767 14
MySQL事务日志-Redo Log工作原理分析