网站流量日志分析—分析指标和分析模型—受访、访客分析模型|学习笔记

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 快速学习网站流量日志分析—分析指标和分析模型—受访、访客分析模型

开发者学堂课程【大数据分析之企业级网站流量运营分析系统开发实战(第三阶段) 网站流量日志分析—分析指标和分析模型—受访、访客分析模型】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/695/detail/12211


网站流量日志分析—分析指标和分析模型—受访、访客分析模型


受访这两个字可以理解为受到访问,它所描述的就是网站的页面和域名被用户访问的情况。

打开数据看一下,在数据当中正好有一个字段叫做 request ,z 这个字段所描述的是用户请求网站,请求的是哪一个资源哪一个路径,比如说有的是图片,有的是请求的文本,还有请求斜杆的,通过专业知识解读应该知道背后所反应请求的是网站的首页,因为只有该目录下问页面就是首页。那么这个就是表示用户访问网站的受访情况,可以

image.png

分析好多指标,比如统计昨天访问页面受访页面,看一下昨天的页面有哪几个分别访问多少,这时候可以看一下对比分析,分析2018年1月1号访问网站最多的页面是首页,但是发现1月2号首页下降20%,登录页做了一个上升,注册页做了一个上升,这样再做一个升降榜,这样就可以看到每天的访问页面波动情况。这些指标最终计算出来可能难度不大,根据不同栏目不同的页面进行分组同进,但是构建出来这样的一个升降榜,波动情况又构成了一个受访分析模型。

image.png

如上图,左边就是统计每个页面的情况,比如斜杠代表根目录,具体到下面每个字,当中有当天请求页面数还有升降波动的情况,比如昨天是100今天是800,降了20%,今天升了35%,昨天和今天持平,这样看一眼页面在这一天相对于昨天波动情况,这个就构成第二个受访分析。

接下来最后一个分析是访客分析,主要与用户相关。访客分析分析很多,根据 IP 关联不同地方,对应上的网站息息相关。比如说游戏直播类的网站,直播最重要的是带宽网站的一个访问速度,国内有不同的运营商电信,移动,如果五个省运营商配合的不好,发现访问网站之后非常卡,用户将变低,低了之后不能刷礼物,收入情况降低,所以这个开展分析。再比如说终端情况分析,终端在数据当中有一个字段,叫做 user agent 检测 ua 就是终端信息,这里面可以记录下来访问的网站使用的是什么浏览器,什么版本,什么平台。根据终端就可以解读出来这个用户是怎么来的,当下企业当中访问网站主流的两种情况,要么是 PC 电脑端,要么手机移动端,同样的访问针对不同的终端需要进行不同的优化,以手机来说是分为安卓和苹果手机,同样的 PC 端分为 windows 平台、Mark 平台,对它进行优化。如果发现公司当中90%的人都是通过安卓手机来的,是否对安卓手机进行相关特殊的优化。

接下来是新老访客分析,新访是没有来过,老访是来过,问题在于怎样把新老访客分析计算出来。举个例子,今天通过相关的计算得到一些IP ,今天的访客有 IP1、IP2、IP3,这些访客哪些是新哪些是老,做一个比对,这时候把这两个数据作为一个关联比较判断,当中有的,能查询到就是老访客,没有就是新访客,这样又能构成一个模型进行相关的展示。

image.png

有个图叫做热力图(如上图),这个在全国重大场合都能看到这个图,这个图是不同省份不同地域所在的百分比情况,非常直观便捷,统计出来北京来了50%,上海来了20%,广东来了10%,这些数据计算出来直接给人看肯定会是枯燥无聊的,不能够理解,但是来到热力图,相信只要眼睛不是有问题,颜色越深来的越多,颜色越浅的来的越少,这就是另外一个展示模型。可以发现这里所说的各种模型背后都跟数据展示,数据课时化相关,这些模型所展示的是所分析的指标,所分析的数据到底以何种形式更加友好,更加理解的方式展示给别人看,而不是直接把分析的指标非常枯燥,呆板展示出来,这就是所谓的分析模型,分析模型结合分析指标就可以构成网站分析最终课时化展示的数据,当然还要强调这些模型指标是不断维护发展的过程,所以随着业务不断进行开展,指标越来越多,展示的模型展现的越来越多,这就是网站分析当中常见的分析模型。

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
9天前
|
jenkins 持续交付
jenkins学习笔记之三:使用jenkins共享库实现日志格式化输出
jenkins学习笔记之三:使用jenkins共享库实现日志格式化输出
jenkins学习笔记之三:使用jenkins共享库实现日志格式化输出
|
15天前
|
存储 分布式计算 大数据
【Flume的大数据之旅】探索Flume如何成为大数据分析的得力助手,从日志收集到实时处理一网打尽!
【8月更文挑战第24天】Apache Flume是一款高效可靠的数据收集系统,专为Hadoop环境设计。它能在数据产生端与分析/存储端间搭建桥梁,适用于日志收集、数据集成、实时处理及数据备份等多种场景。通过监控不同来源的日志文件并将数据标准化后传输至Hadoop等平台,Flume支持了性能监控、数据分析等多种需求。此外,它还能与Apache Storm或Flink等实时处理框架集成,实现数据的即时分析。下面展示了一个简单的Flume配置示例,说明如何将日志数据导入HDFS进行存储。总之,Flume凭借其灵活性和强大的集成能力,在大数据处理流程中占据了重要地位。
31 3
|
16天前
|
应用服务中间件 Linux nginx
在Linux中,如何统计ip访问情况?分析 nginx 访问日志?如何找出访问页面数量在前十位的ip?
在Linux中,如何统计ip访问情况?分析 nginx 访问日志?如何找出访问页面数量在前十位的ip?
|
9天前
|
存储 消息中间件 监控
Java日志详解:日志级别,优先级、配置文件、常见日志管理系统ELK、日志收集分析
Java日志详解:日志级别,优先级、配置文件、常见日志管理系统、日志收集分析。日志级别从小到大的关系(优先级从低到高): ALL < TRACE < DEBUG < INFO < WARN < ERROR < FATAL < OFF 低级别的会输出高级别的信息,高级别的不会输出低级别的信息
|
10天前
|
算法 关系型数据库 程序员
第一周算法设计与分析:A : log2(N)
这篇文章介绍了解决算法问题"输入一个数N,输出log2N(向下取整)"的三种编程思路,包括使用对数函数和幂函数的转换方法,以及避免浮点数精度问题的整数逼近方法。
|
13天前
|
Kubernetes Ubuntu Windows
【Azure K8S | AKS】分享从AKS集群的Node中查看日志的方法(/var/log)
【Azure K8S | AKS】分享从AKS集群的Node中查看日志的方法(/var/log)
|
6天前
|
存储 监控 数据可视化
SLS 虽然不是直接使用 OSS 作为底层存储,但它凭借自身独特的存储架构和功能,为用户提供了一种专业、高效的日志服务解决方案。
【9月更文挑战第2天】SLS 虽然不是直接使用 OSS 作为底层存储,但它凭借自身独特的存储架构和功能,为用户提供了一种专业、高效的日志服务解决方案。
34 9
|
14天前
|
开发框架 .NET Docker
【Azure 应用服务】App Service .NET Core项目在Program.cs中自定义添加的logger.LogInformation,部署到App Service上后日志不显示Log Stream中的问题
【Azure 应用服务】App Service .NET Core项目在Program.cs中自定义添加的logger.LogInformation,部署到App Service上后日志不显示Log Stream中的问题
|
18天前
|
存储 监控 安全
|
17天前
|
XML Java Maven
log4j 日志的简单使用
这篇文章介绍了Log4j日志框架的基本使用方法,包括在Maven项目中添加依赖、配置`log4j.properties`文件以及在代码中创建和使用Logger对象进行日志记录,但实际打印结果中日志级别没有颜色显示。
log4j 日志的简单使用
下一篇
DDNS