开发者学堂课程【大数据分析之企业级网站流量运营分析系统开发实战(第三阶段): 网站流量日志分析--分析指标和分析模型--复合级指标】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/695/detail/12209
网站流量日志分析--分析指标和分析模型--复合级指标
内容介绍:
一.平均访问频度
二.人均浏览页数(平均访问深度)
三.平均访问时长
四.跳出率
复合级指标就是把一些基础指标做一些相关的组合。这些复合级指标在企业当中有具体的业务含义和需求,对于开发的来说,需要注意的是如何去解读这些复合机指标,把里面的业务,背景弄清楚,并且思考通过计算得出这些复合级指标。接下来介绍四个常见的复合级指标。
一.平均访问频度
第一个指标叫做平均访问频度,看到平均应该就会想到有一个除法操作,只有谁除以谁才可以得到一个平均。平均访问频度指的是平均每个独立访客一天内访问网站的次数或产生的 session 个数。通俗的说,一天之内每个人产生的平均会话数是多少。再直白一些,就是一个人一天来了几次。
所以,要想得到复合指标,需要得到一天内总的会话次数(session)/总的独立访客数。这两个数相除就得到了每个人一天之内人均会话数。而这两个指标指的就是基础指标中的VV和UV,即VV/UV,用VV除以UV就可以得到今天人均产生的会话数。但是这里有一个更专业的说法叫做平均访问频度。
平均访问频度:一天之内人数均会话数
==总的会话次数(session)/总的独立访客数
==VV/UV
二.人均浏览页数(平均访问深度)
第二个复合级指标指的是人均浏览页数,它也有一个专业的说法叫做平均访问深度。深入的意思指的是当去浏览一个网站,或者打开一个页面就走了,浏览的深度就不够深。若浏览了七八个页面,十几个页面,说明在网站逗留的时间比较长,浏览的深度就比较多一点。所以平均访问深度背后所描述的是人均浏览的页数,这个均字又想到了一个除法,要用总的浏览页除以人,就得到了平均访问深度。
平均访问深度:一天之内人均浏览页面数。要想得到这个指标,用总的页面浏览数据/总的独立访客数。今天总的页面浏览数,打开页面就加一,指的就是PV,即等于 PV/UV。会发现它就是一些基础指标的复合,平均访问深度的好处是可以体现出网站对用户的吸引程度,一个吸引力。例如A网站的人均页数是3.2,B网站的人均页数是7.8,意味着一个人只要来到B网站,通常会打开七八个页面,这个网站肯定会有吸引力。如果你的网站人均浏览页数只有一点几,那意味着你的网站吸引力不够好。
但是需要知道,不会出现一个网站的人均浏览页数是零点几,小于一的情况。因为来到一个网站至少会打开一个页面,所以是至少一个PV,那么平均下来这个值至少是等于一。如果今天都来,这个网站都打开一次,那么平均下来平均值也是一,那一定不可能会产生小于一的情况。所以这种规定也从侧面告诉我们,在计算的时候,也可以帮我们去评估计算的指标到底有没有问题,这就是第二个指标人均浏览页数,也可以把它称之为平均访问深度。
平均访问深度:一天之内人均浏览页面数
==总的页面游览数、总的独立访客数
==PV/UV
三.平均访问时长
第三个指标叫做平均访问时长,它所描述的是平均每次访问在网站上停留的时间。要想计算这个指标,需要总的停留时间除以每次会话的次数。
这个指标非常简单,叫做平均访问时长。平均会话时长:平均每次会话停留的时间。需要用总的会话停留时间/会话次数,总的会话时间,需要把每次会话的时间加起来,会话次数就是俗称的 VV,这两个指标相除,就可以得到平均访问时长。平均访问时长也可体现出网站对访客的吸引程度,别人来到这个网站,平均访问时长只有一点几秒钟,打开一下网站就关闭走了,那这个网站是没有任何吸引程度的。若打开另一个网站,在这个页面上至少待个三五分钟,两三百秒,说明这个网站还是很有吸引力的,愿意花时间在这个网站上浏览一些信息。所以说些指标是有用的,它可以帮助我们业务去解读一些情况,体现网站对用户的吸引程度。
平均会话时长:平均每次会话停留的时间
=总的会话停留时间/会话次数(vv)
四.跳出率
第四个复合级指标叫做跳出率,这个指标描述的比较专业,即是指用户到达你的网站上,并在你的网站上仅浏览了一个页面就离开的访问次数与所有访问次数的百分比。若一个人今天来了,并且只浏览了一个页面,这样的人数与总的访问次数的百分比,就是跳出率。例如,进行计算首页的跳出率,需要去找出今天访问网站,第一个要求是访问网站且访问一个页面,这个页面要计算的是首页跳出率,所以该页面要是首页。
这样的访问次数,和总的访问次数的百分比,得出的就是首页的跳出率。即:首页跳出率=访问网站且访问一个页面且该页面是首页/总的访问次数。那么跳出率可以用来衡量网站在某个页面上的浏览情况,也是评价网站性能的重要指标。例如A网站首页跳出率为百分之百,可以解读为今天来到这个公司的用户都只打开一个页面,而页面都是主页,他们打开页面之后再也不往下继续浏览了,这意味着你们公司,你们网站对用户的吸引程度为0。跳出率为零意味着没有一个页面从页面上流失,大家都在这个页面上浏览,继续浏览其他页面,这是一个网站比较好的情况。
因此以上所说的几个复合级指标帮助业务,帮助需求,甚至帮助公司的老板去看待网站经营访问的情况。要做的就是要正确的解读这些指标背后所包含的业务含义,当中有无存在业务歧义,有无存在中文误差,时间范围到底是一天之内,还是一个月之内。每个公司都是不一样的,例如它让我们计算的一周之内的平均访问深度,也是可以计算的。理清沟通好确定出来这些复合极指标的具体含义,再根据这些含义去寻找相关的数据,思考如何通过处理数据把这些指标计算出来,这是作为大数据人员的职业。这就是第二类指标:复合级指标。