开发者学堂课程【场景实践-基于阿里云 Quick BI 对 MOOC 网站日志分析:实验操作演示】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/524/detail/7078
实验操作演示
数据集创建完成后可以对其进行编辑,该数据集的编辑页面如下:
注意到左边主要分为两部分,但是都是该表的原始属性,被分为维度和度量。维度一般来说字符串类型或者非数值类型的都会到维度下面,如果是数值类型的、可以度量的会归类到度量的信息下,当然可以也可以将信息进行转换。
对该表的属性进行编辑,例如要将 province (地址的信息,为字符串)转换为地址信息。可以先编辑将其名字改为所在省,然后将切换其维度类型,切换为地理信息中的省/直辖市,此时该属性编辑完成。
isp 为运营商,如果想要查看数据可以点击刷新预览,这时可以从 MaxComputer 中提取一些数据(加载需要一定时间),如下图:
这时可以增加一个新的字段,增加字段的信息(可以对原来大的字段进行简单的编辑)如下图:
表达式内容为:当运营商的字符串包含电信时,就将其赋值为电信,因为有时表面上看是移动或者电信,但是有的字段不是,所以将其改造为如果包含某某字段则归类于某某,否则改为其他。
新的字段添加完成。
继续编辑,access_hour 表示访问时间,将该名字改为访问时间。同理将ref_type 改为搜索引擎,client_type 改为操作系统,client_browser 改为浏览器。之后还可以改度量的信息,例如 id ,将其名称改为访问人次,然后将默认的聚合方式改为计数(统计每一个人的访问人次)。之后如果想将维度的属性转换为度量的属性,可以点击 ip ,然后转换为度量,这时还要改变其默认大的聚合方式为计数。发现该聚合方式的选择与访问人次不同,只有计数和计数(去重),因为 ip 本身是一个字符串类型,只能统计其数量。因为这里并不需要 ip 为度量属性,所以将其转换回维度属性。
到此,数据集整理完成,选择保存,进入下一步骤。
2.仪表板的展示
回到主界面点击仪表板或者返回点击侧栏的仪表板,点击仪表板发现并没有仪表板,所以点击新建仪表板。仪表板的设计页面如下:
上栏有各种各样的图形,如线图、柱状图、组合图、饼图、交叉表、彩色地图等等一系列图。右侧是一些设计页面,比如显示水印。
首先做一个网站的 PV 统计,选择指标看板,此时默认没有任何东西,所以选择数据集,由于只建立了一个数据集,所以就选中该数据集,然后可以看到其维度属性和度量属性。由于这是一个指标看板,只看其指标,所以只显示访问的人次。可以改变该指标看板的名字,点击样式,将默认名字指标看板改为 PV,然后回到数据点击更新,处理完毕后可以看到该网站的 PV ,如下图:
还可以点击线图,点击访问时间(注意,如果是指标看板,就只有一个属性,维度可加可不加,如果加了则会将不同维度下的指标都显示。)
看到线图,度量信息指定访问人次,类别轴指定维度信息为访问时间,所以其会统计各个时间段下面的人的访问数量。点击更新,会计算出一张线图,该线图展示的是一天24小时中每个时间段的访问人次,该线图如下:
同样还可以建一些其他图,比如彩色地图,可以统计其色彩饱和度(颜色变化是度量信息,人越多颜色越深),该度量信息为访问人次。然后访问地理区域(地域维度)选择所在省,然后选择更新,进行匹配得到彩色地图:
如果只想在特定的省份展示,可以选择过滤器(不止该地图有,其他图都有),可以对省份或者其他属性进行过滤。将所在省拖入过滤器,然后点击过滤,设置过滤器。选择按枚举筛选,点击复选,在下拉列表会计算出有哪些维度,可以只选其中
一部分,然后点击确定,如下图:
这时再去更新发现彩色地图上只有刚才勾选的省份,如下图:
上面的演示可能只是实验中的一部分操作,在实验中会有很多的操作,大概会建立十几个展示页面,包括 PV、IP、UV 等等信息。
完成可以点击保存(最好做好一个保存一个,防止丢失),保存需要重新命名,如下图:
点击确定,仪表板保存成功。
保存后还可以进行预览,由于预览的量比较少,效果图如下:
同样还可以对其进行分享。也可以返回对该仪表板进行分享,还有公开操作,如下图:
选择公开后,任何用户点击生成的链接就可以看到该仪表板。
同理,还可以做一个数据门户,一个数据门户是由多个仪表板进行组合的。(多个仪表板最终构成一个数据门户的网站)
三、问题解决思路
不是说通过一些简单的日志分析就能解决面前网站遇到的所以问题,这里更多的是通过日志分析来获取一些问题解决得思路。
1.用户抱怨网站加载内容很慢∶服务器地域调整,网络运营商调整
原因:发现用户访问得一些地域离服务器所在得位置较远,所以考虑可能是地域得关系导致网络得访问延迟,加上用户使用得网络运营商和服务器的访问出口所在的运营商并不一致,所以考虑对网络运营商进行调整。
2.用户抱怨网站样式错乱∶修改网站前端样式,适应用户浏览器
原因:可以通过用户访问的浏览器去知道用户经常使用的浏览器,而针对这些浏览器进行前端样式的调整去适应用户经常访问的浏览器。
3.领导认为课程销量不行︰使用搜索引擎推广
原因:可以看用户搜索引擎的流量来源的占比以及整个用户来源的占比,看到搜索引擎给网站带来的用户实际上很少,所以可以通过搜索引擎的推广以及搜索引擎的一些其他优化来增加用户的访问量,从而增加课程的销量。
4.网站偶尔会发生崩溃∶加强网站程序安全,设置访问黑名单
原因:发现网站崩溃时会有一些 IP 的恶意攻击,所以要修改网站的一些程序漏洞来保障网站的安全,同时还要设置访问黑名单来阻止那些恶意用户对网站进行访问。