《Splunk智能运维实战》——2.3 找出最常访问的网页-阿里云开发者社区

开发者社区> 华章出版社> 正文

《Splunk智能运维实战》——2.3 找出最常访问的网页

简介:

本节书摘来自华章计算机《Splunk智能运维实战》一书中的第2章,第2.3节,作者 [美]乔史·戴昆(Josh Diakun),保罗R.约翰逊(Paul R. Johnson),德莱克·默克(Derek Mock),译 宫鑫,康宁,刘法宗 ,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.3 找出最常访问的网页

在第1章导入的数据样本中,其中一个包含了Web服务器的访问日志。这些日志的源类型为access_combined,并且详述了Web应用程序的用户访问的所有页面。我们特别感兴趣哪个页面的浏览次数最多,以便我们了解电子商务Web应用程序的使用情况。它也能帮助我们改进Web应用程序,比如将访问量很少的网页移除,或者重新设计应用程序,使之更高效。

本节将编写一个Splunk搜索语句,来找到给定时间内最常访问的网页。

做好准备

本节操作需运行Splunk Enterprise服务器,导入和第1章相同的样本数据。我们已经很熟悉Splunk的搜索栏和它右侧的时间选择器了。

如何操作

按照下列步骤搜索最常访问的网页。

  1. 登录Splunk服务器。
  2. 选择“搜索和报表”应用程序。
  3. 设定时间选择器为“过去24小时”,在Splunk搜索栏输入下列搜索。然后单击搜索图标或按Enter键。
    screenshot
  4. Splunk返回网页列表,新字段“count”显示了页面浏览的总次数。
    screenshot
  5. 单击“保存为”,选择“报表”,保存此次搜索。将报表命名为cp02_most_accessed_webpages,并单击“保存”。在下一个页面,单击“继续编辑”,回到搜索。

工作原理

将搜索以段的形式分开。
screenshot
screenshot

更多内容

我们可以在这次搜索的基础上得出更多的结果。

搜索访问量排名前10的网页

我们可以修改本节的搜索语句,用top命令代替stats命令。

默认情况下会显示排名前10的网页:
screenshot

这里修改了搜索,并用top命令代替了stats命令。默认情况下会显示排名前10的网页。如若想获得排名前20的网页,可限定limit的值,如下所示:
screenshot

搜索用户最常访问的网页

可以修改本节的搜索语句,并使用stats命令的distinct count (dc)函数来显示用户列表和他们访问的单个网页。
screenshot

distinct count函数能确定一位用户是否多次访问同一个页面,这种情况只算做一次访问。访问最多不同页面的用户将出现在列表顶端,因为使用了降序。

了解stats命令各种函数的更多信息,可登录:http://docs.splunk.com/Documentation/Splunk/latest/SearchReference/ CommonStatsFunctions。

另参见
screenshot

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:

华章出版社

官方博客
官网链接