10分钟玩转Elasticsearch训练营:课时1:基于Kibana Discover筛选数据,自由搜索航班信息并导出CSV报告
基于 Kibana Discover 筛选数据,自由搜索航班信息并导出 CSV 报告
内容介绍
一、实验介绍
二、实验步骤
三、正式讲解
一、 实验介绍
1.实验准备
做实验之前要开通阿里云检索服务 Elastic search 版,可以免费试用1个月(数据节点2核4GB 20GB 3节点,Kibana 2核4GB)
2.重点内容
本实验基于 Kibana Discover 功能来搜索航班信息,例如航班号、航班状态、目的地天气等,并保存搜索和导出搜索结果为 CSV 报告。通过本实验您将掌握 Kibana Discover 的使用方法,帮助您更加快速的筛选和搜索数据,从而提高功能工作效率。
二、实验步骤
1.飞行航班数据介绍
Elasticsearch提供了内置的飞行航班数据
(kibana_sample_data_flights)您可以使用数据集中的索引数据,进行各种图表、图形、地图和其他可视化展示。
2.筛选航班数据进行搜索
Kibana 支持2种方式筛选数据:
(1) 在查询栏下添加筛选
详细步骤:
① 在左侧字段列表中单击 DestWeather 查看该字段的常见值
② 创建一个仅显示目的地天气为多云的航班的过滤器
③ 添加一个显示取消的航班的过滤器
④ 添加一个显示取消的航班的过滤器
⑤ 添加一个航空公司为 Logstash Airways 或 JetBeats 的过滤器
⑥最后,添加一个航班延误时间在1~100分钟之间的过滤器
(2) 在查询栏中使用 KQL(Kibana Query Language)语法筛选
三、正式讲解
1.方法一
(1)添加数据集
首先要开通阿里云的服务,启动 Elasticsearch 集群,在可视化控制这一栏点击公网入口进入到 Kibana 主页
在主页中如果没有数据,点击试用样例数据后点击其他样例数据集,再点击中间的添加数据
这个数据添加后可以在开发工具可以通过 GET_cat/indices 可以看到新的数据集叫做 kibana_sample_data_flights数据
(2)点击进入Discover
下图这个界面最重要的一点是需要在左上角Kibana Sample Data Flights选择数据集,同时在右上角选择时间范围,一般选择过去三十天的数据集
这个数据集数据显示出来都集中在一起,看的不明显,可以选中集中的数据聚集就可以占满几乎整个空间,这是一个非常直接的方法
我们如果要查看数据集可以将左下角选择 Rows per page:50,即可查看数据
(3)在查询点上添加过滤器
①添加第一个过滤器
点击左上角的“+”,选择 Destweather 字段,运算符选择“是”,下面会自动有一个 Cloudy,现在所有数据都是由 Cloudy 组成
②添加第二个过滤器
字段选择 Cancelled ,运算符选择“是”,值选择 true
在很多情况下 Cancelled 是 true 也就是它是被取消的,如果不被取消,可以点击排除结果,结果是380个,是相反的,是没有被取消的。
③ 添加第三个过滤器
字段选择 Carrier,运算符选择“属于”,值选择“Logstash Airways”和“JetBeats”,可以看到它有180个命中,和上面是完全不一样的
④添加第四个过滤器
字段选择 FightDelayMin ,运算符选择“介于”,范围从1到100,数据有13个,显然是变少了
(4)过滤器的优点
可以删除、可以排除、可以禁用,可以在所有应用上固定,可以贯穿所有的可视化,不用的时候可以禁用,需要用时可以重新使用,就不需要再次重建
2.方法二
通过 KQL 的语法,在上面的搜索框中进行搜索,输入 DestWeather:“Cloudy”and not Cancelled:true,数据变成380个命中
输入 DestWeather:“Cloudy”and not Cancelled:true and Carrier:(“Logstash Airways”OR“JetBeats”),会进一步缩小数据
输入 DestWeather:“Cloudy”and not Cancelled:true and Carrier:(“Logstash Airways”OR“JetBeats”)and FightDelayMin>0 and FightDelayMin<=100,有十三个命中,这显然是之前的一个搜索结果,我们可以把它做成一个表格
(1)做成表格
①方法一
点击下面表格的第一个,打开后点击在表中切换列的选项,这一列即可添加进去
在搜索栏中输入 Origin ,点击 OriginCityName 前的在表中切换列,则可以看到下图表格
②方法二
在左边搜索栏输入 Carrier 点击添加,将它添加进去,再输入 FlightDelayMin 将它添加进去
得到这个结果后可以进行保存,点击右上角保存,输入标题为 Delayed fights saved search 1,然后做一些概述,一般把时间存进去,现在关掉后也可以重新打开了
(3) 共享 CSV 的报告
点击共享-CSV报告-生成CSV,点击右下角弹出的链接
变成如下界面,可以点击右下角或者Delayed fights saved search 1后面的下载图标进行下载,下载后点击左下角链接会出现如下的 CSV 表格,13个结果,试验完成。