【Druid】(五)通过 Imply 快速入门2

简介: 【Druid】(五)通过 Imply 快速入门2


二、离线加载样本数据


如果无法访问公共Web 服务器,则可以从本地文件加载相同的数据集。该quickstart 目录包括一个样本数据集和一个摄取规范来处理数据, 分别命名 wikipedia-2016-06-27-sampled.json 和 wikipedia-index.json。


要为此摄取规范向Druid 提交索引作业,请从Imply 目录运行以下命令:


bin/post-index-task --file quickstart/wikipedia-index.json

成功运行将生成类似于以下内容的日志:


Beginning indexing data for wikipedia
Task started: index_wikipedia_2017-12-05T03:22:28.612Z
Task log:
http://localhost:8090/druid/indexer/v1/task/index_wikipedia_2017-
12-05T03:22:28.612Z/log
Task status:
http://localhost:8090/druid/indexer/v1/task/index_wikipedia_2017-
12-05T03:22:28.612Z/status
Task index_wikipedia_2017-12-05T03:22:28.612Z still running...
Task index_wikipedia_2017-12-05T03:22:28.612Z still running...
Task finished with status: SUCCESS
Completed indexing data for wikipedia. Now loading indexed data onto
the cluster...
wikipedia is 0.0% finished loading...
wikipedia is 0.0% finished loading...
wikipedia is 0.0% finished loading...
wikipedia loading complete! You may now query your data


三、创建数据立方体


通过单击顶部栏上的相应按钮切换到Imply 的“ 可视化”部分。从这里,您可以创建数据立方体来建模数据,浏览这些立方体,并将视图组织到仪表板中。首先单击+创建新数据多维数据集。



在出现的对话框中,确保wikipedia 选中此源并选择自动填充尺寸和度量。单击下一步继续:创建数据立方体。


四、可视化数据立方体


单击“ 保存”后,将自动加载此新数据多维数据集的数据立方体视图。将来,还可以通过从“ 可视化”屏幕单击数据立方体的名称(在此示例中为“Wikipedia”)来加载此视图。





在这里,可以通过过滤并在任何维度上拆分数据集来探索数据集。对于数据的每次过滤拆分,将看到所选度量的总值。


例如,在维基百科数据集上,通过在page 上拆分和按事件数排序查看最常编辑的page)。




数据立方体视图根据分割数据的方式建议不同的可视化。如果拆分字符串列,则数据最初将显示为表格。如果按时间拆分,数据立方体视图将推荐时间序列图,如果在数字列上拆分,则会到条形图。




五、运行SQL


访问SQL 编辑器。


SELECT page, COUNT(*) AS Edits
FROM wikipedia
WHERE "__time" BETWEEN TIMESTAMP '2016-06-27 00:00:00' AND TIMESTAMP
'2016-06-28 00:00:00'
GROUP BY page
ORDER BY Edits
DESC LIMIT 5

应该看到如下结果:


目录
相关文章
|
6月前
|
Java 关系型数据库 MySQL
JDBC简介以及快速入门
JDBC简介以及快速入门
39 0
|
Java 数据库连接 数据库
JDBC快速入门(四)
JDBC快速入门(四)
|
7月前
|
SQL Java 关系型数据库
JDBC快速入门
JDBC快速入门
70 0
|
SQL Java 数据库连接
JDBC快速入门(一)
JDBC快速入门(一)
|
Java 数据库连接 数据库
|
SQL Java 关系型数据库
带你快速入门JDBC
在开发中我们使用的是java语言,那么势必要通过java语言操作数据库中的数据。这就是接下来要学习的JDBC。
142 0
|
druid Java 数据库连接
数据库连接池入门(c3p0、Druid)
数据库连接池入门(c3p0、Druid)
255 1
|
SQL 算法 Java
JDBC最详讲解(快速入门)
JDBC最详讲解(快速入门)
JDBC最详讲解(快速入门)