大数据-153 Apache Druid 案例从 Kafka 中加载数据并分析（二）-阿里云开发者社区

大数据-153 Apache Druid 案例从 Kafka 中加载数据并分析（二）

2024-10-14 73

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

云原生大数据计算服务 MaxCompute，5000CU*H 100GB 3个月

云原生大数据计算服务MaxCompute，500CU*H 100GB 3个月

简介： 大数据-153 Apache Druid 案例从 Kafka 中加载数据并分析（二）

数据虽然加载了，但是格式不对，我们在右侧选择：JSON：

点击之后，可以看到，（如果你解析不顺利，可以用这个尝试）点击 Add column flattening

如果正常解析，数据应该是这个样子：

继续点击 Next Parse Time：

继续点击 Next Transform：

继续点击 Next Filter：

点击 Next Configuration Schema：

此时点击右侧的：RollUp，会看到数据被聚合成了两条：

聚合结果：

点击 Next Tune：

点击 Next Publish：

点击 Next Edit spec：

点击 Submit 按钮：

数据摄取规范发布后生成Supervisor
Supervisor会启动一个Task，从kafka中摄取数据
需要等待一段时间，Datasource才会创建完毕，选择【Datasources】板块：
点击末尾的三个小圆点，选择 Query With SQL：

会出现如下的界面，我们写入SQL，并运行：

SELECT 
  *
FROM 
  "druid1"

执行结果如下图：

{
  "type":"kafka",
  "spec":{
    "ioConfig":Object{...},
    "tuningConfig":Object{...},
    "dataSchema":Object{...}
  }
}