开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

druid 和 kylin 区别是啥?

druid 和 kylin 区别是啥? 本问题来自阿里云开发者社区的【11大垂直技术领域开发者社群】。 点击这里欢迎加入感兴趣的技术领域群。

展开
收起
黄一刀 2020-01-02 14:25:47 5270 0
1 条回答
写回答
取消 提交回答
  • DRUID 是一个 JAVA 开发的 OLAP 计算以及存储引擎,他对数据是采取全索引大宽表的方式进行保存和处理。他内部本身就包含了 存储和计算能力。 KYLIN 是一个离线的预处理框架,它依赖于 SPARK 或者 YARN 去做计算,然后用 HBASE 里面保存预处理的结果。然后利用预处理结果进行展示。

    DRUID 和 KYLIN 都对 HDFS 有依赖, DRUID 是把 HDFS 当做远程离线存储,但是实际的计算过程中并不使用。 而 KYLIN ,由于它是使用的 HADOOP 技术栈,所以中间计算过程和最后计算结果里面都会用到 HDFS。

    DRUID 还有灵活的预聚合能力,可以利用 HYPERLOGLOG 算法做多维的 UV 聚合。 而 KYLIN 则是使用强大的位图计算,做了精确的 UV 计算能力。

    总结下: druid 是一个带预聚合能力的多维 MLOAP 存储计算引擎, 只依赖 HDFS 做远程存储; KYLIN 是一个离线预聚合计算引擎, 依赖 HADOOP 做计算、HBASE 做结果保存; 官方介绍 druid: https://druid.apache.org/ kylin:http://kylin.apache.org/cn/

    2020-03-15 09:47:30
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关电子书

更多
阿里云分析引擎Spark On 多数据源介绍 立即下载
《基于 Flink 的全新 Pulsar Connector 的设计、开发和使用》 立即下载
Spark介绍及Spark多数据源分析 立即下载